Написать нам

Нефть и газ

Конфиденциальные ML-вычисления в нефтегазовой сфере

Заказчик

Группа компаний, состоящая из более чем 20 предприятий, занимающихся диагностикой притока и целостности всей системы нефтяных и газовых скважин, от ствола скважины до пласта, что позволяет их клиентам принимать лучшие решения и повышать эффективность активов.

Среди специализаций Заказчика: диагностика через барьер, оценка дебита скважин и пластов, оценка целостности скважин, оценка пласта в масштабах всего месторождения [многослойная, межскважинная], моделирование измерений, нефть и газ, энергетика.

Заказчик вкладывает значительную часть выручки в НИОКР, сотрудничая с университетами и партнёрами для развития диагностики. Они разрабатывают программы, собирают данные, создают инструменты и ПО, интерпретируют данные, что делает их лидером в диагностике через барьеры.

Среди специализаций заказчика:
  • Диагностика сквозь барьеры
  • Оценка дебита скважин и пластов
  • Оценка целостности скважины
  • Оценка пласта месторождения: многослойная, межскважинная
  • Моделирование измерений
  • Нефть, газ и энергетика

Задача

Нефтяные компании тщательно защищают свои данные. Доступ к ним строго контролируется как между конкурентами, так и внутри компании, между разными отделами. Сохранение конфиденциальности таких данных является приоритетом, особенно когда законодательство запрещает вывоз данных за границу.

С другой стороны, компании активно развивают предиктивную диагностику скважин с использованием методов искусственного интеллекта. Явным препятствием на пути развития ML-алгоритмов является нежелание или неспособность владельцев данных делиться своими данными с ML-разработчиками из-за потенциальных угроз, таких как утечки, кражи и незаконное использование.

В данном случае речь идёт об обнаружении песка на объектах добычи и хранения нефти и газа.

В процессе добычи и хранения газа, газового конденсата и нефти операторы по всему миру сталкиваются с проблемой выноса песка из скважин.

Вынос песка вызывает поломки оборудования, снижает эффективность скважин и увеличивает затраты на эксплуатацию.
Эта проблема остро стоит в нефтегазовой отрасли, как на добывающих скважинах, так и в подземных хранилищах нефти и газа.

Решение — это система с ML-моделями для обнаружения выноса песка на объектах добычи и хранения нефти и газа, обученная на больших данных из разных источников.

Для соблюдения конфиденциальности и обучения моделей данные от разных организаций обменивались в зашифрованном виде.

Защита данных была обеспечена на всех этапах, включая обучение и вывод результатов.

Полностью гомоморфное шифрование Guardora

Защита данных на стороне владельца
Передача защищённых данных команде ML
Хранение защищённых данных
Обучение ML-модели на защищённых данных
Анализ качества ML-модели на защищённых данных
Возврат результатов модели в защищённом виде
Снятие защиты и интерпретация полученных результатов владельцем данных
Инференс

Решение

Машинное обучение на зашифрованных данных.

Guardora обеспечила полное обучение ML-модели на зашифрованных данных с последующим выводом на зашифрованных образцах.

Если модель расшифрована, её можно применять на открытых данных с аналогичными характеристиками. Это удобно, когда обучение происходит в облаке, а затем модель используется на своих ресурсах или открытых данных.

Точность = 0.73585
Результат обучения на открытых данных для логистической регрессии с двумя параметрами
Точность FHE = 0.72453
Результат обучения на полностью гомоморфно зашифрованных данных логистической регрессии с двумя параметрами
Вывод зашифрованных данных.

Guardora также обучила модель на открытых данных, а затем адаптировала её для вывода зашифрованных образцов.

Обучающая выборка не содержала секретных данных, но последующая обработка касалась конфиденциальной информации.

Точность = 0.86792
Результат вывода по незашифрованным образцам на классификаторе XGBoost, обученном на открытых данных с двумя параметрами
Точность = 0.84960
Результат вывода зашифрованных образцов FHE на адаптированном классификаторе XGBoost, обученном на открытых данных с двумя параметрами

Результаты

В пилотном проекте приняли участие 4 компании (Заказчик, 2 конечных пользователя и Guardora).
Объём данных по выносу песка для совместного обучения был получен с 11 скважин 2 конечных пользователей.
Геофизические данные оставались в пределах владельцев, передавались только в зашифрованном виде.
Совместная модель формировалась на сервере на основе зашифрованной информации о модели от обоих пользователей.
Точность модели выявления песка выросла с 70% до 85%.
Внесены существенные коррективы в планирование капитального ремонта скважин на 3, 6 и 12 месяцев.
Незапланированные ремонты были сведены к минимуму.
Уменьшилось время простоя скважин перед ремонтом.
Устранено экологическое воздействие от утечек углеводородов.
Экономия и оптимизация затрат благодаря предиктивной аналитике скважин составили около 200 миллионов долларов в год.
Запланированы работы по прогнозированию коррозии скважин.