FL Гид

Guardora VFL

позволяет повысить точность ML-моделей

Guardora VFL поддерживает обучение нескольких архитектур моделей:

Архитектурная диаграмма
Градиентный бустинг на решающих деревьях
Графический компонент
Логистическая регрессия

Продукт Guardora VFL на основе технологии федеративного обучения позволяет повысить точность ML-моделей за счет их обучения на ранее недоступных данных внешних компаний таким образом, что данные не покидают защищенного контура владельца данных.

В результате компания, использующая Guardora VFL, получает дополнительную выручку за счет применения в своей деятельности моделей с большей предсказательной силой.

Продукт ориентирован на работу с табличными данными.

Ознакомьтесь с документацией к Guardora VFL API.

Форматы поставки

Приватное облако в Яндекс Маркетплейс или on-premise лицензия

Yandex Cloud Marketplace

Быстрый старт для организаций с данными в Яндекс Облаке. Масштабируемое и удобное управление между пользователями

Цена

Лицензирование + стоимость ресурсов Яндекс

Инсталляция

Приватное облако с полным контролем данных у клиента

Масштабируемость

Легко масштабируется в рамках облачной инфраструктуры

Инфраструктурная безопасность

Обеспечивается штатными средствамиот Яндекс Облака

Контроль

В рамках облачного ресурса без доступа третьих лиц к данным

Поддержка

Гибкость в обновлении, поднятии новых инстансов через сервисы Яндекс Облака

On-premise

Вариант для организаций, которые не взаимодействуют с Яндекс Облаком и хотят иметь больше контроля при взаимодействии с данными

Цена

Лицензирование + стоимость внутренних ресурсов на интеграцию и поддержку

Инсталляция

Интеграция во внутреннюю инфраструктуру заказчика

Масштабируемость

В рамках внутренней инфраструктуры клиента

Инфраструктурная безопасность

Организация сама выстраивает необходимый уровень безопасности

Контроль

Полный контроль в рамках периметра за данными и процессами

Поддержка

Заказчик сам выполняет обновления 
из репозиториев и необходимые работы

Типовая логическая архитектура решения

Синхронизация датасетов (Private Set Intersection, PSI), обучение, валидация, инференс (с гомоморфным шифрованием)

Синхронизация датасетов (Private Set Intersection, PSI), обучение, валидация, инференс (с гомоморфным шифрованием)

Способ получения таблицы данных (например, csv-файл, sql-соединение к БД). Реализуется клиентом.

Гомоморфное шифрование.

Способ получения таблицы данных (например, csv-файл, sql-соединение к БД). Реализуется клиентом.

Требуется для высоконагруженного инференса >300 RPS

Требуется для высоконагруженного инференса >300 RPS

Синхронизация датасетов (Private Set Intersection, PSI), обучение, валидация, инференс (с гомоморфным шифрованием)

Синхронизация датасетов (Private Set Intersection, PSI), обучение, валидация, инференс (с гомоморфным шифрованием)

Способ получения таблицы данных (например, csv-файл, sql-соединение к БД). Реализуется клиентом.

Способ получения таблицы данных (например, csv-файл, sql-соединение к БД). Реализуется клиентом.

Гомоморфное шифрование.

Требуется для высоконагруженного инференса >300 RPS.

Требуется для высоконагруженного инференса >300 RPS.

Основные кейсы применения Guardora VFL

Обучение скоринговых и антифрод моделей
с использованием данных третьих сторон

Интересанты
Бюро кредитных историй, скоринг-провайдеры, банки, страховые компании, МФО, платежные системы, телекомы

Создание несколькими компаниями новых совместных ML-продуктов, предполагающих объединение данных компаний-разработчиков

Интересанты
скоринг-провайдеры

Разблокирование использования данных компаний в рамках одной группы для совместного обучения ML-моделей

Интересанты
финтех компании в рамках группы компаний

Упрощение организации и проведения пилотных проектов, предусматривающих проведение ретро-тестов на конфиденциальных данных потенциального клиента

Интересанты
B2B Saas компании, клиенты которых обрабатывают персональные данные

Лицензирование Guardora VFL

Guardora VFL позволяет обучать ML-модели на данных нескольких компаний, сохраняя при этом конфиденциальность данных каждой из них. На примере модели расчета кредитного скоринга это значит, что:

  • 01/ Модель получает больше разнообразных данных, что способствует лучшей обобщающей способности
  • 02/ При этом каждая компания сохраняет контроль над своими данными
  • 03/ В итоге увеличение точности модели (например, на 1% в GINI) отражается на более точной оценке рисков

При улучшении GINI скоринговой модели компания-клиент получает дополнительную выручку благодаря более точной сегментации клиентов, снижению дефолтов и оптимизации кредитных решений.

На основе описанного эффекта Guardora предлагает транзакционную модель лицензирования с постоплатой со следующими параметрами:

  • 01/ Ежемесячный лицензионный платеж по количеству обращений (полученных предсказаний федеративно обученной модели)
  • 02/ Чем больше обращений, тем меньше стоимость одного обращения
  • 03/ Стоимость технической поддержки включена в лицензионный платеж

Пример для различных сегментов бизнеса

Что такое Guardora VFL?
Guardora VFL — коммерческая платформа вертикального федеративного обучения для двусторонних сценариев в регулируемых отраслях. Позволяет двум организациям — обычно банку/страховой с целевыми метками и аналитическому или дата-вендору с дополняющими признаками — совместно обучать табличную ML-модель без передачи сырых данных и разметки между периметрами. Каждая сторона разворачивает Guardora VFL внутри своей инфраструктуры; платформа реализует безопасное сопоставление идентификаторов (Private Set Intersection), федеративное обучение, опциональное шифрование градиентов (Paillier 1024 бита) и инференс.
Какие ML-модели поддерживает Guardora VFL?
Guardora VFL создан для табличных (структурированных) данных. Сейчас поддерживаются: градиентный бустинг на решающих деревьях (GBDT) — включая XGBoost-совместимые воркфлоу — и логистическая регрессия. Они закрывают большинство продуктовых ML-задач в банках, страховых, телекоме и финтехе (кредитный скоринг, антифрод, прогноз оттока, сегментация клиентов, оценка рисков андеррайтинга). GBDT — рабочая лошадка: проверено на 78K + 97K записей банк+страховая (точность с 0.817 до 0.975) и на 300K записях скоринга (ROC AUC ≈ 71.3, обучение менее 9 минут).
Как развёртывается Guardora VFL?
Guardora VFL поставляется в двух форматах. Yandex Cloud Marketplace — приватное облако в Яндексе для быстрого старта, лицензирование + стоимость ресурсов Яндекс Облака; масштабируется в облачной инфраструктуре. On-premise — для организаций, не использующих Яндекс Облако и предпочитающих полный контроль; лицензирование + стоимость внутренних ресурсов на интеграцию; масштабируется в рамках внутренней инфраструктуры клиента. В обоих случаях коммуникация между сторонами — через шифрованный gRPC. Документация REST API доступна на https://apidoc.guardora.ru.
Что значит модель ценообразования — Pay-As-You-Infer?
Guardora VFL использует транзакционную модель Pay-As-You-Infer с постоплатой. Ежемесячный платёж рассчитывается по количеству полезных запросов на инференс (полученных предсказаний от федеративно обученной модели) — не по времени обучения и не по числу мест. Чем больше запросов, тем ниже стоимость одного запроса. Техническая поддержка включена в лицензионный платёж. Стоимость лицензии «на вход» отсутствует; до коммерческого контракта доступны пилоты и демо. Финальная цена обсуждается на discovery-звонке через форму обратной связи.
Кто использует Guardora VFL (кто её типичные клиенты)?
Четыре архетипа клиентов.
Бюро кредитных историй, скоринг-провайдеры, банки, МФО, страховые компании, платёжные системы, телеком-операторы — для скоринга и антифрод-моделей на данных партнёров.
Скоринг-провайдеры и финтех-компании — для создания новых совместных ML-продуктов, объединяющих признаки нескольких компаний.
Финтех-холдинги и группы компаний (включая трансграничные) — для разблокировки совместного обучения между юридически разделёнными подразделениями.
B2B SaaS-компании, обрабатывающие персональные данные — для ретро-тестов на данных потенциальных клиентов в пилотах без риска утечки.
Какова производительность Guardora VFL?
Производительность инференса масштабируется с развёртыванием. Стандартный инференс — выше 100 RPS на коммодити-железе; GPU-конфигурации превышают 300 RPS (схема архитектуры на странице явно отмечает этот порог для высоконагруженных сценариев). На бенчмарке кредитного скоринга многопоточный инференс достиг 650 запросов в секунду — около 0,008 сек на запрос, сопоставимо со стандартным (не федеративным) XGBoost. Время обучения зависит от режима шифрования: GBDT на 300 000 записях — менее 9 минут без шифрования, около 1,4 часа с Paillier на 50 000 записях.
Включена ли техподдержка в стоимость?
Да. Техническая поддержка включена в ежемесячный лицензионный платёж Pay-As-You-Infer — отдельного контракта на поддержку нет. Инженерная команда Guardora помогает с развёртыванием, интеграцией в существующие ML-пайплайны, тюнингом производительности и реакцией на инциденты. Для on-premise развёртываний уровень операционной поддержки согласовывается в коммерческом контракте.
Как попробовать Guardora VFL?
Существует несколько путей.
Guardora VFL демо в облаке — версия в immers.cloud для тестирования через браузер (https://guardora.ru/product/guardora-vfl-demo-v-oblake/).
Guardora VFL демо для PC — проект на GitHub для ML-специалистов, лёгкий запуск через Python (https://guardora.ru/product/demo-guardora-vfl/).
Veils демо — отдельное демо инструмента функционального преобразования.
Форма на странице — для discovery-звонка, обсуждения конкретного use case, пилота на ваших данных и коммерческого предложения.

Напишите нам

Чтобы протестировать демо версию продукта и узнать ценовые условия, заполните форму и мы свяжемся с вами