MOLL Y/X API

API для защиты персональных данных при работе с ИИ

MOLL Y/X API добавляет между вашей системой и внешней моделью обязательный слой маскировки. Сначала данные обезличиваются внутри контролируемого контура, затем безопасная версия запроса отправляется в LLM, OCR или внешний сервис.

Посмотреть схему работы

100%

обработка в контролируемом контуре

70+

встроенных правил и шаблонов

слоя детекции: NER и regex

сторонних API для самой маскировки

Зачем это нужно

Использовать внешние LLM и AI-сервисы без прямой передачи персональных данных.

Дать ИБ, DPO и продуктовым командам прозрачную схему обработки данных.

Сохранить пользу ИИ в документах, переписке и аналитике без ручной анонимизации.

Что делает API

Сервис принимает запрос, находит чувствительные сущности, заменяет их на маркеры и только после этого отправляет данные дальше. При необходимости ответ можно деанонимизировать по карте меток.

Что остается внутри контура

Один из главных вопросов для ИБ и продуктовых команд: уйдут ли сырые данные во внешний сервис. В модели MOLL Y/X API критичная часть обработки строится так, чтобы исходные материалы не были обязательной частью внешнего запроса.

исходные документы и текст остаются внутри процесса обработки

маскирование выполняется до обращения к внешней LLM или сервису

наружу передается только подготовленная безопасная версия данных

Развертывание и эксплуатация

On-premise для полного контроля и 100% локальной обработки

Docker для быстрого старта и масштабирования

Prometheus-метрики, аудит операций и интеграция с SIEM

Минимальный ориентир: 2 CPU, 4 GB RAM, 10 GB storage

Архитектура

Как работает MOLL Y/X API

Все ключевые проверки выполняются на лету и параллельно: NER, regex-правила, политики контента и контроль выходного ответа.

Входящий запрос

Ваш сервис отправляет текст, документ или сообщение в MOLL Y/X API.

Локальная детекция

NER и regex-правила параллельно находят чувствительные сущности.

Маскирование

Система заменяет данные на маркеры вроде PERSON_1, PASSPORT_1, EMAIL_1, сохраняя структуру текста.

Внешний вызов

Во внешнюю LLM или стороннюю систему уходит уже безопасная версия запроса.

Обратный путь

Ответ можно деанонимизировать по карте меток и вернуть в исходный бизнес-процесс.

Возможности

Что умеет API

Основной метод маскирования строится на замене чувствительных сущностей на уникальные маркеры с сохранением структуры исходного материала.

Контролируемый доступ к внешним LLM

Между вашей системой и внешним ИИ появляется обязательный программный слой маскировки.

Локальная обработка

Критичная часть анонимизации выполняется внутри вашего контура без вызова стороннего API для самой маскировки.

Сохранение смысла и структуры

Текст остается пригодным для модели, аналитики и последующих бизнес-процессов.

Расширяемость под вашу инфраструктуру

Можно добавлять корпоративные справочники, редкие форматы документов и собственные regex-правила.

Поддерживаемые сущности

ФИО и персоналии

Иванов Иван Иванович, И.П. Сидоров, сотрудники, клиенты, представители

Контакты

+7 999 123-45-67, email, адреса, домены, корпоративные ящики

Документы и реквизиты

Паспорт, ИНН, СНИЛС, договоры, номера заявок, банковские реквизиты

Секреты и токены

API keys, JWT, пароли, токены, внутренние идентификаторы

Форматы и способы обработки

Текст и офисные файлы

TXT, DOCX, XLSX, JSON, CSV

Документы и сканы

PDF, PNG, JPG, OCR-распознавание текста

Дополнительные методы

Black box / redaction, редактирование зон на изображениях

Производительность

Скорость обработки и качество распознавания

Для оценки обычно смотрят сразу на две вещи: насколько полно находятся сущности и какую задержку дает слой маскировки относительно ответа LLM.

Latency P95

до 500 ms на маскировку

Дополнительная задержка

порядка 10% от времени LLM

DOCX, 10 страниц

0.8 c маскировка / 1.2 c обработка

PDF, 1 скан

2.5 c маскировка / 3.8 c обработка

Benchmark

Benchmark полезен, но его обычно недостаточно

Для принятия решения обычно смотрят не только на итоговые цифры, но и на схему обработки данных, покрытие сущностей и тест на реальных документах.

методика тестирования и используемые датасеты

перечень сущностей и форматов, которые система закрывает из коробки

проверка на собственных документах, сообщениях или кейсах команды

FAQ

Частые вопросы по API

Для корпоративных команд

Покажите команде не обещание, а управляемый сценарий работы с данными

Подготовим демонстрацию, описание контура, методику тестирования и проверку на ваших данных под конкретный сценарий внедрения.