В России представили сервис для защиты данных при работе с искусственным интеллектом

Специалисты Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ разработали инструмент для обезличивания табличных данных. Новое решение даёт возможность компаниям использовать внутреннюю информацию для аналитики и обучения нейросетей, не раскрывая личные данные клиентов, сотрудников или пациентов.
Как сообщили «Газете.Ru» в пресс-службе вуза, одна из ключевых проблем внедрения ИИ в организациях — необходимость работать с реальными массивами данных, которые часто содержат персональные сведения. Их использование связано с рисками утечки конфиденциальной информации и требованиями законодательства.
Разработанный в Вышке сервис автоматически обрабатывает структурированные табличные наборы данных. Система находит персональные сведения, применяет к ним заданные правила обезличивания и формирует специальные отчёты и технические артефакты для контроля качества обработки и дальнейшего аудита.
Ключевая особенность решения — воспроизводимость результатов. При одинаковых исходных данных сервис каждый раз выдаёт идентичный результат обезличивания. Это позволяет исследователям и разработчикам повторять эксперименты, сравнивать эффективность моделей и проводить проверки без обращения к оригинальным персональным данным. По словам создателей, такой подход сохраняет структуру и аналитическую ценность информации, что делает её пригодной для обучения и тестирования ИИ-систем.
Архитектура сервиса предусматривает раздельное хранение изначальных данных и результатов обработки, управление правилами подстановки, контроль пользовательского доступа и проверку целостности информации. Также ведётся специальный реестр замен, позволяющий отслеживать весь процесс обезличивания.
Разработчики подчёркивают, что технологию можно адаптировать для использования в организациях, работающих с чувствительными данными: в образовательных и медицинских учреждениях, промышленных компаниях, финансовых структурах и государственных ведомствах.
Руководитель проекта, начальник отдела прикладных технологических решений Института ИИ и цифровых наук ФКН НИУ ВШЭ Салех Хади отметил: для успешных ИИ-проектов недостаточно просто иметь доступ к информации, необходимо уметь безопасно готовить её так, чтобы сохранялась аналитическая ценность, но не раскрывались персональные данные.
«Наш сервис решает именно эту инженерную задачу: он встраивает обезличивание в управляемый процесс подготовки данных для ИИ», — заключил он.
