Требование о локализации персональных данных
При оценке вендоров языковых моделей необходимо оценить не только то, насколько сам вендор должен и будет исполнять требования о локализации персональных данных, но и то, насколько данное требование будет соблюдаться при реализации технологического решения самой компанией.В соответствии с ч. 5 ст. 18 ФЗ «О персональных данных» при сборе персональных данных, в том числе посредством сети «Интернет», оператор обязан обеспечить запись, систематизацию, накопление, хранение, уточнение (обновление, изменение), извлечение персональных данных граждан Российской Федерации с использованием баз данных, находящихся на территории Российской Федерации. По сути, требование о локализации устанавливает, что первичная база данных должна быть создана в России в момент сбора персональных данных граждан Российской Федерации.
Это означает, что, например, иностранные вендоры, которые осуществляют свою деятельность в России (то есть осуществляют сбор персональных данных граждан Российской Федерации), обязаны выполнять требования о локализации. Если они не выполняют данные требования, то они могут быть заблокированы на территории России. Следовательно, необходимо учитывать данный фактов при работе с иностранными вендорами.
Меры по обеспечению безопасности персональных данных при их обработке
В соответствии с ч. 1 ст. 19 ФЗ «О персональных данных» оператор при обработке персональных данных обязан принимать необходимые правовые, организационные и технические меры или обеспечивать их принятие для защиты персональных данных от неправомерного или случайного доступа к ним, уничтожения, изменения, блокирования, копирования, предоставления, распространения персональных данных, а также от иных неправомерных действий в отношении персональных данных.Как отметил EDPS, при работе с большими языковыми моделями набор мер по обеспечению безопасности персональных данных также должен быть адаптирован сообразно угрозам безопасности (см. стр. 23). Это означает, что помимо стандартных мер необходимо также реализовать меры, которые специфически направлены на минимизацию рисков, связанных с использованием именно больших языковых моделей. Например, меры против атак инверсии (атаки, при которых злоумышленник пытается восстановить исходные входные данные или конфиденциальную информацию, использующуюся для тренировки модели, исходя из доступа к выходным данным), манипуляция промптами (prompt injection) (действия, при которой злоумышленник манипулирует входными данными или запросами, чтобы изменить поведение модели или заставить ее генерировать нежелательные или вредоносные выходные данные). В этой связи также рекомендуется осуществлять постоянный мониторинг используемых датасэтов, осуществлять постоянное обучение сотрудников относительно управления рисками безопасности при использовании языковых моделей.