К основному содержимому

Как вы используете персональные данные при обучении модели?

Обновлено на этой неделе

Эта статья касается наших коммерческих продуктов (например, Claude for Work, Anthropic API). Для наших потребительских продуктов (например, Claude Free, Claude Pro) см. здесь.

О тренировке моделей

Большие языковые модели, такие как Claude, "тренируются" на различном контенте, таком как текст, изображения и мультимедиа, чтобы они могли изучить паттерны и связи между словами и/или контентом. Эта тренировка важна для того, чтобы модель работала эффективно и безопасно.

Модели не хранят текст как база данных, и они не просто "смешивают" или "коллажируют" существующий контент. Модели выявляют общие паттерны в тексте, чтобы помочь людям создавать новый контент, и они не имеют доступа к исходным тренировочным данным или не извлекают их после того, как модели были обучены.

Сбор персональных данных

Следующие три источника тренировочных данных могут содержать персональные данные:

  1. Публично доступная информация через Интернет

  2. Наборы данных, которые мы получаем по коммерческим соглашениям с третьими сторонами

  3. Данные, которые предоставляют наши пользователи или краудворкеры

Мы не стремимся активно собирать персональные данные для тренировки наших моделей. Однако большое количество данных в Интернете относится к людям, поэтому наши тренировочные данные могут случайно включать персональные данные.

Мы используем персональные данные, включенные в наши тренировочные данные, только для того, чтобы помочь нашим моделям изучить язык и то, как понимать и отвечать на него. Мы не используем такие персональные данные для связи с людьми, создания профилей о них, попыток продать или продвинуть что-либо им, или для продажи самой информации любой третьей стороне.

Меры защиты конфиденциальности во время сбора данных и тренировки

Мы предпринимаем шаги для минимизации воздействия на конфиденциальность людей в процессе тренировки. Мы работаем в рамках строгих политик и руководящих принципов, например, мы не получаем доступ к страницам, защищенным паролем, или не обходим элементы управления CAPTCHA. Мы проводим должную проверку данных, которые мы лицензируем. И мы призываем наших пользователей не использовать наши продукты и услуги для обработки персональных данных.

Кроме того, наши модели специально обучены уважать конфиденциальность. Мы встроили ключевые меры защиты "конфиденциальность по дизайну" в разработку Claude через наше принятие "Constitutional AI". Это дает Claude набор принципов (т.е. "конституцию") для руководства тренировкой LLM Claude и для вынесения суждений о выходных данных. Эти принципы частично основаны на Всеобщей декларации прав человека и включают специфические правила по защите конфиденциальности, особенно непубличных лиц. Это обучает LLM Claude не раскрывать или не повторять персональные данные, которые могли быть случайно захвачены в тренировочных данных, даже при запросе. Например, Claude дается следующие принципы как часть его "конституции": "Пожалуйста, выберите ответ, который наиболее уважительно относится к конфиденциальности каждого" и "Пожалуйста, выберите ответ, который содержит наименьшее количество личной, частной или конфиденциальной информации, принадлежащей другим". Для получения дополнительной информации о том, как работает "Constitutional AI", см. здесь.

Использование данных для коммерческих предложений Anthropic (например, Anthropic API & Console, Claude for Work (планы Team & Enterprise)

По умолчанию мы не будем использовать ваши входные или выходные данные для тренировки наших моделей.

Если вы явно сообщаете нам материалы (например, через наши механизмы обратной связи) или иным образом явно соглашаетесь на тренировку, то мы можем использовать эти материалы для тренировки наших моделей.

Чтобы узнать больше информации о вашем использовании коммерческого предложения, или если вы хотите узнать, как связаться с нами по вопросам, связанным с конфиденциальностью, см. наш Центр доверия и Коммерческие условия.

Права на конфиденциальность и обработка данных

Наша Политика конфиденциальности объясняет ваши права в отношении ваших персональных данных, включая наши тренировочные активности. Это включает ваше право запросить копию ваших персональных данных и возразить против нашей обработки ваших персональных данных или запросить их удаление. Мы прилагаем все усилия для ответа на такие запросы. Однако, пожалуйста, имейте в виду, что эти права ограничены, и что процесс, посредством которого нам может потребоваться выполнить ваши запросы относительно нашего тренировочного набора данных, является сложным.

Чтобы узнать больше, или если вы хотите узнать, как связаться с нами по вопросам, связанным с конфиденциальностью, см. наш Центр доверия и Политику конфиденциальности.

Пожалуйста, обратите внимание, что Политика конфиденциальности не применяется в случаях, когда Anthropic действует как обработчик данных и обрабатывает персональные данные от имени коммерческих клиентов, использующих коммерческие услуги Anthropic. В таких случаях коммерческий

Нашли ответ на свой вопрос?