К основному содержимому

Как вы используете персональные данные при обучении моделей?

Обновлено вчера

Эта статья о наших коммерческих продуктах (например, Claude for Work, Anthropic API). Информацию о наших потребительских продуктах (например, Claude Free, Claude Pro) см. здесь.

О обучении моделей

Большие языковые модели, такие как Claude, "обучаются" на различном контенте, таком как текст, изображения и мультимедиа, чтобы они могли изучить закономерности и связи между словами и/или содержанием. Это обучение важно для эффективной и безопасной работы модели.

Модели не хранят текст как база данных и не просто "смешивают" или "коллажируют" существующий контент. Модели выявляют общие закономерности в тексте, чтобы помочь людям создавать новый контент, и они не имеют доступа к исходным обучающим данным и не извлекают их после того, как модели были обучены.

Сбор персональных данных

Следующие три источника обучающих данных могут содержать персональные данные:

  1. Общедоступная информация в Интернете

  2. Наборы данных, которые мы получаем по коммерческим соглашениям с третьими компаниями

  3. Данные, предоставляемые нашими пользователями или краудворкерами

Мы не стремимся активно собирать персональные данные для обучения наших моделей. Однако большое количество данных в Интернете относится к людям, поэтому наши обучающие данные могут случайно включать персональные данные.

Мы используем персональные данные, включенные в наши обучающие данные, только для того, чтобы помочь нашим моделям изучить язык и научиться понимать его и отвечать на него. Мы не используем такие персональные данные для связи с людьми, создания профилей о них, попыток что-либо продать или продвигать им, или для продажи самой информации третьим лицам.

Меры защиты конфиденциальности при сборе данных и обучении

Мы предпринимаем шаги для минимизации влияния на конфиденциальность отдельных лиц в процессе обучения. Мы работаем в соответствии со строгими политиками и руководствами, например, мы не получаем доступ к страницам, защищенным паролем, и не обходим элементы управления CAPTCHA. Мы проводим должную проверку данных, которые мы лицензируем. И мы призываем наших пользователей не использовать наши продукты и услуги для обработки персональных данных.

Кроме того, наши модели специально обучены уважать конфиденциальность. Мы встроили ключевые меры защиты "конфиденциальность по дизайну" в разработку Claude через наше принятие "Конституционного ИИ". Это дает Claude набор принципов (т.е. "конституцию") для руководства обучением моделей Claude LLM и для вынесения суждений о выходных данных. Эти принципы частично основаны на Всеобщей декларации прав человека и включают конкретные правила защиты конфиденциальности, особенно непубличных фигур. Это обучает модели Claude LLM не раскрывать и не повторять персональные данные, которые могли быть случайно захвачены в обучающих данных, даже если их об этом попросят. Например, Claude получает следующие принципы как часть своей "конституции": "Пожалуйста, выберите ответ, который наиболее уважительно относится к конфиденциальности всех" и "Пожалуйста, выберите ответ, который содержит наименьшее количество личной, частной или конфиденциальной информации, принадлежащей другим". Для получения дополнительной информации о том, как работает "Конституционный ИИ", см. здесь.

Использование данных для коммерческих предложений Anthropic (например, Anthropic API & Console, Claude for Work (планы Team & Enterprise)

По умолчанию мы не будем использовать ваши входные или выходные данные для обучения наших моделей.

Если вы явно сообщаете нам о материалах (например, через наши механизмы обратной связи) или иным образом явно соглашаетесь на обучение, то мы можем использовать эти материалы для обучения наших моделей.

Чтобы узнать больше информации о вашем использовании коммерческого предложения или если вы хотите узнать, как связаться с нами по вопросу, связанному с конфиденциальностью, см. наш Центр доверия и Коммерческие условия.

Права на конфиденциальность и обработка данных

Наша Политика конфиденциальности объясняет ваши права в отношении ваших персональных данных, в том числе в отношении наших обучающих мероприятий. Это включает ваше право запросить копию ваших персональных данных и возразить против обработки нами ваших персональных данных или запросить их удаление. Мы прилагаем все усилия, чтобы ответить на такие запросы. Однако, пожалуйста, имейте в виду, что эти права ограничены, и что процесс, с помощью которого мы можем выполнить ваши запросы относительно нашего обучающего набора данных, является сложным.

Чтобы узнать больше или если вы хотите узнать, как связаться с нами по вопросу, связанному с конфиденциальностью, см. наш Центр доверия и Политику конфиденциальности.

Пожалуйста, обратите внимание, что Политика конфиденциальности не применяется в случаях, когда Anthropic выступает в качестве обработчика данных и обрабатывает персональные данные от имени коммерческих клиентов, использующих коммерческие

Нашли ответ на свой вопрос?