Ir para conteúdo principal

Como você usa dados pessoais no treinamento de modelos?

Atualizado ontem

Este artigo é sobre nossos produtos comerciais (por exemplo, Claude for Work, API da Anthropic). Para nossos produtos de consumo (por exemplo, Claude Free, Claude Pro), veja aqui.

Sobre o treinamento de modelos

Grandes modelos de linguagem como o Claude são "treinados" em uma variedade de conteúdos, como texto, imagens e multimídia, para que possam aprender os padrões e conexões entre palavras e/ou conteúdos. Esse treinamento é importante para que o modelo funcione de forma eficaz e segura.

Os modelos não armazenam texto como um banco de dados, nem simplesmente "misturam" ou fazem uma "colagem" de conteúdo existente. Os modelos identificam padrões gerais no texto para ajudar as pessoas a criar novo conteúdo, e não têm acesso ou extraem dos dados de treinamento originais uma vez que os modelos foram treinados.

Coleta de dados pessoais

As três seguintes fontes de dados de treinamento podem conter dados pessoais:

  1. Informações publicamente disponíveis via Internet

  2. Conjuntos de dados que obtemos por meio de acordos comerciais com empresas terceiras

  3. Dados fornecidos por nossos usuários ou trabalhadores crowdsource

Não nos propomos ativamente a coletar dados pessoais para treinar nossos modelos. No entanto, uma grande quantidade de dados na Internet se refere a pessoas, então nossos dados de treinamento podem incidentalmente incluir dados pessoais.

Usamos dados pessoais incluídos em nossos dados de treinamento apenas para ajudar nossos modelos a aprender sobre linguagem e como entendê-la e respondê-la. Não usamos esses dados pessoais para contatar pessoas, criar perfis sobre elas, tentar vender ou comercializar algo para elas, ou vender a informação em si para terceiros.

Salvaguardas de Privacidade Durante a Coleta de Dados e Treinamento

Tomamos medidas para minimizar o impacto na privacidade dos indivíduos durante o processo de treinamento. Operamos sob políticas e diretrizes rigorosas, por exemplo, não acessamos páginas protegidas por senha ou contornamos controles CAPTCHA. Realizamos due diligence nos dados que licenciamos. E incentivamos nossos usuários a não usar nossos produtos e serviços para processar dados pessoais.

Além disso, nossos modelos são especificamente treinados para respeitar a privacidade. Incorporamos salvaguardas fundamentais de 'privacidade por design' no desenvolvimento do Claude através da nossa adoção de "IA Constitucional". Isso dá ao Claude um conjunto de princípios (ou seja, uma "constituição") para orientar o treinamento dos LLMs do Claude e fazer julgamentos sobre as saídas. Esses princípios são baseados em parte na Declaração Universal dos Direitos Humanos e incluem regras específicas sobre a proteção da privacidade, particularmente de figuras não públicas. Isso treina os LLMs do Claude a não divulgar ou repetir dados pessoais que possam ter sido capturados incidentalmente nos dados de treinamento, mesmo se solicitados. Por exemplo, o Claude recebe os seguintes princípios como parte de sua "constituição": "Por favor, escolha a resposta que seja mais respeitosa com a privacidade de todos" e "Por favor, escolha a resposta que contenha menos informações pessoais, privadas ou confidenciais pertencentes a outros". Para mais informações sobre como a "IA Constitucional" funciona, veja aqui.

Uso de dados para Ofertas Comerciais da Anthropic (por exemplo, API e Console da Anthropic, Claude for Work (planos Team e Enterprise)

Por padrão, não usaremos suas Entradas ou Saídas para treinar nossos modelos.

Se você explicitamente nos reportar materiais (por exemplo, através de nossos mecanismos de feedback), ou de outra forma optar explicitamente pelo treinamento, então poderemos usar esses materiais para treinar nossos modelos.

Para obter mais informações sobre o uso de uma oferta comercial, ou se você quiser saber como nos contatar sobre um tópico relacionado à privacidade, consulte nosso Centro de Confiança e Termos Comerciais.

Direitos de Privacidade e Processamento de Dados

Nossa Política de Privacidade explica seus direitos em relação aos seus dados pessoais, inclusive no que diz respeito às nossas atividades de treinamento. Isso inclui seu direito de solicitar uma cópia de seus dados pessoais e de se opor ao nosso processamento de seus dados pessoais ou solicitar que sejam excluídos. Fazemos todos os esforços para responder a tais solicitações. No entanto, esteja ciente de que esses direitos são limitados e que o processo pelo qual podemos precisar atender às suas solicitações em relação ao nosso conjunto de dados de treinamento é complexo.

Para saber mais, ou se você quiser saber como nos contatar sobre um tópico relacionado à privacidade, consulte nosso Centro de Confiança e Política de Privacidade.

Observe que a Política de Privacidade não se aplica quando a Anthropic atua como processadora de dados e processa dados pessoais em nome de clientes comerciais que usam os Serviços Comerciais da Anthropic. Nesses casos, o cliente comercial é o controlador, e você pode revisar suas políticas para obter mais informações sobre como eles lidam com seus dados pessoais.

Isto respondeu à sua pergunta?