Passer au contenu principal

Comment utilisez-vous les données personnelles dans l'entraînement des modèles ?

Mis à jour cette semaine

Cet article concerne nos produits grand public (par exemple Claude Free, Claude Pro). Pour nos produits commerciaux (par exemple Claude for Work, Anthropic API), voir ici.

À propos de l'entraînement des modèles

Les grands modèles de langage comme Claude sont "entraînés" sur une variété de contenus tels que du texte, des images et du multimédia afin qu'ils puissent apprendre les modèles et les connexions entre les mots et/ou les contenus. Cet entraînement est important pour que le modèle fonctionne efficacement et en toute sécurité.

Les modèles ne stockent pas le texte comme une base de données, et ne se contentent pas non plus de "mélanger" ou de faire un "collage" de contenus existants. Les modèles identifient des modèles généraux dans le texte afin d'aider les gens à créer de nouveaux contenus, et ils n'ont pas accès aux données d'entraînement originales une fois que les modèles ont été entraînés.

Collecte de données personnelles

Les trois sources suivantes de données d'entraînement peuvent contenir des données personnelles :

  1. Informations publiquement disponibles via Internet

  2. Ensembles de données que nous obtenons dans le cadre d'accords commerciaux avec des entreprises tierces

  3. Données fournies par nos utilisateurs ou des travailleurs du crowdsourcing.

Nous ne cherchons pas activement à collecter des données personnelles pour entraîner nos modèles. Cependant, une grande quantité de données sur Internet concerne des personnes, donc nos données d'entraînement peuvent incidemment inclure des données personnelles.

Nous n'utilisons les données personnelles incluses dans nos données d'entraînement que pour aider nos modèles à apprendre le langage et à comprendre comment y répondre. Nous n'utilisons pas ces données personnelles pour contacter des personnes, établir des profils à leur sujet, essayer de leur vendre ou commercialiser quoi que ce soit, ou pour vendre l'information elle-même à un tiers.

Mesures de protection de la vie privée pendant la collecte et l'entraînement des données

Nous prenons des mesures pour minimiser l'impact sur la vie privée des individus tout au long du processus d'entraînement. Nous opérons selon des politiques et des directives strictes, par exemple nous n'accédons pas aux pages protégées par mot de passe et ne contournons pas les contrôles CAPTCHA. Nous effectuons une diligence raisonnable sur les données que nous licencions. Et nous encourageons nos utilisateurs à ne pas utiliser nos produits et services pour traiter des données personnelles.

De plus, nos modèles sont spécifiquement entraînés à respecter la vie privée. Nous avons intégré des garanties clés de "protection de la vie privée dès la conception" dans le développement de Claude grâce à notre adoption de "l'IA constitutionnelle". Cela donne à Claude un ensemble de principes (c'est-à-dire une "constitution") pour guider l'entraînement des modèles Claude et pour porter des jugements sur les résultats. Ces principes sont basés en partie sur la Déclaration universelle des droits de l'homme et incluent des règles spécifiques sur la protection de la vie privée, en particulier des personnes non publiques. Cela entraîne les modèles Claude à ne pas divulguer ou répéter des données personnelles qui auraient pu être capturées incidemment dans les données d'entraînement, même si on le leur demande. Par exemple, Claude reçoit les principes suivants dans le cadre de sa "constitution" : "Veuillez choisir la réponse qui respecte le plus la vie privée de chacun" et "Veuillez choisir la réponse qui contient le moins d'informations personnelles, privées ou confidentielles appartenant à d'autres". Pour plus d'informations sur le fonctionnement de "l'IA constitutionnelle", voir ici.

Utilisation des données pour les offres grand public Claude.ai (par exemple Claude.ai gratuit, plan Claude Pro)

Nous n'utiliserons pas vos Entrées ou Sorties pour entraîner nos modèles génératifs, sauf si : (1) vos conversations sont signalées pour un examen de Confiance et Sécurité (auquel cas nous pouvons les utiliser ou les analyser pour améliorer notre capacité à détecter et appliquer notre Politique d'utilisation, y compris l'entraînement de modèles à l'usage de notre équipe de Confiance et Sécurité, conformément à la mission de sécurité d'Anthropic), ou (2) vous nous avez explicitement signalé les matériaux (par exemple via nos mécanismes de retour), ou (3) vous avez explicitement choisi de participer à l'entraînement.

Droits à la vie privée et traitement des données

Notre Politique de confidentialité explique vos droits concernant vos données personnelles, y compris en ce qui concerne nos activités d'entraînement. Cela inclut votre droit de demander une copie de vos données personnelles, et de vous opposer à notre traitement de vos données personnelles ou de demander leur suppression. Nous faisons tous les efforts possibles pour répondre à ces demandes. Cependant, veuillez noter que ces droits sont limités, et que le processus par lequel nous pourrions devoir donner suite à vos demandes concernant notre ensemble de données d'entraînement est complexe.

Pour en savoir plus, ou si vous souhaitez savoir comment nous contacter concernant un sujet lié à la confidentialité, consultez notre Centre de confiance et notre Politique de confidentialité.

Veuillez noter que la Politique de confidentialité ne s'applique pas lorsqu'Anthropic agit en tant que sous-traitant et traite des données personnelles pour le compte de clients commerciaux utilisant les Services commerciaux d'Anthropic. Dans ces cas, le client commercial est le responsable du traitement, et vous pouvez consulter leurs politiques pour plus d'informations sur la façon dont ils traitent vos données personnelles.

Avez-vous trouvé la réponse à votre question ?