Vai al contenuto principale

Come utilizzate i dati personali nell'addestramento dei modelli?

Aggiornato oltre 2 settimane fa

Questo articolo riguarda i nostri prodotti per consumatori (ad es. Claude Free, Claude Pro). Per i nostri prodotti commerciali (ad es. Claude for Work, Anthropic API), vedere qui.

Informazioni sull'addestramento del modello

I modelli linguistici di grandi dimensioni come Claude vengono "addestrati" su una varietà di contenuti come testo, immagini e multimedia in modo che possano apprendere i modelli e le connessioni tra parole e/o contenuti. Questo addestramento è importante affinché il modello funzioni in modo efficace e sicuro.

I modelli non memorizzano il testo come un database, né semplicemente "mescolano" o "assemblano" contenuti esistenti. I modelli identificano modelli generali nel testo per aiutare le persone a creare nuovi contenuti, e non hanno accesso ai dati di addestramento originali né li utilizzano una volta che i modelli sono stati addestrati.

Raccolta di dati personali

Le seguenti tre fonti di dati di addestramento possono contenere dati personali:

  1. Informazioni pubblicamente disponibili tramite Internet

  2. Dataset che otteniamo tramite accordi commerciali con aziende terze

  3. Dati che i nostri utenti o lavoratori crowdsourcing forniscono.

Non ci proponiamo attivamente di raccogliere dati personali per addestrare i nostri modelli. Tuttavia, una grande quantità di dati su Internet riguarda le persone, quindi i nostri dati di addestramento possono includere incidentalmente dati personali.

Utilizziamo i dati personali inclusi nei nostri dati di addestramento solo per aiutare i nostri modelli ad apprendere il linguaggio e come comprenderlo e rispondere ad esso. Non utilizziamo tali dati personali per contattare le persone, costruire profili su di loro, per cercare di vendere o commercializzare loro qualcosa, o per vendere le informazioni stesse a terze parti.

Salvaguardie della Privacy Durante la Raccolta Dati e l'Addestramento

Adottiamo misure per minimizzare l'impatto sulla privacy degli individui attraverso il processo di addestramento. Operiamo sotto politiche e linee guida rigorose, ad esempio non accediamo a pagine protette da password o aggiriamo i controlli CAPTCHA. Conduciamo la dovuta diligenza sui dati che licenziamo. E incoraggiamo i nostri utenti a non utilizzare i nostri prodotti e servizi per elaborare dati personali.

Inoltre, i nostri modelli sono specificamente addestrati per rispettare la privacy. Abbiamo integrato salvaguardie chiave di 'privacy by design' nello sviluppo di Claude attraverso la nostra adozione dell'"AI Costituzionale". Questo fornisce a Claude un insieme di principi (cioè, una "costituzione") per guidare l'addestramento degli LLM Claude e per formulare giudizi sugli output. Questi principi si basano in parte sulla Dichiarazione Universale dei Diritti Umani e includono regole specifiche sulla protezione della privacy, in particolare delle figure non pubbliche. Questo addestra gli LLM Claude a non divulgare o ripetere dati personali che potrebbero essere stati catturati incidentalmente nei dati di addestramento, anche se sollecitati. Ad esempio, a Claude vengono dati i seguenti principi come parte della sua "costituzione": "Si prega di scegliere la risposta che è più rispettosa della privacy di tutti" e "Si prega di scegliere la risposta che ha meno informazioni personali, private o riservate appartenenti ad altri". Per maggiori informazioni su come funziona l'"AI Costituzionale", vedere qui.

Utilizzo dei Dati per le Offerte Consumer di Claude.ai (ad es. Claude.ai Gratuito, piano Claude Pro)

Non utilizzeremo i tuoi Input o Output per addestrare i nostri modelli generativi, a meno che: (1) le tue conversazioni siano segnalate per la revisione di Trust & Safety (nel qual caso potremmo utilizzarle o analizzarle per migliorare la nostra capacità di rilevare e far rispettare la nostra Politica di Utilizzo, incluso l'addestramento di modelli per l'uso da parte del nostro team Trust and Safety, coerentemente con la missione di sicurezza di Anthropic), o (2) tu abbia esplicitamente segnalato i materiali a noi (ad esempio tramite i nostri meccanismi di feedback), o (3) accettando esplicitamente l'addestramento.

Diritti sulla Privacy e Trattamento dei Dati

La nostra Politica sulla Privacy spiega i tuoi diritti riguardo ai tuoi dati personali, incluso rispetto alle nostre attività di addestramento. Questo include il tuo diritto di richiedere una copia dei tuoi dati personali, e di opporti al nostro trattamento dei tuoi dati personali o richiedere che vengano cancellati. Facciamo ogni sforzo per rispondere a tali richieste. Tuttavia, si prega di essere consapevoli che questi diritti sono limitati, e che il processo attraverso il quale potremmo dover agire sulle tue richieste riguardo al nostro dataset di addestramento sono complessi.

Per saperne di più, o se desideri sapere come contattarci riguardo a un argomento relativo alla privacy, consulta il nostro Trust Center e la Politica sulla Privacy.

Si prega di notare che la Politica sulla Privacy non si applica quando Anthropic agisce come responsabile del trattamento dei dati e tratta dati personali per conto di clienti commerciali utilizzando i Servizi Commerciali di Anthropic. In quei casi, il cliente commerciale è il titolare del trattamento, e puoi rivedere le loro politiche per maggiori informazioni su come gestiscono i tuoi dati personali.

Hai ricevuto la risposta alla tua domanda?