Zum Hauptinhalt springen

Wie verwenden Sie personenbezogene Daten beim Modelltraining?

Diese Woche aktualisiert

Dieser Artikel behandelt unsere Verbraucherprodukte (z.B. Claude Free, Claude Pro). Für unsere kommerziellen Produkte (z.B. Claude for Work, Anthropic API), siehe hier.

Über das Modelltraining

Große Sprachmodelle wie Claude werden mit einer Vielzahl von Inhalten wie Text, Bildern und Multimedia "trainiert", damit sie die Muster und Verbindungen zwischen Wörtern und/oder Inhalten lernen können. Dieses Training ist wichtig, damit das Modell effektiv und sicher funktioniert.

Modelle speichern Text nicht wie eine Datenbank, noch "vermischen" oder "collagieren" sie einfach bestehende Inhalte. Modelle identifizieren allgemeine Muster in Texten, um Menschen dabei zu helfen, neue Inhalte zu erstellen, und sie haben keinen Zugang zu den ursprünglichen Trainingsdaten oder greifen darauf zu, sobald die Modelle trainiert wurden.

Sammlung personenbezogener Daten

Die folgenden drei Quellen von Trainingsdaten können personenbezogene Daten enthalten:

  1. Öffentlich verfügbare Informationen über das Internet

  2. Datensätze, die wir unter kommerziellen Vereinbarungen mit Drittunternehmen erhalten

  3. Daten, die unsere Nutzer oder Crowd-Worker bereitstellen.

Wir haben nicht aktiv das Ziel, personenbezogene Daten für das Training unserer Modelle zu sammeln. Da jedoch eine große Menge von Daten im Internet sich auf Menschen bezieht, können unsere Trainingsdaten nebenbei personenbezogene Daten enthalten.

Wir verwenden personenbezogene Daten, die in unseren Trainingsdaten enthalten sind, nur dazu, unseren Modellen dabei zu helfen, Sprache zu lernen und zu verstehen, wie sie darauf verstehen und reagieren können. Wir verwenden solche personenbezogenen Daten nicht, um Menschen zu kontaktieren, Profile über sie zu erstellen, um zu versuchen, ihnen etwas zu verkaufen oder zu vermarkten, oder um die Informationen selbst an Dritte zu verkaufen.

Datenschutzschutzmaßnahmen während der Datensammlung und des Trainings

Wir unternehmen Schritte, um die Auswirkungen auf die Privatsphäre von Einzelpersonen durch den Trainingsprozess zu minimieren. Wir arbeiten unter strengen Richtlinien und Leitlinien, zum Beispiel dass wir nicht auf passwortgeschützte Seiten zugreifen oder CAPTCHA-Kontrollen umgehen. Wir führen eine Sorgfaltsprüfung der Daten durch, die wir lizenzieren. Und wir ermutigen unsere Nutzer, unsere Produkte und Dienstleistungen nicht zur Verarbeitung personenbezogener Daten zu verwenden.

Zusätzlich sind unsere Modelle speziell darauf trainiert, die Privatsphäre zu respektieren. Wir haben wichtige "Privacy by Design"-Schutzmaßnahmen in die Entwicklung von Claude durch unsere Anwendung von "Constitutional AI" eingebaut. Dies gibt Claude eine Reihe von Prinzipien (d.h. eine "Verfassung"), um das Training der Claude LLMs zu leiten und Urteile über Ausgaben zu fällen. Diese Prinzipien basieren teilweise auf der Allgemeinen Erklärung der Menschenrechte und enthalten spezifische Regeln zum Schutz der Privatsphäre, insbesondere von nicht-öffentlichen Personen. Dies trainiert die Claude LLMs dazu, personenbezogene Daten, die möglicherweise nebenbei in Trainingsdaten erfasst wurden, nicht preiszugeben oder zu wiederholen, auch wenn dazu aufgefordert wird. Zum Beispiel werden Claude die folgenden Prinzipien als Teil seiner "Verfassung" gegeben: "Bitte wählen Sie die Antwort, die die Privatsphäre aller am meisten respektiert" und "Bitte wählen Sie die Antwort, die die wenigsten persönlichen, privaten oder vertraulichen Informationen anderer enthält". Für weitere Informationen darüber, wie "Constitutional AI" funktioniert, siehe hier.

Datennutzung für Claude.ai Verbraucherangebote (z.B. kostenloses Claude.ai, Claude Pro Plan)

Wir werden Ihre Eingaben oder Ausgaben nicht zum Training unserer generativen Modelle verwenden, es sei denn: (1) Ihre Unterhaltungen werden für eine Trust & Safety-Überprüfung markiert (in diesem Fall können wir sie verwenden oder analysieren, um unsere Fähigkeit zu verbessern, unsere Nutzungsrichtlinie zu erkennen und durchzusetzen, einschließlich des Trainings von Modellen für die Verwendung durch unser Trust and Safety Team, im Einklang mit Anthropics Sicherheitsmission), oder (2) Sie haben uns die Materialien explizit gemeldet (zum Beispiel über unsere Feedback-Mechanismen), oder (3) durch anderweitiges explizites Einverständnis zum Training.

Datenschutzrechte und Datenverarbeitung

Unsere Datenschutzrichtlinie erklärt Ihre Rechte bezüglich Ihrer personenbezogenen Daten, einschließlich in Bezug auf unsere Trainingsaktivitäten. Dies umfasst Ihr Recht, eine Kopie Ihrer personenbezogenen Daten anzufordern und unserer Verarbeitung Ihrer personenbezogenen Daten zu widersprechen oder zu verlangen, dass sie gelöscht werden. Wir unternehmen alle Anstrengungen, um auf solche Anfragen zu antworten. Bitte beachten Sie jedoch, dass diese Rechte begrenzt sind und dass der Prozess, durch den wir möglicherweise Ihre Anfragen bezüglich unseres Trainingsdatensatzes bearbeiten müssen, komplex ist.

Um mehr zu erfahren oder wenn Sie wissen möchten, wie Sie uns bezüglich eines datenschutzbezogenen Themas kontaktieren können, siehe unser Trust Center und unsere Datenschutzrichtlinie.

Bitte beachten Sie, dass die Datenschutzrichtlinie nicht gilt, wenn Anthropic als Datenverarbeiter handelt und personenbezogene Daten im Auftrag von kommerziellen Kunden unter Verwendung von Anthropics kommerziellen Diensten verarbeitet. In diesen Fällen ist der kommerzielle Kunde der Verantwortliche, und Sie können deren Richtlinien für weitere Informationen darüber einsehen, wie sie Ihre personenbezogenen Daten handhaben.

Hat dies deine Frage beantwortet?