Zum Hauptinhalt springen

Wie verwenden Sie personenbezogene Daten beim Training von Modellen?

Diese Woche aktualisiert

Dieser Artikel behandelt unsere kommerziellen Produkte (z.B. Claude for Work, Anthropic API). Für Informationen zu unseren Verbraucherprodukten (z.B. Claude Free, Claude Pro), siehe hier.

Über das Modelltraining

Große Sprachmodelle wie Claude werden mit einer Vielzahl von Inhalten wie Text, Bildern und Multimedia "trainiert", damit sie die Muster und Zusammenhänge zwischen Wörtern und/oder Inhalten erlernen können. Dieses Training ist wichtig, damit das Modell effektiv und sicher funktioniert.

Modelle speichern Text nicht wie eine Datenbank und "mischen" oder "collagieren" auch nicht einfach bestehende Inhalte. Modelle identifizieren allgemeine Muster in Texten, um Menschen bei der Erstellung neuer Inhalte zu helfen, und sie haben keinen Zugriff auf die ursprünglichen Trainingsdaten und greifen auch nicht darauf zurück, sobald die Modelle trainiert wurden.

Erhebung personenbezogener Daten

Die folgenden drei Quellen von Trainingsdaten können personenbezogene Daten enthalten:

  1. Öffentlich verfügbare Informationen über das Internet

  2. Datensätze, die wir im Rahmen kommerzieller Vereinbarungen mit Drittunternehmen erhalten

  3. Daten, die unsere Nutzer oder Crowdworker zur Verfügung stellen

Wir sammeln nicht aktiv personenbezogene Daten, um unsere Modelle zu trainieren. Da jedoch eine große Menge der Daten im Internet sich auf Menschen bezieht, können unsere Trainingsdaten zufällig personenbezogene Daten enthalten.

Wir verwenden personenbezogene Daten, die in unseren Trainingsdaten enthalten sind, nur dazu, unseren Modellen beizubringen, wie sie Sprache verstehen und darauf reagieren können. Wir verwenden diese personenbezogenen Daten nicht, um Kontakt mit Personen aufzunehmen, Profile über sie zu erstellen, ihnen etwas zu verkaufen oder zu vermarkten oder die Informationen selbst an Dritte zu verkaufen.

Datenschutzvorkehrungen während der Datenerfassung und des Trainings

Wir ergreifen Maßnahmen, um die Auswirkungen auf die Privatsphäre von Einzelpersonen während des Trainingsprozesses zu minimieren. Wir arbeiten nach strengen Richtlinien und Vorgaben, zum Beispiel, dass wir keine passwortgeschützten Seiten aufrufen oder CAPTCHA-Kontrollen umgehen. Wir führen eine Sorgfaltsprüfung der Daten durch, die wir lizenzieren. Und wir ermutigen unsere Nutzer, unsere Produkte und Dienstleistungen nicht zur Verarbeitung personenbezogener Daten zu verwenden.

Darüber hinaus werden unsere Modelle speziell darauf trainiert, die Privatsphäre zu respektieren. Wir haben wichtige 'Privacy by Design'-Schutzmaßnahmen in die Entwicklung von Claude eingebaut, indem wir "Constitutional AI" einsetzen. Dies gibt Claude eine Reihe von Prinzipien (d.h. eine "Verfassung"), die das Training der Claude LLMs leiten und Entscheidungen über Ausgaben treffen. Diese Prinzipien basieren zum Teil auf der Allgemeinen Erklärung der Menschenrechte und beinhalten spezifische Regeln zum Schutz der Privatsphäre, insbesondere von Personen, die nicht im öffentlichen Leben stehen. Dies trainiert die Claude LLMs darauf, keine personenbezogenen Daten preiszugeben oder zu wiederholen, die möglicherweise zufällig in Trainingsdaten erfasst wurden, selbst wenn sie dazu aufgefordert werden. Zum Beispiel werden Claude als Teil seiner "Verfassung" folgende Prinzipien vorgegeben: "Bitte wähle die Antwort, die die Privatsphäre aller am meisten respektiert" und "Bitte wähle die Antwort, die am wenigsten persönliche, private oder vertrauliche Informationen anderer enthält". Weitere Informationen zur Funktionsweise von "Constitutional AI" finden Sie hier.

Datennutzung für kommerzielle Angebote von Anthropic (z.B. Anthropic API & Console, Claude for Work (Team & Enterprise-Pläne)

Standardmäßig verwenden wir Ihre Eingaben oder Ausgaben nicht zum Training unserer Modelle.

Wenn Sie uns ausdrücklich Materialien melden (zum Beispiel über unsere Feedback-Mechanismen) oder anderweitig ausdrücklich dem Training zustimmen, können wir diese Materialien zum Training unserer Modelle verwenden.

Um weitere Informationen über Ihre Nutzung eines kommerziellen Angebots zu erhalten oder wenn Sie wissen möchten, wie Sie uns bezüglich eines datenschutzrelevanten Themas kontaktieren können, besuchen Sie unser Trust Center und unsere Geschäftsbedingungen.

Datenschutzrechte und Datenverarbeitung

Unsere Datenschutzrichtlinie erläutert Ihre Rechte in Bezug auf Ihre personenbezogenen Daten, auch im Hinblick auf unsere Trainingsaktivitäten. Dazu gehört Ihr Recht, eine Kopie Ihrer personenbezogenen Daten anzufordern und der Verarbeitung Ihrer personenbezogenen Daten zu widersprechen oder deren Löschung zu verlangen. Wir bemühen uns, auf solche Anfragen zu reagieren. Bitte beachten Sie jedoch, dass diese Rechte eingeschränkt sind und dass der Prozess, mit dem wir Ihre Anfragen in Bezug auf unseren Trainingsdatensatz bearbeiten müssen, komplex sein kann.

Um mehr zu erfahren oder wenn Sie wissen möchten, wie Sie uns bezüglich eines datenschutzrelevanten Themas kontaktieren können, besuchen Sie unser Trust Center und unsere Datenschutzrichtlinie.

Bitte beachten Sie, dass die Datenschutzrichtlinie nicht gilt, wenn Anthropic als Datenverarbeiter agiert und personenbezogene Daten im Auftrag von kommerziellen Kunden verarbeitet, die die kommerziellen Dienste von Anthropic nutzen. In diesen Fällen ist der kommerzielle Kunde der Verantwortliche, und Sie können deren Richtlinien einsehen, um weitere Informationen darüber zu erhalten, wie sie mit Ihren personenbezogenen Daten umgehen.

Hat dies deine Frage beantwortet?