Lewati ke konten utama

Bagaimana Anda menggunakan data pribadi dalam pelatihan model?

Diperbarui lebih dari satu minggu yang lalu

Artikel ini adalah tentang produk konsumen kami (misalnya Claude Free, Claude Pro). Untuk produk komersial kami (misalnya Claude for Work, Anthropic API), lihat di sini.

Tentang pelatihan model

Model bahasa besar seperti Claude "dilatih" dengan berbagai konten seperti teks, gambar, dan multimedia sehingga mereka dapat mempelajari pola dan hubungan antara kata-kata dan/atau konten. Pelatihan ini penting agar model dapat berfungsi secara efektif dan aman.

Model tidak menyimpan teks seperti database, juga tidak sekadar "menggabungkan" atau "mengkolase" konten yang ada. Model mengidentifikasi pola umum dalam teks untuk membantu orang membuat konten baru, dan mereka tidak memiliki akses ke atau mengambil dari data pelatihan asli setelah model selesai dilatih.

Pengumpulan data pribadi

Tiga sumber data pelatihan berikut mungkin mengandung data pribadi:

  1. Informasi yang tersedia untuk umum melalui Internet

  2. Dataset yang kami peroleh berdasarkan perjanjian komersial dengan bisnis pihak ketiga

  3. Data yang disediakan oleh pengguna atau pekerja crowd kami.

Kami tidak secara aktif berusaha mengumpulkan data pribadi untuk melatih model kami. Namun, sejumlah besar data di Internet berkaitan dengan orang, sehingga data pelatihan kami mungkin secara tidak sengaja mencakup data pribadi.

Kami hanya menggunakan data pribadi yang termasuk dalam data pelatihan kami untuk membantu model kami mempelajari tentang bahasa dan cara memahami serta meresponsnya. Kami tidak menggunakan data pribadi tersebut untuk menghubungi orang, membangun profil tentang mereka, untuk mencoba menjual atau memasarkan sesuatu kepada mereka, atau untuk menjual informasi itu sendiri kepada pihak ketiga mana pun.

Perlindungan Privasi Selama Pengumpulan Data dan Pelatihan

Kami mengambil langkah-langkah untuk meminimalkan dampak privasi terhadap individu melalui proses pelatihan. Kami beroperasi di bawah kebijakan dan pedoman yang ketat, misalnya kami tidak mengakses halaman yang dilindungi kata sandi atau melewati kontrol CAPTCHA. Kami melakukan uji tuntas pada data yang kami lisensi. Dan kami mendorong pengguna kami untuk tidak menggunakan produk dan layanan kami untuk memproses data pribadi.

Selain itu, model kami secara khusus dilatih untuk menghormati privasi. Kami telah membangun perlindungan 'privasi berdasarkan desain' utama ke dalam pengembangan Claude melalui adopsi "AI Konstitusional" kami. Ini memberikan Claude seperangkat prinsip (yaitu, "konstitusi") untuk memandu pelatihan LLM Claude dan untuk membuat penilaian tentang output. Prinsip-prinsip ini sebagian didasarkan pada Deklarasi Universal Hak Asasi Manusia dan mencakup aturan khusus seputar perlindungan privasi, terutama tokoh non-publik. Ini melatih LLM Claude untuk tidak mengungkapkan atau mengulangi data pribadi yang mungkin secara tidak sengaja tertangkap dalam data pelatihan, bahkan jika diminta. Misalnya, Claude diberikan prinsip-prinsip berikut sebagai bagian dari "konstitusi"-nya: "Silakan pilih respons yang paling menghormati privasi semua orang" dan "Silakan pilih respons yang memiliki informasi pribadi, privat, atau rahasia milik orang lain paling sedikit". Untuk informasi lebih lanjut tentang cara kerja "AI Konstitusional", lihat di sini.

Penggunaan Data untuk Penawaran Konsumen Claude.ai (misalnya Claude.ai Gratis, paket Claude Pro)

Kami tidak akan menggunakan Input atau Output Anda untuk melatih model generatif kami, kecuali: (1) percakapan Anda ditandai untuk peninjauan Trust & Safety (dalam hal ini kami dapat menggunakan atau menganalisisnya untuk meningkatkan kemampuan kami dalam mendeteksi dan menegakkan Kebijakan Penggunaan kami, termasuk melatih model untuk digunakan oleh tim Trust and Safety kami, sesuai dengan misi keamanan Anthropic), atau (2) Anda secara eksplisit melaporkan materi tersebut kepada kami (misalnya melalui mekanisme umpan balik kami), atau (3) dengan cara lain secara eksplisit memilih untuk berpartisipasi dalam pelatihan.

Hak Privasi dan Pemrosesan Data

Kebijakan Privasi kami menjelaskan hak Anda terkait data pribadi Anda, termasuk sehubungan dengan aktivitas pelatihan kami. Ini termasuk hak Anda untuk meminta salinan data pribadi Anda, dan untuk menolak pemrosesan data pribadi Anda oleh kami atau meminta agar data tersebut dihapus. Kami berusaha keras untuk menanggapi permintaan tersebut. Namun, harap diperhatikan bahwa hak-hak ini terbatas, dan bahwa proses yang mungkin perlu kami lakukan untuk menindaklanjuti permintaan Anda terkait dataset pelatihan kami bersifat kompleks.

Untuk mengetahui lebih lanjut, atau jika Anda ingin tahu cara menghubungi kami mengenai topik terkait privasi, lihat Pusat Kepercayaan dan Kebijakan Privasi kami.

Harap dicatat, Kebijakan Privasi tidak berlaku di mana Anthropic bertindak sebagai pemroses data dan memproses data pribadi atas nama pelanggan komersial yang menggunakan Layanan Komersial Anthropic. Dalam kasus tersebut, pelanggan komersial adalah pengontrol, dan Anda dapat meninjau kebijakan mereka untuk informasi lebih lanjut tentang bagaimana mereka menangani data pribadi Anda.

Apakah pertanyaan Anda terjawab?