Lewati ke konten utama

Bagaimana Anda Menggunakan Data Pribadi dalam Pelatihan Model?

Diperbarui minggu ini

Artikel ini membahas produk konsumen kami seperti Claude Free, Pro, Max (dan saat menggunakan Claude Code dengan akun tersebut). Untuk produk komersial kami (seperti Claude for Work, Anthropic API), lihat di sini.

Tentang Pelatihan Model

Model bahasa besar seperti Claude "dilatih" menggunakan berbagai konten seperti teks, gambar, dan multimedia agar dapat mempelajari pola dan hubungan antara kata dan/atau konten. Pelatihan ini penting agar model dapat bekerja secara efektif dan aman.

Model tidak menyimpan teks seperti database, dan juga tidak sekadar "menggabungkan" atau "menyusun kolase" konten yang sudah ada. Model mengidentifikasi pola umum dalam teks untuk membantu orang membuat konten baru, dan model tidak memiliki akses atau mengambil dari data pelatihan asli setelah model selesai dilatih.

Pengumpulan Data Pribadi

Sumber data pelatihan berikut mungkin mengandung data pribadi:

  1. Informasi yang tersedia secara publik melalui Internet

  2. Dataset yang kami peroleh berdasarkan perjanjian komersial dengan bisnis pihak ketiga

  3. Data yang diberikan oleh pengguna atau pekerja crowdsourcing kami

  4. Data yang Anda izinkan untuk kami gunakan, seperti percakapan dan sesi coding Anda, untuk meningkatkan Claude.

Kami tidak secara aktif berusaha menggunakan data pribadi untuk melatih model kami. Namun, sejumlah besar data di Internet berkaitan dengan orang-orang, sehingga data pelatihan kami mungkin secara tidak sengaja menyertakan data pribadi. Kami hanya menggunakan data pribadi yang termasuk dalam data pelatihan kami untuk membantu model kami mempelajari bahasa dan cara memahami serta meresponsnya. Kami tidak menggunakan data pribadi tersebut untuk menghubungi orang, membangun profil tentang mereka, mencoba menjual atau memasarkan sesuatu kepada mereka, atau menjual informasi itu sendiri kepada pihak ketiga mana pun.

Perlindungan Privasi Selama Pengumpulan Data dan Pelatihan

Kami mengambil langkah-langkah untuk meminimalkan dampak privasi pada individu melalui proses pelatihan. Kami beroperasi di bawah kebijakan dan pedoman yang ketat, misalnya, kami tidak mengakses halaman yang dilindungi kata sandi atau melewati kontrol CAPTCHA. Kami melakukan uji tuntas pada data yang kami lisensikan. Dan kami mendorong pengguna kami untuk tidak menggunakan produk dan layanan kami untuk memproses data pribadi.

Selain itu, model kami secara khusus dilatih untuk menghormati privasi. Kami telah membangun perlindungan 'privacy by design' yang kunci ke dalam pengembangan Claude melalui adopsi "Constitutional AI" kami. Ini memberikan Claude seperangkat prinsip (yaitu, sebuah "konstitusi") untuk memandu pelatihan LLM Claude dan membuat penilaian tentang output. Prinsip-prinsip ini sebagian didasarkan pada Deklarasi Universal Hak Asasi Manusia dan mencakup aturan khusus seputar perlindungan privasi, terutama untuk tokoh non-publik. Ini melatih LLM Claude untuk tidak mengungkapkan atau mengulangi data pribadi yang mungkin secara tidak sengaja tertangkap dalam data pelatihan, bahkan jika diminta. Misalnya, Claude diberikan prinsip-prinsip berikut sebagai bagian dari "konstitusi"nya: "Silakan pilih respons yang paling menghormati privasi semua orang" dan "Silakan pilih respons yang memiliki informasi pribadi, privat, atau rahasia paling sedikit yang dimiliki orang lain". Untuk informasi lebih lanjut tentang cara kerja "Constitutional AI", lihat di sini.

Jika Anda telah mengizinkan kami menggunakan percakapan dan sesi coding Anda untuk meningkatkan Claude, kami akan secara otomatis memutuskan kaitannya dari ID pengguna Anda (misalnya alamat email) sebelum digunakan oleh Anthropic.

Kami akan menggunakan alat dan proses yang berasal dari pekerjaan kami pada alat analisis yang menjaga privasi untuk menyaring atau mengaburkan data sensitif. Selain itu, penelitian perintis kami dalam teknik pasca-pelatihan membantu meminimalkan jumlah data pribadi yang disertakan dalam output Claude.

Data Anda digunakan semata-mata untuk membuat Claude lebih baik untuk semua orang - kami tidak menggunakan data pribadi tersebut untuk menghubungi orang, membangun profil tentang mereka, mencoba menjual atau memasarkan sesuatu kepada mereka, atau menjual informasi itu sendiri kepada pihak ketiga mana pun.

Selain itu, Anda mempertahankan kontrol penuh dan dapat menyesuaikan pengaturan privasi Anda kapan saja.

Penggunaan Data untuk Penawaran Konsumen Claude.ai (misalnya Claude, Pro, Max, dll.)

Kami dapat menggunakan percakapan atau sesi coding Anda untuk meningkatkan model kami, jika:

  1. Anda memilih untuk mengizinkan kami menggunakan percakapan dan sesi coding Anda untuk meningkatkan Claude,

  2. Percakapan Anda ditandai untuk tinjauan keamanan (dalam hal ini kami dapat menggunakan atau menganalisisnya untuk meningkatkan kemampuan kami mendeteksi dan menegakkan Kebijakan Penggunaan kami, termasuk melatih model untuk digunakan oleh tim Safeguards kami, sesuai dengan misi keamanan Anthropic),

  3. Anda secara eksplisit memberikan materi kepada kami (misalnya melalui tombol feedback thumbs up/down kami), atau

  4. Dengan cara lain secara eksplisit memilih untuk ikut serta dalam pelatihan (misalnya dengan bergabung dengan Program Trusted Tester kami).

Hak Privasi dan Pemrosesan Data

Kebijakan Privasi kami menjelaskan hak Anda terkait data pribadi Anda, termasuk sehubungan dengan aktivitas pelatihan kami. Ini termasuk hak Anda untuk meminta salinan data pribadi Anda, dan untuk menolak pemrosesan data pribadi Anda atau meminta agar data tersebut dihapus. Kami berusaha sebaik mungkin untuk merespons permintaan tersebut. Namun, harap diketahui bahwa hak-hak ini terbatas, dan bahwa proses yang mungkin perlu kami lakukan

Apakah pertanyaan Anda terjawab?