Kategori Berita
Media Network
Senin, 08 APRIL 2024 • 12:20 WIB

Whisper, Model Transkripsi Audio OpenAI dalam Pengumpulan Data dari YouTube

Ilustrasi ChatGPT. (REUTERS/Dado Ruvic)

INDOZONE.ID - OpenAI dilaporkan menggunakan transkripsi lebih dari satu juta jam video YouTube, untuk melatih model bahasa AI terkini mereka, GPT-4.

Menurut laporan Neowin pada hari Minggu (7/4/2024), New York Times mengungkapkan bahwa OpenAI telah mengembangkan model transkripsi audio yang disebut Whisper untuk mengumpulkan data dari video YouTube.

Laporan tersebut juga mencatat bahwa OpenAI menyadari tindakan mereka berada di bawah pengawasan, namun mereka tetap melanjutkan praktik tersebut karena dianggap sebagai tindakan yang wajar.

Baca Juga: Tarik Minat Pengguna Baru, OpenAI Hapus Syarat Daftar Akun di ChatGPT

Informasi yang diungkapkan oleh New York Times sejalan dengan laporan dari The Information yang menyatakan bahwa OpenAI diduga mengumpulkan data dari video dan podcast di YouTube, untuk melatih dua sistem AI mereka. Greg Brockman, Presiden OpenAI, disebut terlibat dalam tim pelatihan AI tersebut.

Beberapa individu di Google, sebagai pemilik YouTube, juga mengetahui praktik yang dilakukan oleh OpenAI, namun memilih untuk tidak mengambil tindakan karena Google sendiri menggunakan video YouTube untuk melatih model AI mereka.

Google memberikan tanggapan bahwa video yang digunakan untuk melatih AI mereka telah memperoleh izin dari pembuatnya.

Baca Juga: Tarik Minat Pengguna Baru, OpenAI Hapus Syarat Daftar Akun di ChatGPT

Dalam sebuah wawancara dengan Bloomberg, CEO YouTube Neal Mohan, menegaskan bahwa kebijakan perusahaan melarang pengunduhan transkrip video atau konten serupa karena melanggar kebijakan layanan YouTube.

Meskipun demikian, ketika ditanya tentang penggunaan data YouTube oleh OpenAI, Mohan mengaku belum memiliki informasi yang memadai untuk mengonfirmasinya meskipun telah mengetahui laporan mengenai hal tersebut.

 

Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi

Sumber: Antara

BERITA TERKAIT
BERITA TERBARU

Whisper, Model Transkripsi Audio OpenAI dalam Pengumpulan Data dari YouTube

Link berhasil disalin!