"Jika Anda mulai terbentur batasan jumlah data yang tersedia, maka Anda tidak dapat lagi meningkatkan skala model Anda secara efisien," lanjutnya.
Ia menekankan peningkatan skala model AI menjadj cara paling signifikan untuk memperluas kemampuan dan meningkatkan kualitas keluaran AI.
Salah satu faktor menipisnya sumber informasi buatan manusia bukan hanya karena dikonsumsi oleh AI, tetapi juga karena pemilik data mulai khawatir dan membatasi akses data mereka.
Inisiatif Data Provenance yang dipimpin MIT menerbitkan studi pada Juli yang menemukan bahwa sumber data untuk pelatihan AI semakin menyusut.
Dari 14.000 domain web yang digunakan dalam set data pelatihan AI, peneliti menemukan bahwa sumber online membatasi penggunaan data mereka, bahkan hingga 45%, untuk mencegah pengambilan data oleh bot.
Hal ini menandakan tren pemilik data yang semakin sadar akan nilai informasi mereka dan menuntut kompensasi yang adil.
Baca Juga: OpenAI Berencana Buat Supertintelligence AI, Apa Itu?
Masa depan pelatihan AIMeskipun ketergantungan pada data buatan manusia berkurang, perusahaan teknologi terus mencari alternatif untuk melatih AI.
"Saya tidak melihat adanya kepanikan di perusahaan-perusahaan AI besar," kata Pablo Villalobos, penulis utama studi Epoch AI, dalam wawancara dengan jurnal sains Nature.
"Atau setidaknya, mereka tidak menghubungi saya jika memang ada," kata dia lagi.
Beberapa ilmuwan data kini beralih ke data sintetis, informasi pribadi, dan menjalin kesepakatan dengan penerbit untuk mengakses konten mereka.
Bahkan, OpenAI dilaporkan mempekerjakan staf untuk mentranskripsi podcast dan video YouTube demi mengumpulkan lebih banyak data pelatihan, yang berpotensi melanggar undang-undang hak cipta, menurut laporan New York Times.
Hingga kini, OpenAI belum memberikan tanggapan terkait laporan tersebut.Kendati demikian, data sintetis diprediksi akan menjadi tumpuan utama dalam pelatihan AI di masa depan.
CEO OpenAI, Sam Altman, dalam Konferensi Sohn Conference Foundation 2023 mengakui bahwa perusahaannya akan kehabisan konten untuk melatih model mereka.
Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi
Sumber: Fortune