INDOZONE.ID - Elon Musk sedang merasa cemas terkait laju perkembangan kecerdasan buatan (AI). Menurutnya, sumber data utama yang selama ini digunakan untuk melatih AI, yakni data yang diciptakan oleh manusia, kini telah habis.
Pernyataan ini disampaikan Musk dalam wawancara bersama CEO perusahaan pemasaran Stagwell, Mark Penn, yang disiarkan melalui platform X.
Musk menjelaskan bahwa proses melatih AI melibatkan 'penyerapan' beragam informasi, mulai dari konten internet, buku-buku, hingga video.
Baca Juga: Grok AI Milik Elon Musk Rilis: Gratis untuk Pengguna X, Apa Keunggulannya Dibanding Chatbot Lain?
Seluruh informasi ini kemudian diubah menjadi token agar dapat diproses dan dipelajari oleh sistem AI.
Namun, kini ia menyebutkan bahwa AI telah mengonsumsi habis semua informasi tersebut.
"Jumlah akumulasi pengetahuan manusia telah habis untuk melatih AI," tegas Musk mengutip Fortune, Minggu (12/1/2025).
"Hal ini pada dasarnya terjadi tahun lalu," tambahnya.
Baca Juga: Elon Musk Kembangkan Xmail, Apakah Bisa Jadi Pesaing Gmail?
Lebih lanjut, Musk mengungkapkan bahwa untuk terus melatih diri, AI kini terpaksa beralih ke data sintetis, yang dihasilkan secara buatan.
Ia menganalogikan proses ini seperti model AI yang menulis esai, kemudian menilai kualitas esai buatannya sendiri.
Menariknya, sejumlah perusahaan teknologi raksasa seperti Microsoft, Google, dan Meta, dilaporkan telah mengadopsi penggunaan data sintetis untuk melatih model AI mereka.
Contohnya, Google DeepMind memanfaatkan 100 juta contoh unik yang dibuat secara artifisial untuk melatih sistem AlphaGeometry dalam memecahkan soal matematika rumit.
Langkah ini dipandang sebagai solusi untuk "mengatasi keterbatasan data" dari informasi yang dibuat manusia.
Selain itu, OpenAI juga memperkenalkan model AI bernama o1 yang memiliki kemampuan melakukan pengecekan fakta secara mandiri.
AI Halusinasi
Namun, Musk mewanti-wanti adanya potensi dampak negatif dari penggunaan data sintetis secara luas.
Salah satunya adalah meningkatnya risiko terjadinya halusinasi pada AI.
Halusinasi dalam konteks ini merujuk pada konten tidak masuk akal atau keliru yang diyakini AI sebagai kebenaran.
Fenomena yang disebut AI slop ini telah mulai membanjiri internet dan memicu kekhawatiran di kalangan pakar teknologi dan pengguna.
Nick Clegg, Presiden Urusan Global di Meta, sebelumnya menyatakan bahwa pihaknya tengah berupaya mengidentifikasi konten yang dihasilkan AI di platform mereka.
"Seiring kaburnya perbedaan antara konten buatan manusia dan sintetis, masyarakat ingin mengetahui batasan yang jelas," kata Clegg dalam sebuah unggahan blog.
Hingga berita ini ditayangkan, Elon Musk belum memberikan respons terhadap permintaan komentar dari Fortune.
Pandangan ilmuwan mengenai dampak penggunaan data sintetisKeterbatasan data buatan manusia sebagai sumber pelatihan AI semakin menjadi perhatian di kalangan ilmuwan.
Sebuah studi dari kelompok riset Epoch AI yang dirilis Juni lalu memprediksi bahwa perusahaan teknologi akan kehabisan konten publik untuk melatih model bahasa AI antara tahun 2028 hingga 2032.
Prediksi ini sedikit lebih konservatif dibandingkan klaim Musk, namun tetap menggarisbawahi adanya keterbatasan sumber daya.
Keterbatasan ini berpotensi memperlambat laju perkembangan AI.
"Ada kendala serius di sini," ungkap Tamay Besiroglu, salah satu penulis studi tersebut, kepada Associated Press.
"Jika Anda mulai terbentur batasan jumlah data yang tersedia, maka Anda tidak dapat lagi meningkatkan skala model Anda secara efisien," lanjutnya.
Ia menekankan peningkatan skala model AI menjadj cara paling signifikan untuk memperluas kemampuan dan meningkatkan kualitas keluaran AI.
Benarkah Sudah Habis?
Salah satu faktor menipisnya sumber informasi buatan manusia bukan hanya karena dikonsumsi oleh AI, tetapi juga karena pemilik data mulai khawatir dan membatasi akses data mereka.
Inisiatif Data Provenance yang dipimpin MIT menerbitkan studi pada Juli yang menemukan bahwa sumber data untuk pelatihan AI semakin menyusut.
Dari 14.000 domain web yang digunakan dalam set data pelatihan AI, peneliti menemukan bahwa sumber online membatasi penggunaan data mereka, bahkan hingga 45%, untuk mencegah pengambilan data oleh bot.
Hal ini menandakan tren pemilik data yang semakin sadar akan nilai informasi mereka dan menuntut kompensasi yang adil.
Baca Juga: OpenAI Berencana Buat Supertintelligence AI, Apa Itu?
Masa depan pelatihan AIMeskipun ketergantungan pada data buatan manusia berkurang, perusahaan teknologi terus mencari alternatif untuk melatih AI.
"Saya tidak melihat adanya kepanikan di perusahaan-perusahaan AI besar," kata Pablo Villalobos, penulis utama studi Epoch AI, dalam wawancara dengan jurnal sains Nature.
"Atau setidaknya, mereka tidak menghubungi saya jika memang ada," kata dia lagi.
Beberapa ilmuwan data kini beralih ke data sintetis, informasi pribadi, dan menjalin kesepakatan dengan penerbit untuk mengakses konten mereka.
Bahkan, OpenAI dilaporkan mempekerjakan staf untuk mentranskripsi podcast dan video YouTube demi mengumpulkan lebih banyak data pelatihan, yang berpotensi melanggar undang-undang hak cipta, menurut laporan New York Times.
Hingga kini, OpenAI belum memberikan tanggapan terkait laporan tersebut.Kendati demikian, data sintetis diprediksi akan menjadi tumpuan utama dalam pelatihan AI di masa depan.
CEO OpenAI, Sam Altman, dalam Konferensi Sohn Conference Foundation 2023 mengakui bahwa perusahaannya akan kehabisan konten untuk melatih model mereka.
Namun, ia optimis bahwa peningkatan kualitas produksi data sintetis akan membantu mengatasi krisis konten ini.
"Selama Anda dapat melewati synthetic data event horizon di mana modelnya cukup baik untuk menciptakan data sintetis yang berkualitas, saya pikir kita akan baik-baik saja," pungkasnya.
Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi
Sumber: Fortune