Kamis, 29 AGUSTUS 2024 • 11:54 WIB

Google Sudah Perbaiki Masalah Fitur Penggambaran Orang di Gemini, Jadi Akurat?

Author

INDOZONE - Google baru-baru ini mengumumkan bahwa mereka telah memperbaiki masalah yang melibatkan ketidakakuratan sejarah dalam kemampuan chatbot AI mereka, Gemini, untuk menghasilkan gambar orang.

Isu ini pertama kali mencuat pada Februari ketika pengguna melaporkan bahwa Gemini menghasilkan gambar yang tidak sesuai dengan kenyataan sejarah.

Misalnya, ketika diminta untuk menggambarkan "legiun Romawi," Gemini malah menampilkan sekelompok prajurit yang beragam secara rasial, yang tentu saja anachronistic.

Selain itu, ketika diminta untuk menggambarkan "prajurit Zulu," Gemini justru menampilkan gambar yang stereotipikal.

CEO Minta Maaf

Ketika masalah ini pertama kali muncul, CEO Google, Sundar Pichai, langsung meminta maaf dan mengatakan bahwa perbaikan akan segera dilakukan.

Demis Hassabis, salah satu pendiri DeepMind, divisi riset AI milik Google, bahkan menyatakan bahwa solusi atas masalah ini akan tersedia dalam beberapa minggu ke depan.

Namun, kenyataannya, penyelesaian masalah ini memakan waktu lebih lama dari yang diperkirakan, bahkan melibatkan beberapa karyawan Google yang bekerja hingga 120 jam per minggu.

Setelah jeda yang cukup lama, Google akhirnya mengumumkan bahwa dalam beberapa hari ke depan, Gemini akan kembali diaktifkan untuk menghasilkan gambar orang.

Namun, fitur ini hanya akan tersedia bagi pengguna yang berlangganan salah satu paket berbayar Google Gemini, seperti Gemini Advanced, Business, atau Enterprise, sebagai bagian dari tes akses awal yang hanya tersedia dalam bahasa Inggris.

Hingga saat ini, Google belum memberikan keterangan lebih lanjut mengenai kapan fitur ini akan diperluas ke versi gratis dan bahasa lainnya.

Perbaikan yang Dilakukan Google

Google menjelaskan bahwa mereka telah melakukan beberapa perbaikan teknis pada model AI-nya, terutama dengan melibatkan model Imagen 3 yang terbaru.

Model ini telah dilatih dengan menggunakan data yang lebih beragam dan disaring untuk masalah keamanan dan keadilan.

Sebuah makalah teknis yang dibagikan oleh Google kepada media menyebutkan bahwa Imagen 3 dilatih dengan caption yang dihasilkan oleh AI yang dirancang untuk meningkatkan variasi dan keragaman konsep yang terkait dengan gambar dalam data latihannya.

Selain itu, data pelatihan model ini juga telah direview dengan pertimbangan masalah keadilan.

Google juga menekankan bahwa mereka telah mengurangi kemungkinan terjadinya respons yang tidak diinginkan melalui uji coba yang ekstensif, baik secara internal maupun dengan melibatkan ahli independen.

Selain itu, Google juga menyatakan bahwa fokus mereka adalah untuk menguji kemampuan model ini secara rigor sebelum mengaktifkannya kembali.

Fitur-Fitur Baru pada Imagen 3 dan Gemini

Meskipun fitur penggambaran orang hanya tersedia untuk pengguna premium, semua pengguna Gemini akan mendapatkan akses ke model Imagen 3 dalam waktu dekat.

Model ini diklaim lebih akurat dalam memahami perintah teks yang diterjemahkan ke dalam gambar dibandingkan pendahulunya, Imagen 2.

Selain itu, Imagen 3 juga diklaim lebih kreatif dan detail dalam menghasilkan gambar, serta menghasilkan lebih sedikit artefak dan kesalahan.

Bahkan, model ini juga diklaim sebagai model Imagen terbaik dalam hal merender teks.

Untuk mengatasi kekhawatiran terkait potensi penyalahgunaan deepfake, Imagen 3 akan menggunakan SynthID, sebuah pendekatan yang dikembangkan oleh DeepMind untuk menerapkan watermark kriptografi yang tidak terlihat pada berbagai bentuk media yang dihasilkan oleh AI.

SynthID telah diumumkan sebelumnya oleh Google, jadi penggunaan teknologi ini pada Imagen 3 bukanlah kejutan besar.

Selain itu, Google juga meluncurkan fitur baru yang disebut Gems pada Gemini, yang hanya tersedia untuk pengguna Gemini Advanced, Business, dan Enterprise.

Mirip dengan GPTs dari OpenAI, Gems adalah versi custom-tailored dari Gemini yang dapat bertindak sebagai "ahli" dalam topik tertentu, seperti memasak vegetarian atau membantu menulis caption untuk postingan media sosial.

Pengguna dapat membuat Gem dengan menulis instruksi, memberikan nama, dan mulai menggunakan fitur ini.

Gems tersedia di desktop dan mobile di 150 negara dan "sebagian besar bahasa," meskipun belum didukung di Gemini Live.

Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi

Sumber: Uk.news.yahoo.com, Techcrunch.com, Techopedia.com