CARAPANDANG - OpenAI dikabarkan menggunakan transkripsi lebih dari satu juta jam video YouTube untuk melatih model bahasa besar AI tercanggihnya saat ini yakni GPT-4.
Melansir dari laporan Neowin pada Minggu (7/4), hal tersebut diungkapkan oleh New York Times yang menyebutkan bahwa OpenAI mengembangkan model transkripsi audio bernama Whisper yang membantu perusahaan teknologi tersebut untuk mengumpulkan data dari video YouTube.
Laporan itu juga mengungkapkan bahwa OpenAI menyadari tindakan mereka berada di bawah pengawasan, akan tetapi pihaknya tetap melanjutkan praktik tersebut karena dianggap sebagai sebuah tindakan yang wajar.
Kabar yang diungkapkan New York Times juga senada dengan laporan The Information yang menyebutkan bahwa OpenAI diduga mengumpulkan data dari video dan podcast di YouTube untuk melatih dua sistem AI mereka. Menurut laporan itu, presiden OpenAI Greg Brockman ikut terlibat dalam tim pelatihan AI itu.
Sejumlah orang di Google, selaku pemilik YouTube, dikabarkan juga mengetahui tentang praktik yang dilakukan oleh OpenAI namun memilih untuk tidak menindaknya karena Google juga menggunakan video YouTube untuk melatih model AI buatan mereka.
Google buka suara mengenai hal ini dengan mengatakan bahwa video yang digunakan untuk melatih AI mereka telah mengantongi izin dari kreatornya.