Meta melancarkan program baru untuk meningkatkan AI pertuturan dan terjemahan

Meta melancarkan program baru bekerjasama dengan UNESCO untuk mengumpul rakaman pertuturan dan transkripsi yang dijalankan oleh syarikat tersebut yang akan membantu pembangunan AI yang akan dibuka pada masa akan datang.

Program, Program Rakan Teknologi Bahasa, sedang mencari rakan kerjasama yang boleh menyumbang lebih daripada 10 jam rakaman pertuturan dengan transkripsi, sejumlah besar teks bertulis, dan set ayat yang diterjemahkan dalam "pelbagai bahasa." Menurut Meta, rakan-rakan akan bekerjasama dengan pasukan AI syarikat untuk mengintegrasikan bahasa-bahasa ini ke dalam model pengiktirafan dan terjemahan pertuturan AI, yang - apabila disempurnakan - akan menjadi sumber terbuka.

Rakan sejauh ini termasuk kerajaan Nunavut, sebuah wilayah yang jarang penduduknya di Utara Kanada. Beberapa penduduk Nunavut bertutur dalam bahasa Intuit yang secara kolektif dikenali sebagai Inuktut.”

"Usaha kami terutamanya memberi tumpuan kepada bahasa-bahasa yang kurang dilayan, sebagai sokongan kepada kerja UNESCO," Meta menulis dalam catatan blog yang diberikan kepada TechCrunch. "Pada akhirnya, matlamat kami adalah untuk mencipta sistem pintar yang dapat memahami dan memberi respons kepada keperluan manusia yang kompleks, tanpa mengira bahasa atau latar belakang budaya."

Selari dengan program baru, Meta mengatakan bahawa mereka akan melepaskan penanda aras terjemahan mesin sumber terbuka untuk menilai prestasi model terjemahan bahasa. Penanda aras, yang terdiri daripada ayat-ayat yang digubah oleh ahli bahasa, menyokong tujuh bahasa, dan boleh diakses - dan disumbang - dari platform pembangunan AI Hugging Face.

Meta memegang kedua-dua inisiatif ini sebagai filantropik. Tetapi syarikat itu akan mendapat manfaat dari model pengiktirafan dan terjemahan pertuturan yang dimuktamadkan.

Meta terus memperluaskan bilangan bahasa yang disokong oleh pembantu AI Meta, Meta AI, dan uji coba ciri-ciri seperti terjemahan automatik untuk pencipta. Pada bulan September tahun lalu, Meta mengumumkan bahawa mereka akan mula menguji alat untuk menterjemahkan suara dalam Instagram Reels, membolehkan pencipta untuk memendekkan pertuturan mereka dan menyelar auto-lip-syncnya.

Pengendalian Meta terhadap kandungan dalam bahasa selain Bahasa Inggeris di platform mereka telah menjadi sasaran kritikan. Mengikut satu laporan, Facebook meninggalkan hampir 70% maklumat salah tentang COVID dalam bahasa Itali dan Sepanyol tanpa dilaporkan berbanding dengan hanya 29% maklumat salah serupa dalam Bahasa Inggeris. Dan dokumen yang bocor dari syarikat itu mendedahkan bahawa pos dalam Bahasa Arab sering dilaporkan secara tidak betul sebagai kata-kata kebencian.

Meta mengatakan bahawa mereka sedang mengambil langkah-langkah untuk meningkatkan teknologi terjemahan dan pengawasan mereka.