
Syarikat China terus mengeluarkan model Kecerdasan Buatan yang menyaingi keupayaan sistem yang dikembangkan oleh OpenAI dan syarikat Kecerdasan Buatan berpusat di AS lain.
Minggu ini, MiniMax, sebuah startup yang disokong oleh Alibaba dan Tencent yang telah mengumpulkan sekitar $850 juta dalam modal ventura dan dinilai lebih dari $2.5 bilion, melancarkan tiga model baru: MiniMax-Text-01, MiniMax-VL-01, dan T2A-01-HD. MiniMax-Text-01 adalah model teks sahaja, manakala MiniMax-VL-01 boleh memahami gambar dan teks. T2A-01-HD pula menghasilkan audio - khususnya pertuturan.
MiniMax mendakwa bahawa MiniMax-Text-01, yang mempunyai 456 bilion parameter, berprestasi lebih baik daripada model seperti Gemini 2.0 Flash yang baru diperkenalkan oleh Google dalam ujian MATH dan SimpleQA, yang mengukur keupayaan model untuk menjawab masalah matematik dan soalan berdasarkan fakta. Parameter lebih kurang melambangkan kemahiran penyelesaian masalah model, dan model dengan lebih parameter secara amnya berprestasi lebih baik daripada yang mempunyai kurang parameter.
Bagi MiniMax-VL-01, MiniMax menyatakan bahawa ia menyaingi Claude 3.5 Sonnet dari Anthropic dalam penilaian yang memerlukan pemahaman multimodal, seperti ChartQA, yang memberi tugas kepada model untuk menjawab pertanyaan berkaitan graf dan gambaran (contohnya, 'Apakah nilai puncak garis oren dalam graf ini?'). Walaupun begitu, MiniMax-VL-01 tidak mengalahkan Gemini 2.0 Flash dalam banyak ujian ini. GPT-4o daripada OpenAI dan Llama 3.1 daripada Meta juga mengalahkannya dalam beberapa ujian.
Perlu diperhatikan bahawa MiniMax-Text-01 mempunyai tetingkap konteks yang sangat besar. Tetingkap konteks model merujuk kepada input (contohnya, teks) yang diberikan kepada model sebelum menghasilkan output (teks tambahan). Dengan tetingkap konteks sebanyak 4 juta token, MiniMax-Text-01 boleh menganalisis kira-kira 3 juta perkataan dalam satu masa - atau lebih daripada lima salinan 'War and Peace'.
Untuk perbandingan, tetingkap konteks MiniMax-Text-01 adalah kira-kira 31 kali lebih besar daripada GPT-4o dan Llama 3.1.
Model terakhir MiniMax yang dilancarkan minggu ini, T2A-01-HD, ialah penghasil audio yang dioptimumkan untuk pertuturan. T2A-01-HD boleh menghasilkan suara sintetik dengan irama, nada, dan penjuru yang boleh disesuaikan dalam kira-kira 17 bahasa yang berbeza, termasuk Bahasa Inggeris dan Bahasa Cina, dan meniru suara daripada hanya 10 saat rakaman audio.
MiniMax tidak menerbitkan keputusan penanda aras yang membandingkan T2A-01-HD dengan model penghasil audio lain. Tetapi kepada telinga wartawan ini, hasil keluaran T2A-01-HD kedengaran sejajar dengan model audio dari Meta dan startup seperti PlayAI.
Kecuali T2A-01-HD, yang hanya tersedia melalui API MiniMax dan platform AI Hailuo, model baru MiniMax boleh dimuat turun dari GitHub dan platform pembangunan AI Hugging Face.
Hanya kerana model-model ini "secara terbuka" tersedia tidak bermakna mereka tidak terkunci dalam beberapa aspek. MiniMax-Text-01 dan MiniMax-VL-01 bukanlah sumber terbuka yang sebenarnya dalam erti bahawa MiniMax tidak mengeluarkan komponen (contoh, data latihan) yang diperlukan untuk menciptanya dari awal. Selain itu, mereka berada di bawah lesen terbatas MiniMax, yang melarang pembangun dari menggunakan model-model itu untuk meningkatkan model AI pesaing dan memerlukan platform dengan lebih daripada 100 juta pengguna aktif bulanan untuk meminta lesen khas dari MiniMax.
MiniMax ditubuhkan pada tahun 2021 oleh bekas pekerja SenseTime, salah satu syarikat Kecerdasan Buatan terbesar di China. Projek syarikat ini termasuk aplikasi seperti Talkie, platform permainan berperanan yang dikuasakan oleh AI seumpama Character AI, dan model teks-ke-video yang MiniMax telah keluarkan di Hailuo.
Beberapa produk MiniMax telah menjadi subjek kontroversi kecil.
Talkie, yang ditarik dari App Store Apple pada bulan Disember atas alasan "teknikal" yang tidak ditentukan, memaparkan avatar AI tokoh-tokoh publik, termasuk Donald Trump, Taylor Swift, Elon Musk, dan LeBron James, yang tidak kelihatan bersetuju untuk ditampilkan dalam aplikasi itu.
Pada bulan Disember, majalah Broadcast melaporkan bahawa penghasil video MiniMax boleh menghasilkan semula logo stesen televisyen British, menunjukkan bahawa model-model MiniMax dilatih dengan konten dari stesen-stesen tersebut. Dan MiniMax dikatakan sedang disaman oleh iQiyi, perkhidmatan penstriman video di China yang mendakwa MiniMax melatih secara haram atas rakaman hak cipta iQiyi.
Model-model baru MiniMax tiba beberapa hari selepas pentadbiran Biden yang sedang keluar mencadangkan peraturan eksport yang lebih ketat dan sekatan ke atas teknologi AI untuk usaha China. Syarikat di China telah dihalang daripada membeli mikrocip AI yang canggih, tetapi jika peraturan baru dilaksanakan seperti yang ditulis, syarikat akan menghadapi hala tuju yang lebih ketat terhadap teknologi semikonduktor dan model-model yang diperlukan untuk memulakan sistem AI yang kompleks.
Pada hari Rabu, pentadbiran Biden mengumumkan langkah-langkah tambahan yang memberi tumpuan kepada menghalang mikrocip yang canggih daripada sampai ke China. Kilang mikrocip dan syarikat pembungkus yang ingin mengeksport mikrocip tertentu akan dikenakan keperluan lesen yang lebih meluas kecuali jika mereka melakukan lebih banyak tinjauan dan kajian yang teliti untuk mencegah produk mereka daripada sampai kepada klien-klien China.