
Model pemikiran AI sumber terbuka baru DeepSeek, R1, telah menyebabkan penjualan saham Nvidia dan membuat aplikasi penggunaannya melonjak ke puncak toko aplikasi.
Bulan lalu, DeepSeek mengumumkan bahwa mereka melatih model menggunakan pusat data sekitar 2.000 GPU H800 Nvidia dalam waktu sekitar dua bulan dengan biaya sekitar $5,5 juta. Minggu lalu, mereka menerbitkan paper yang menunjukkan bahwa kinerja model terbarunya setara dengan model pemikiran paling canggih di dunia. Model-model ini dilatih di pusat data yang mengeluarkan miliaran dolar untuk chip AI Nvidia yang lebih cepat dan mahal.
Reaksi di seluruh industri teknologi terhadap model high-performance dan biaya lebih rendah dari DeepSeek ini sangat heboh. Pat Gelsinger, misalnya, sangat bersemangat dengan hal ini, dan ia mengucapkan terima kasih kepada tim DeepSeek melalui X.
Kebijaksanaan adalah belajar pelajaran yang kita pikir sudah kita tahu. DeepSeek mengingatkan kita pada tiga pelajaran penting dari sejarah computing:
— Pat Gelsinger (@PGelsinger) 27 Januari 2025
1) Computing patuh pada hukum gas. Mengingatkan bahwa membuatnya jauh lebih murah akan memperluas pasar untuknya. Pasar-pasar ini keliru, ini akan membuat AI...
Gelsinger adalah mantan CEO Intel, seorang insinyur hardware, dan saat ini merupakan chairman dari startup miliknya sendiri yang akan menuju IPO, yaitu Gloo, platform pesan dan keterlibatan untuk gereja. Dia meninggalkan Intel pada bulan Desember setelah empat tahun dan percobaan mengejar Nvidia dengan GPU AI alternatif Intel, yaitu Gaudi 3 AI.
Gelsinger menulis bahwa DeepSeek harus mengingatkan industri teknologi pada tiga pelajaran pentingnya: biaya rendah berarti adopsi yang lebih luas; kecerdikan berkembang dalam batasan; dan "Keberhasilan adalah Milik Bersama. DeepSeek akan membantu mengatur ulang dunia semakin tertutup dari pekerjaan model AI dasar," katanya. OpenAI dan Anthropic keduanya bersifat tertutup.
Gelsinger mengatakan kepada TechCrunch bahwa R1 sangat mengesankan, Gloo telah memutuskan untuk tidak mengadopsi dan membayar untuk OpenAI. Gloo sedang membangun layanan AI bernama Kallm, yang akan menawarkan chatbot dan layanan lainnya.
"Insinyur Gloo saya saat ini sedang menjalankan R1," katanya. "Mereka bisa menjalankan o1 — baik, mereka hanya bisa mengakses o1 melalui API."
Sebagai gantinya, dalam dua minggu, Gloo berharap dapat membangun kembali Kallm dari awal "dengan model dasar sendiri yang semuanya open source," katanya. "Itu sangat menggembirakan."
Menurutnya, DeepSeek akan membuat AI menjadi lebih terjangkau, bukan hanya ada di mana-mana. AI yang baik akan ada di mana-mana. "Saya ingin AI yang lebih baik di Oura Ring saya. Saya ingin AI yang lebih baik di alat bantu dengar saya. Saya ingin lebih banyak AI di ponsel saya. Saya ingin AI yang lebih baik di perangkat embedded saya, seperti pengenalan suara di mobil listrik saya," katanya.
Reaksi gembira Gelsinger mungkin berbeda dengan yang lain yang kurang senang bahwa model dasar pemikiran sekarang memiliki pesaing yang lebih unggul dan jauh lebih terjangkau. AI telah menjadi semakin mahal, bukan semakin murah.
Orang lain bereaksi dengan menyiratkan bahwa DeepSeek pasti telah memanipulasi angka-angka dan pelatihannya pasti lebih mahal. Ada yang berpikir bahwa DeepSeek tidak dapat menyebutkan bahwa mereka menggunakan chip yang lebih tinggi karena pembatasan ekspor chip AI Amerika ke China. Orang lain menemukan kelemahan dalam kinerjanya, menemukan tempat di mana model-model lain lebih baik. Masih ada yang percaya bahwa model OpenAI berikutnya, o3, akan jauh mengungguli R1 ketika dirilis sehingga status quo akan diperbaiki.
Gelsinger mengabaikan semua itu. "Anda tidak akan pernah memiliki transparansi penuh, mengingat sebagian besar pekerjaan dilakukan di China," katanya. "Namun, semua bukti menunjukkan bahwa biaya pelatihannya 10-50x lebih murah daripada o1."
DeepSeek membuktikan bahwa AI dapat dipindahkan ke depan "dengan kreativitas rekayasa, bukan dengan melemparkan lebih banyak daya hardware dan sumber daya komputasi pada masalah tersebut. Jadi itu bisa membuat Anda merasa terhibur," katanya.
Apakah ini menjadi pengembang Cina dengan semua yang tersirat, seperti kekhawatiran atas privasi dan sensor, Gelsinger menggelengkan kepala metaforis.
"Mengingatkan kita pada kekuatan ekosistem terbuka oleh Cina mungkin sedikit memalukan bagi komunitas kita, bagi dunia Barat," katanya.
TechCrunch memiliki buletin berorientasi AI! Daftarkan diri Anda di sini untuk menerimanya di kotak masuk Anda setiap Rabu.