India mengagungkan Makmal AI China DeepSeek, berancang untuk menjalankan modelnya di pelayan tempatan

Menteri IT India pada hari Khamis memuji kemajuan DeepSeek dan mengatakan negara itu akan menjalankan model bahasa besar Makmal AI China tersebut di pelayan dalam negeri, dalam satu pembukaan langka bagi teknologi China di India.

“Anda telah melihat apa yang telah dilakukan DeepSeek - $5.5 juta dan model yang sangat kuat,” kata Menteri IT Ashwini Vaishnaw pada hari Khamis, merespons kritikan New Delhi yang telah menerima investasi AI sendiri, yang jauh lebih sedikit daripada banyak negara lain.

Sejak tahun 2020, India telah melarang lebih daripada 300 aplikasi dan perkhidmatan yang berkaitan dengan China, termasuk TikTok dan WeChat, dengan alasan keselamatan negara. Kebenaran untuk membenarkan DeepSeek dihos di India mungkin bergantung pada platform menyimpan dan memproses data semua pengguna India di dalam negara, selaras dengan keperluan lokal data yang ketat di India.

“Isu privasi data mengenai DeepSeek boleh diatasi dengan menjalankan model open-source di pelayan India,” kata Vaishnaw di sebuah persidangan industri.

Model-model DeepSeek kemungkinan akan dihos di Fasiliti Pengkomputeran AI baru India. Fasiliti ini didayakan oleh 18,693 unit pemprosesan grafik (GPUs), hampir dua kali ganda daripada sasaran asalnya - hampir 13,000 daripadanya adalah Nvidia H100 GPUs, dan kira-kira 1,500 adalah Nvidia H200 GPUs. Kira-kira 10,000 GPU bersedia untuk digunakan, dan fasiliti tersebut dijadualkan akan mula beroperasi 'dalam beberapa hari akan datang,' menurut menteri tersebut.

Fasiliti itu juga akan menawarkan perkhidmatan pengkomputeran dengan diskaun yang besar kepada firma-firma di India. Vaishnaw mengatakan pengkomputeran AI standard akan ditawarkan dengan diskaun 42% daripada kadar pasaran, dan pengkomputeran berketepatan tinggi akan didiskuankan sebanyak 47%.

Kenyataan menteri tersebut datang sehari selepas aplikasi DeepSeek yang bernama sama telah dikeluarkan dari kedai aplikasi Apple's dan Google's di Itali, selepas pengawal data negara itu mengatakan mereka bertanya bagaimana firma China tersebut menggunakan dan menyimpan data peribadi rakyat Itali.

Pengeluaran model R1 "reasoning" DeepSeek, yang dibina dengan bajet yang dikatakan sederhana, telah menggegarkan industri teknologi minggu ini, menyebabkan nilai pasaran raksasa cip Nvidia merosot sebanyak $600 bilion. Model tersebut segera berada di bawah garis pandang yang intens, dan telah mencetuskan perdebatan sengit mengenai isu hak cipta, kawalan eksport AS, dan bagaimana wang perlu dicurahkan ke dalam usaha AI.

Selain menjalankan model AI asing, India juga cuba memacu pembangunan model AI dan teknologi berkaitan di tanah sendiri. “Pereka cip utama bersedia untuk bekerjasama dengan India untuk mengembangkan GPU asli,” kata Vaishnaw.

Vaishnaw menjangkakan bahawa India akan melihat pelaburan sebanyak $30 bilion dalam hypepascaler dan pusat data dalam tempoh dua hingga tiga tahun akan datang. Salah satu konglomerat terbesar negara itu, Reliance, merancang untuk membina pusat data yang boleh menjadi pusat data terbesar di dunia di bandar Jamnagar, dengan kapasiti 3 gigawatt, Bloomberg melaporkan minggu lalu.

“Kami percaya ada sekurang-kurangnya enam pembangun besar yang boleh membangunkan model AI dalam tempoh enam hingga lapan bulan pada had luar, dan empat hingga enam bulan pada satu anggaran yang lebih optimis. Fasiliti komputer bersama adalah komponen paling penting untuk mencipta ekosistem AI yang kukuh,” kata Vaishnaw.

Fasiliti pengkomputeran tersebut juga akan menyokong inisiatif AI yang lebih luas di India. Vaishnaw mengatakan 18 aplikasi yang digerakkan oleh AI yang memberi tumpuan kepada pertanian, perubahan iklim, dan ketidakupayaan belajar telah dipilih untuk pembiayaan awal.

Untuk mengawasi pembangunan inisiatif AI ini, India akan menubuhkan sebuah badan pengawal menggunakan apa yang digambarkan oleh Vaishnaw sebagai model 'hub-and-spoke,' membenarkan pelbagai institusi untuk bekerjasama dalam kerangka keselamatan. “Kami akan menjadikan model-model kami terbuka dan dijadikan fokus aplikasi,” katanya.