Mengapa OpenAI belum membawa penyelidikan mendalam ke API-nya

Dikemaskini 4:11 petang Waktu Timur: OpenAI mengatakan bahawa kertas putihnya telah diformulasikan dengan salah untuk mencadangkan bahawa kerja mereka dalam penyelidikan pujukan berkaitan dengan keputusan mereka sama ada untuk menjadikan model penyelidikan mendalam tersedia dalam API mereka. Syarikat itu telah mengemaskini kertas putih untuk mencerminkan bahawa penyelidikan pujukan mereka berasingan daripada rancangan pelepasan model penyelidikan mendalam. Cerita asal berikut:

OpenAI berkata bahawa ia tidak akan membawa model AI yang mendorong penyelidikan mendalam, alat penyelidikan mendalamnya, ke API pembangunnya sementara ia memikirkan cara untuk menilai risiko AI yang lebih baik untuk meyakinkan orang untuk bertindak atau mengubah keyakinan mereka.

Dalam kertas putih OpenAI yang diterbitkan pada hari Rabu, syarikat tersebut menyatakan bahawa ia sedang merombak kaedahnya untuk menyelidiki model bagi "risiko pujukan dunia nyata," seperti menyebarkan maklumat menyesatkan secara meluas.

OpenAI mencatat bahawa ia tidak percaya model penyelidikan mendalam adalah sesuai untuk kempen maklumat palsu atau disinformasi, disebabkan oleh kos pengkomputeran yang tinggi dan kelajuan yang agak perlahan. Walau bagaimanapun, syarikat tersebut berkata bahawa ia bercadang untuk meneroka faktor-faktor seperti bagaimana AI boleh memperibadikan kandungan pujukan yang berpotensi merosakkan sebelum membawa model penyelidikan mendalam ke API-nya.

"Sementara kita bekerja untuk mempertimbangkan semula pendekatan kita terhadap pujukan, kita hanya menggunakan model ini dalam ChatGPT, bukan API," tulis OpenAI.

Terdapat ketakutan yang sebenar bahawa AI menyumbang kepada penyebaran maklumat palsu atau menyesatkan yang bertujuan untuk mengubah hati dan pikiran ke arah yang jahat. Sebagai contoh, tahun lalu, deepfakes politik tersebar seperti api di seluruh dunia. Pada hari pilihan raya di Taiwan, kumpulan yang berkaitan dengan Parti Komunis China memuat naik audio yang menyesatkan yang dihasilkan oleh AI tentang seorang ahli politik yang menyokong calon pro-China.

AI juga semakin digunakan untuk menjalankan serangan kejuruteraan sosial. Pengguna tertipu oleh deepfakes selebriti yang menawarkan peluang pelaburan palsu, manakala syarikat yang ditipu jutaan oleh peniru deepfake.

Dalam kertas putihnya, OpenAI menerbitkan hasil beberapa ujian bagi kebolehpersuasian model penyelidikan mendalam. Model itu adalah versi khas model "penalaran" o3 OpenAI yang baru diumumkan yang dioptimumkan untuk penyelidikan web dan analisis data.

Dalam satu ujian yang menugaskan model penyelidikan mendalam untuk menulis hujah persuasif, model itu mencapai prestasi terbaik daripada model-model OpenAI yang telah dikeluarkan sejauh ini - tetapi tidak lebih baik daripada garis asas manusia. Dalam ujian lain di mana model penyelidikan mendalam cuba untuk meyakinkan model yang lain (GPT-4o OpenAI) untuk membuat pembayaran, model itu sekali lagi melebihi prestasi model-model OpenAI yang lain yang tersedia.

Skor model penyelidikan mendalam pada MakeMePay, satu penanda aras yang menguji keupayaan model untuk meyakinkan model yang lain untuk wang. Kredit Imej: OpenAI

Namun, model penyelidikan mendalam tidak lulus setiap ujian kebolehpersuasian dengan cemerlang. Menurut kertas putih tersebut, model itu lebih buruk dalam meyakinkan GPT-4o untuk memberitahu ia sebuah kata sandi berbanding GPT-4o itu sendiri.

OpenAI mencatat bahawa hasil ujian itu kemungkinan mewakili "batas yang lebih rendah" keupayaan model penyelidikan mendalam tersebut. "Pembinaan tambahan atau pengelicitan keupayaan yang lebih baik boleh meningkatkan prestasi yang diperhatikan," tulis syarikat itu.

Kami telah menghubungi OpenAI untuk maklum balas lebih lanjut dan akan mengemaskini pos ini jika kami mendapat berita daripada mereka.

Sekurang-kurangnya salah satu pesaing OpenAI tidak menunggu untuk menawarkan produk API "penyelidikan mendalam" sendiri, dari pandangan mata. Perplexity hari ini mengumumkan pelancaran Deep Research dalam API pembangunnya Sonar, yang didayakan oleh versi tersuai model R1 makmal AI China DeepSeek.