
AWS, perniagaan komputasi awan Amazon, ingin menjadi tempat terbaik bagi syarikat-syarikat menjalankan dan menyelaraskan model AI generatif khusus mereka.
Hari ini, AWS mengumumkan pelancaran Import Model Kustom (dalam pratinjau), sebuah ciri baru dalam Bedrock, rangkaian perkhidmatan AI generatif yang difokus kepada perniagaan AWS. Ciri ini membolehkan organisasi mengimport dan mengakses model AI generatif dalaman mereka sebagai API yang dikelola sepenuhnya.
Model eksklusif syarikat, setelah diimport, mendapat manfaat daripada infrastruktur yang sama seperti model AI generatif lain dalam perpustakaan Bedrock (contohnya, Llama 3 oleh Meta atau Claude 3 oleh Anthropic). Mereka juga akan mendapat peralatan untuk memperluas pengetahuan mereka, menyelaraskan model mereka dan melaksanakan perlindungan untuk mengurangkan kecondongan model mereka.
“Terdapat pelanggan AWS yang telah menyelaraskan atau membangun model mereka sendiri di luar Bedrock menggunakan alat lain,” kata Vasi Philomin, VP AI generatif di AWS, kepada TechCrunch dalam satu temubual. “Kemampuan Import Model Kustom ini membolehkan mereka membawa model eksklusif mereka ke Bedrock dan melihatnya di samping semua model lain yang sudah ada di Bedrock - dan menggunakannya dengan semua alur kerja yang juga sudah ada di Bedrock, juga.”
Mengimport model-model kustom
Menurut satu tinjauan baru oleh Cnvrg, anak syarikat AI Intel, majoriti perniagaan sedang menggunakan pendekatan AI generatif dengan membina model mereka sendiri dan menyempurnakannya untuk aplikasi mereka. Perniagaan tersebut mengatakan bahawa mereka melihat infrastruktur, termasuk infrastruktur komputasi awan, sebagai penghalang terbesar kepada pelaksanaan, menurut tinjauan tersebut.
Dengan Import Model Kustom, AWS bertujuan untuk memenuhi keperluan tersebut sambil mengikut selangkah dengan pesaing-pesaing dalam bidang awan. (Ketua Eksekutif Amazon, Andy Jassy meramalkan sebagaimana itu dalam surat tahunan beliau kepada pemegang saham baru-baru ini.)
Sejak beberapa masa, Vertex AI, analog Google kepada Bedrock, membolehkan pelanggan mengunggah model-model AI generatif, menyesuaikannya dan menyajikannya melalui API. Databricks juga telah lama menyediakan alat untuk menjalankan dan menyelaraskan model-model kustom, termasuk DBRX yang baru dirilis.
Ditanya apakah yang membezakan Import Model Kustom, Philomin menegaskan bahawa ia - dan melalui perpanjangan Bedrock - menawarkan lebih banyak dan lebih dalam variasi pilihan penyesuaian model berbanding dengan pesaing, menambah bahawa “beratus-ratus ribu” pelanggan hari ini menggunakan Bedrock.
“Pertama, Bedrock menyediakan beberapa cara bagi pelanggan untuk menangani menyajikan model,” kata Philomin. “Kedua, kami mempunyai beberapa alur kerja sekitar model-model ini - dan sekarang pelanggan boleh berdiri betul-betul bersebelahan dengan semua model lain yang sudah tersedia oleh kami. Sesuatu yang penting yang paling orang suka tentang ini adalah keupayaan untuk bereksperimen di sepanjang beberapa model yang berbeza menggunakan alur kerja yang sama, dan kemudian benar-benar membawanya ke produksi dari tempat yang sama.”
Jadi apakah pilihan penyesuaian model yang telah dinyatakan?
Philomin menunjuk kepada Guardrails, yang membolehkan pengguna Bedrock mengkonfigurasi ambang batas untuk menyaring - atau sekurang-kurangnya mencuba untuk menyaring - output model untuk perkara-perkara seperti ucapan kebencian, keganasan dan maklumat peribadi atau korporat yang sulit. (Model-model AI generatif terkenal kerana kadang-kadang mengalami masalah dalam cara yang membimbangkan, termasuk kebocoran maklumat sensitif; model-model AWS tidak terkecuali.) Beliau juga menyorot Model Evaluation, satu alat Bedrock yang pelanggan boleh gunakan untuk menguji sejauh mana model - atau beberapa - berprestasi mengikut satu set kriteria yang diberikan.
Muet
Baik Guardrails maupun Model Evaluation sekarang tersedia secara umum selepas pratinjau berbulan-bulan.
Saya berasa terpanggil untuk menyatakan di sini bahawa Import Model Kustom hanya menyokong tiga seni bina model pada masa ini: Flan-T5 milik Hugging Face, Llama milik Meta dan model-model Mistral. Selain itu, Vertex AI dan perkhidmatan pesaing Bedrock yang lain, termasuk alat-alat pembangunan AI Microsoft di Azure, menawarkan ciri keselamatan dan penilaian yang lebih kurang sebanding (lihat Keselamatan Kandungan AI Azure, penilaian model di Vertex, dan sebagainya).
Apa yang unik untuk Bedrock, bagaimanapun, adalah keluarga model AI generatif AWS Titan. Dan, seiring dengan peluncuran Import Model Kustom, telah terdapat beberapa perkembangan penting dalam hal tersebut.
Model Titan yang Dikemas Kini
Penghasil Imej Titan, model teks-ke-imej AWS, kini tersedia secara umum selepas dilancarkan dalam pratinjau pada November yang lalu. Seperti sebelum ini, Penghasil Imej Titan boleh mencipta imej baru dari huraian teks atau menyesuaikan imej yang sedia ada - misalnya, menukar latar belakang imej sambil mengekalkan subjek-subjek dalam imej tersebut.
Berbanding dengan versi pratinjau, Penghasil Imej Titan dalam GA boleh menghasilkan imej dengan lebih "kreativiti," kata Philomin tanpa memberikan perincian. (Hanya anda yang boleh membuat tekaan tentang apa maksudnya.)
Saya bertanya kepada Philomin jika beliau mempunyai lebih banyak butiran untuk dikongsi mengenai bagaimana Penghasil Imej Titan dilatih.
Pada perkenalan model tersebut pada November yang lalu, AWS agak samar mengenai data mana yang tepat digunakan dalam melatih Penghasil Imej Titan. Sedikit vendor dengan senang mengungkap maklumat tersebut; mereka melihat data latihan sebagai kelebihan bersaing dan oleh itu menjaga data tersebut serta maklumat yang berkaitan dengan data tersebut dengan rapat.
Butiran data latihan juga merupakan sumber ancaman IP yang potensial, suatu halangan lain untuk mendedahkan banyak maklumat. Beberapa kes yang sedang berjalan di mahkamah menolak pertahanan kegunaan wajar vendor, dengan mengatakan bahawa alat teks-ke-imej menyalin gaya seniman tanpa kebenaran eksplisit mereka, dan membuat pengguna menghasilkan karya baru yang menyerupai karya asli pengarang tanpa pengarang menerima bayaran.
Philomin hanya memberitahu saya bahawa AWS menggunakan kombinasi data pihak pertama dan data yang dilisensikan.
“Kami mempunyai gabungan sumber data milik sendiri, tetapi juga kami melisensikan banyak data,” katanya. “Kami sebenarnya membayar yuran lesen kepada pemilik hak cipta untuk dapat menggunakan data mereka, dan kami mempunyai kontrak dengan beberapa daripada mereka.”
Ini adalah lebih banyak butiran daripada yang kita dapat pada November. Akan tetapi, saya berasa bahawa jawapan Philomin tidak akan memuaskan semua orang, terutamanya pencipta kandungan dan ahli etika AI yang berargumentasi untuk mendapatkan lebih banyak kejelasan mengenai latihan model AI generatif.
Sebagai gantinya kepada kejelasan, AWS mengatakan bahawa ia akan terus menawarkan polisi ganti rugi yang meliputi pelanggan sekiranya model Titan seperti Penghasil Imej Titan mengeluarkan semula (iaitu, meluahkan salinan cermin) contoh latihan yang mungkin dilindungi hak cipta. (Beberapa pesaing, termasuk Microsoft dan Google, menawarkan polisi yang serupa yang merangkumi model penghasilan imej mereka.)
Bagi menangani ancaman etika yang mendesak lain - deepfakes - AWS mengatakan bahawa imej yang dicipta dengan Penghasil Imej Titan akan, seperti semasa pratinjau, dilengkapi dengan cap air yang “tahan rampasan.” Philomin berkata bahawa cap air itu kini lebih tahan terhadap pemampatan dan suntingan imej lain dalam pelancaran GA.
Melompat ke wilayah yang kurang kontroversi, saya bertanya kepada Philomin sama ada AWS, seperti Google, OpenAI, dan yang lainnya, sedang mengeksplorasi penghasilan video mengingat gembira di sekeliling teknologi tersebut. Philomin tidak mengatakan bahawa AWS tidak… tetapi beliau tidak akan memberi petunjuk lebih daripada itu.
“Jelas, kami sentiasa mencari untuk melihat kemampuan baru yang diingini oleh pelanggan, dan penghasilan video pastinya timbul dalam perbincangan dengan pelanggan,” kata Philomin. “Saya ingin anda untuk terus berjerebu.”
Dalam satu berita terakhir yang berkaitan dengan Titan, AWS telah melancarkan generasi kedua model Titan Embeddingsnya, Titan Text Embeddings V2. Model ini menukarkan teks kepada perwakilan angka, yang dipanggil simpenan, untuk daya pemburu dan aplikasi personalisasi. Model Embeddings generasi pertama melakukan itu juga, tetapi AWS mendakwa bahawa Titan Text Embeddings V2 secara keseluruhan lebih cekap, berkesan dari segi kos, dan tepat.
“Apa yang dilakukan model Embeddings V2 adalah mengurangkan keseluruhan penyimpanan [yang diperlukan untuk menggunakan model] sehingga empat kali ganda sambil mengekalkan 97% ketepatan,” dakwa Philomin, “mengalahkan model-model lain yang sebanding.”
Kita akan lihat jika ujian di dunia nyata membuktikan itu.”