Amazon telah mengumumkan rangkaian model kecerdasan buatan frontier baru—dan cara baru bagi pelanggan untuk membangun model frontier mereka sendiri.

Raksasa ecommerce ini mengumumkan generasi kedua model Nova AI-nya di re:Invent, sebuah konferensi perusahaan yang diadakan di Las Vegas. Model-model tersebut tidak sepopuler model-model yang ditawarkan oleh pesaingnya seperti OpenAI dan Google, namun rencana Amazon untuk membuat model-model tersebut dapat disesuaikan dapat membuat model-model tersebut mendapatkan daya tarik di kalangan pengguna cloud-nya.

Amazon merinci dua model bahasa besar yang ditingkatkan, Nova Lite dan Nova Pro, model suara real-time baru yang disebut Nova Sonic, dan model yang lebih eksperimental disebut Nova Omni yang melakukan jenis simulasi penalaran menggunakan gambar, audio, dan video serta teks. Model-model baru saat ini tersedia untuk sejumlah pelanggan terbatas.

Lebih penting lagi, mengingat pentingnya bisnis cloud-nya, Amazon merilis alat bernama Nova Forge yang memungkinkan pelanggan membuat model perbatasan khusus dengan menambahkan data pelatihan mereka sendiri ke versi model Nova 2 Lite dan Pro yang belum selesai.

Model AI yang tersedia seperti Gemini dari Google dan GPT OpenAI sudah dapat disempurnakan. Namun pendekatan Amazon memungkinkan pelanggan menambahkan data pada berbagai tahap pelatihan model, termasuk proses pembuatan model dasar, sebuah tahap yang dikenal sebagai prapelatihan khusus yang biasanya disediakan untuk laboratorium AI besar.

“Semua orang mencari model terdepan yang ahli di bidangnya,” Rohit Prasad, yang memimpin upaya AI Amazon, mengatakan kepada WIRED sebelum pengumuman hari ini. Prasad mengatakan bahwa Amazon mengembangkan teknologi di balik Nova Forge untuk memberdayakan tim internal, termasuk mereka yang mengembangkan agen Alexa dan AI untuk membangun model khusus. “Ini pada dasarnya adalah paradigma pelatihan terbuka yang baru,” katanya.

Salah satu pelanggan yang telah menguji pendekatan ini adalah Reddit, yang menggunakan Nova Forge untuk membuat model khusus guna mengidentifikasi konten yang melanggar aturan platform.

Menyempurnakan model konvensional tidak akan berhasil, kata kepala teknologi Reddit, Chris Slowe, karena sebagian besar model dirancang untuk sepenuhnya menghindari konten yang menyinggung atau kekerasan, yang berarti model tersebut akan menolak menganalisis beberapa materi. Slowe mengatakan bahwa pra-pelatihan khusus, dikombinasikan dengan penyesuaian konvensional, menghasilkan model terdepan yang ahli dalam memahami dan menggunakan Reddit.

“LLM lain memahami Reddit sebagai sebuah konsep, dan cara kerja Reddit, tetapi mereka tidak ketinggalan,” kata Slowe. “Kami benar-benar membangun model ahli Reddit.”