Aplikasi.ac.id –
Alibaba baru saja merilis model AI terbaru bernama Qwen 2.5 Omni. Model ini termasuk dalam keluarga Qwen 2.5 dan diklaim sebagai model multimodal tingkat atas. Keunggulannya adalah mampu memproses berbagai jenis input seperti teks, gambar, audio, dan video, serta menghasilkan respons suara secara real-time.
Salah satu fitur utama dari Qwen 2.5 Omni adalah kemampuannya untuk berinteraksi dalam bentuk percakapan video dan suara yang alami. Saat ini, fitur semacam ini hanya tersedia di model milik Google dan OpenAI yang bersifat tertutup. Berbeda dari mereka, Alibaba memilih untuk membuka akses ke teknologi AI-nya tersebut.
Raksaa teknologi asal Tiongkok ini juga memperkenalkan arsitektur baru yang disebut “Thinker-Talker.” Thinker berperan sebagai otak yang memproses dan memahami berbagai input, kemudian menghasilkan teks. Sementara itu, Talker bertindak seperti mulut yang menyampaikan informasi dari Thinker dalam bentuk suara yang luwes.
Dengan pendekatan ini, Qwen 2.5 Omni bisa melakukan pelatihan dan inferensi secara menyeluruh dalam satu model. Kemampuannya dalam memahami dan merespons perintah suara disebut lebih unggul dibandingkan model sebelumnya, termasuk Qwen 2.5-VL-7B dan Qwen2-Audio.
Dalam uji coba internal, model ini diklaim lebih baik dari Gemini 1.5 Pro pada hasil benchmark OmniBench. Alibaba telah Qwen 2.5 Omni di platform AI open-soruce seperti Hugging Face dan GitHub, sementara mereka juga membuka akses bagi pengguna untuk mencoba langsung melalui chatbot Qwen Chat dan ModelScope.
Artikel ini Rangkuman Dari Berita : https://www.jagatreview.com/2025/03/alibaba-rilis-model-ai-qwen-2-5-omni/