UPDATEKNO.ID – Xiaomi selama ini dikenal sebagai produsen smartphone, perangkat rumah pintar, hingga kendaraan listrik. Namun perusahaan asal China tersebut kini membuat gebrakan baru di industri kecerdasan buatan (AI) dengan memperkenalkan model AI bernama MiMo-V2.5-Pro-UltraSpeed.
Yang membuat model ini menarik bukan hanya kemampuannya, melainkan kecepatannya yang diklaim jauh melampaui sejumlah chatbot AI populer saat ini.
Berdasarkan pengujian internal, MiMo-V2.5-Pro-UltraSpeed mampu menghasilkan lebih dari 1.000 token per detik, bahkan dalam beberapa skenario kecepatannya disebut mendekati 1.200 token per detik.
Baca Juga:Â Pinterest Integrasikan Amazon Storefront, Kreator Kini Bisa Promosi Produk Lebih Mudah
Sebagai perbandingan, token merupakan unit teks yang diproses AI saat memahami maupun menghasilkan jawaban. Semakin banyak token yang dapat diproses setiap detik, semakin cepat pula AI memberikan respons kepada pengguna.
Menurut data Artificial Analysis yang dikutip Decrypt, GPT-5.5 yang menjadi dasar layanan ChatGPT memiliki kecepatan sekitar 68 token per detik. Sementara Claude Opus 4.6 berada di kisaran 71 token per detik dan Gemini Flash mampu mencapai sekitar 192 token per detik.
Jika angka yang diklaim Xiaomi tersebut terbukti dalam penggunaan nyata, MiMo berpotensi menjadi salah satu model AI tercepat yang tersedia saat ini.
Menariknya, Xiaomi tidak mengandalkan perangkat keras khusus untuk mencapai performa tersebut. Berbeda dengan perusahaan seperti Cerebras atau Groq yang mengembangkan chip khusus untuk mempercepat pemrosesan AI, Xiaomi memilih fokus pada optimasi perangkat lunak.
Xiaomi mengungkapkan bahwa MiMo-V2.5-Pro-UltraSpeed berjalan menggunakan satu server standar yang dilengkapi delapan GPU. Performa tinggi tersebut dicapai melalui kombinasi berbagai teknologi optimasi, termasuk sistem bernama TileRT yang dirancang untuk meningkatkan efisiensi pemrosesan model AI berskala besar.
Xiaomi juga menerapkan teknik FP4 Quantization, yakni metode yang memungkinkan ukuran data model diperkecil sehingga kebutuhan memori berkurang tanpa mengorbankan kualitas jawaban secara signifikan. Dengan data yang lebih ringan, model dapat bekerja lebih cepat dan efisien.
Selain itu, Xiaomi menggunakan teknologi DFlash yang memungkinkan AI memprediksi dan memproses beberapa kata sekaligus dalam satu langkah.
Pendekatan ini membuat proses generasi teks berlangsung lebih cepat dibandingkan metode tradisional yang umumnya menghasilkan kata demi kata secara berurutan.
Meski berfokus pada kecepatan, Xiaomi menegaskan bahwa MiMo bukan model AI yang diperkecil untuk mengejar performa. Model ini tetap memiliki lebih dari satu triliun parameter, jumlah yang biasanya ditemukan pada model AI kelas atas.
Parameter sendiri merupakan komponen internal yang membantu AI memahami pola data dan menghasilkan jawaban yang relevan. Semakin besar jumlah parameter, umumnya semakin kompleks pula kemampuan model tersebut dalam menyelesaikan berbagai tugas.
Xiaomi bahkan mengklaim MiMo mampu bersaing dengan model premium seperti Claude Opus dalam sejumlah pengujian pemrograman atau coding.
Kecepatan pemrosesan yang sangat tinggi membuka peluang penggunaan AI di berbagai sektor yang membutuhkan respons instan. Teknologi seperti ini dapat dimanfaatkan untuk analisis data real-time, sistem deteksi penipuan, perdagangan otomatis, hingga pengembangan agen AI yang mampu mengambil keputusan dengan lebih cepat.
Saat ini Xiaomi telah membuka akses API MiMo-V2.5-Pro-UltraSpeed untuk pengembang dan perusahaan yang ingin menguji kemampuannya.
Selain itu, sebagian teknologi yang digunakan dalam pengembangan model tersebut juga telah dirilis secara open source sehingga dapat dipelajari dan dikembangkan lebih lanjut oleh komunitas global.
Langkah ini menunjukkan ambisi Xiaomi untuk tidak hanya bersaing di pasar perangkat keras, tetapi juga menjadi pemain yang diperhitungkan dalam persaingan teknologi AI yang saat ini didominasi perusahaan-perusahaan besar seperti OpenAI, Google, Anthropic, dan Meta.
