Tech

Mistral's Large 2 adalah jawabannya terhadap model terbaru Meta dan OpenAI

Jaringan Pengetahuan

Tuesday, August 27 2024

Untuk model AI terdepan, ketika hujan, itu turun. Mistral merilis model unggulan terbaru pada hari Rabu, Large 2, yang diklaim setara dengan model pemotongan terbaru dari OpenAI dan Meta dalam hal penghasilan kode, matematika, dan penalaran.

Rilis Mistral Large 2 jatuh hanya sehari setelah Meta merilis model open source terbarunya, Llama 3.1 405B. Mistral mengatakan Large 2 meningkatkan kinerja dan biaya untuk model open, mendukungnya dengan sejumlah benchmark.

Large 2 tampaknya melampaui Llama 3.1 405B dalam hal penghasilan kode dan kinerja matematika, dan melakukannya dengan kurang dari sepertiga parameter: 123 miliar, untuk lebih tepatnya.

Dalam rilis pers, Mistral mengatakan salah satu fokus utama selama pelatihan adalah untuk meminimalkan isu halusinasi model. Perusahaan mengatakan Large 2 dilatih untuk lebih teliti dalam responnya, mengakui ketika tidak tahu sesuatu daripada membuat sesuatu yang tampak masuk akal.

Startup AI berbasis Paris baru-baru ini mengumpulkan $640 juta dalam putaran pendanaan Seri B, dipimpin oleh General Catalyst, dengan valuasi $6 miliar. Meskipun Mistral adalah salah satu peserta terbaru dalam ruang kecerdasan buatan, ia dengan cepat mengirimkan model AI di dekat atau di sekitar tepi potong.

Namun, penting untuk dicatat bahwa model Mistral, seperti kebanyakan yang lain, tidak open source dalam arti tradisional - setiap aplikasi komersial model memerlukan lisensi berbayar. Dan meskipun lebih terbuka daripada, katakanlah, GPT-4o, sedikit orang di dunia memiliki keahlian dan infrastruktur untuk mengimplementasikan model yang begitu besar. (Ini berlaku ganda untuk 405 miliar parameter Llama, tentu saja.)

Sesuatu yang hilang dari Mistral Large 2, dan tidak ada dalam rilis Llama 3.1 Meta kemarin, adalah kemampuan multimodal. OpenAI jauh di depan persaingan dalam hal sistem AI multimodal, yang mampu memproses gambar dan teks secara bersamaan, fitur yang beberapa startup semakin ingin bangun.

Model ini memiliki jendela token 128.000, yang berarti Large 2 dapat mengambil banyak data dalam satu prompt (128.000 token setara dengan sekitar buku 300 halaman). Model baru Mistral juga menyertakan dukungan multibahasa yang ditingkatkan. Large 2 memahami Bahasa Inggris, Perancis, Jerman, Spanyol, Italia, Portugis, Arab, Hindi, Rusia, Tiongkok, Jepang, dan Korea, bersama dengan 80 bahasa pemrograman. Perlu dicatat, Mistral mengklaim bahwa Large 2 juga menghasilkan jawaban lebih ringkas daripada model AI terkemuka, yang cenderung berbicara panjang.

Mistral Large 2 tersedia untuk digunakan di Google Vertex AI, Amazon Bedrock, Azure AI Studio, dan IBM watsonx.ai. Anda juga dapat menggunakan model baru ini di La Plateforme Mistral dengan nama "mistral-large-2407" dan mencobanya secara gratis pada pesaing ChatGPT startup, Le Chat.

Jaringan Pengetahuan

RELATED ARTICLES

Dengan Pendanaan Baru Sebesar $50 Juta, You.com Yakin Kecerdasan Buatan Mereka Dapat Mengalahkan Google dalam Pertanyaan Sulit

Apa yang kami dapatkan?", jurnalis bertanya saat publikasi menandatangani kesepakatan konten dengan perusahaan AI

AI baru dari DeepMind menciptakan musik latar dan dialog untuk video