Microsoft memperkenalkan model kecerdasan buatan (AI) terbarunya bernama Phi-3 Mini pada Selasa (23/4/2024). Model ini menjadi model bahasa kecil (small language model/SLM) pertama dari tiga SLM yang rencananya dirilis Microsoft dalam beberapa bulan ke depan, dan dirancang untuk perangkat berukuran kecil seperti smartphone.
Phi-3 Mini dilatih dengan jumlah parameter yang lebih sedikit dibanding model bahasa besar (large language model/LLM). Model ini menggunakan sekitar 3,8 miliar parameter. Sebagai perbandingan, GPT-4 disebut dilatih dengan sekitar 1,7 triliun parameter. Parameter merujuk pada jumlah instruksi kompleks yang dapat dipahami model AI.
SLM untuk tugas lokal, LLM untuk kemampuan lebih luas
Perbedaan jumlah parameter tersebut sejalan dengan tujuan yang berbeda antara SLM dan LLM. SLM ditujukan untuk menjalankan perintah yang lebih sederhana di smartphone dan laptop secara lokal (on-device), sehingga dinilai dapat memudahkan perusahaan yang lebih kecil untuk mengadopsi AI.
Sementara itu, LLM dirancang untuk menyimulasikan kecerdasan manusia dalam cakupan yang lebih luas dan membutuhkan daya komputasi lebih besar. Konsekuensinya, penggunaan LLM umumnya lebih mahal dibanding SLM.
Sébastien Bubeck, Vice President of GenAI Research di Microsoft, mengatakan Phi-3 menawarkan penghematan biaya yang signifikan. “Phi-3 tidak hanya sedikit lebih murah, tetapi jauh lebih murah. Kita berbicara tentang perbedaan biaya 10 kali lebih murah dibandingkan model di luar sana dengan kemampuan serupa,” ujarnya.
Klaim performa: melampaui Phi-2 dan mendekati model lebih besar
Microsoft menyatakan Phi-3 mampu mengungguli performa Phi-2 yang dirilis pada Desember 2023. Perusahaan juga mengklaim Phi-3 dapat memberikan respons serupa dengan model yang 10 kali lebih besar.
Eric Boyd, Corporate Vice President Microsoft Azure AI Platform, menambahkan bahwa Phi-3 Mini disebut setara kemampuannya dengan LLM seperti GPT 3.5, namun hadir dalam ukuran yang lebih kecil.
Phi-3 Small dan Phi-3 Medium menyusul
Selain Phi-3 Mini, Microsoft juga menyiapkan dua model SLM lain yang akan dirilis dalam waktu dekat, yakni Phi-3 Small dan Phi-3 Medium.
- Phi-3 Small: dilatih dengan 7 miliar parameter
- Phi-3 Medium: dilatih dengan 14 miliar parameter
Dilatih dengan pendekatan “kurikulum” ala buku anak
Boyd menjelaskan bahwa model bahasa Phi-3 dilatih menggunakan pendekatan kurikulum yang terinspirasi dari cara anak-anak belajar melalui buku cerita, yakni menggunakan kata-kata sederhana dan struktur kalimat yang membantu memahami topik yang lebih besar.
Menurut Boyd, karena jumlah buku anak-anak yang tersedia terbatas, Microsoft mengambil daftar lebih dari 3.000 kata dan meminta LLM membuat buku anak-anak untuk mengajarkan Phi. Ia juga mengatakan Phi-3 melanjutkan fondasi dari model sebelumnya: Phi-1 berfokus pada pengodean, Phi-2 mulai belajar bernalar, dan Phi-3 ditujukan agar lebih mumpuni dalam pengodean serta penalaran.
Meski demikian, Phi-3 disebut masih belum dapat menandingi kemampuan GPT-4 dan LLM lain, karena LLM dilatih menggunakan keseluruhan internet, berbeda dengan SLM yang lebih terbatas. Di sisi lain, SLM seperti Phi-3 dinilai lebih menarik bagi perusahaan kecil karena kumpulan data internal mereka cenderung lebih kecil dan biaya penggunaan SLM lebih rendah.
Ketersediaan Phi-3 Mini
Phi-3 Mini sudah tersedia secara gratis melalui platform cloud Azure, platform machine learning Hugging Face, serta Ollama, kerangka kerja untuk menjalankan model AI pada mesin lokal. Model ini juga akan tersedia di software Nvidia Inference Microservices (NIM) dan telah dioptimalkan untuk unit pengolah grafis (GPU) Nvidia.