Türk mühendisler tarafından geliştirilen yerli büyük dil modeli “Kumru”, resmen kullanıma açıldı. Türkçeyi doğal biçimde anlayıp üretebilen yapay zeka modeli, hem akademik hem de kamuya açık alanlarda kullanılabilecek.
VNGRS adlı teknoloji şirketi tarafından geliştirilen Kumru, Türkçe dil yapısına özel olarak eğitilen ilk büyük dil modeli olma özelliği taşıyor. Model, yalnızca güçlü sunucularda değil, 16 GB ekran kartına sahip kişisel bilgisayarlarda dahi çalışabiliyor.
Yapay zekanın 7,4 milyar parametreli sürümü olan Kumru-7B, özellikle metin özetleme, soru-cevap ve doğal dil üretimi konularında yüksek performans gösteriyor.
Ayrıca 2 milyar parametreye sahip daha hafif sürümü Kumru-2B, açık kaynak olarak yayımlandı ve Hugging Face platformu üzerinden ücretsiz erişime açıldı.
Geliştirici ekip, modelin eğitiminde 500 GB’lık veri seti ve yaklaşık 300 milyar kelimelik bir Türkçe metin havuzu kullandıklarını belirtti. Böylece Kumru’nun, Türkçenin deyimsel ifadelerini ve kültürel bağlamını daha doğru anlaması hedeflendi.
Yapay zeka modeli, Meta’nın LLaMA-3 mimarisi temel alınarak geliştirildi; ancak tamamen yerli verilerle yeniden eğitildi.
Kumru’nun Öne Çıkan Özellikleri
- Türkçe odaklı büyük dil modeli
- 7,4 milyar parametreli sürüm (Kumru-7B)
- 16 GB GPU’da çalışabilme
- 2 milyar parametreli açık kaynak sürüm (Kumru-2B)
- 500 GB veri setiyle eğitildi
- Hugging Face platformu üzerinden erişilebilir.
Uzmanlara göre Kumru, ChatGPT ve benzeri yabancı modellerin Türkçe başarısına alternatif oluşturabilecek bir adım.
Ancak modelin başarısının, kullanım deneyimleriyle birlikte daha net ölçüleceği belirtiliyor.
Kumru’nun önümüzdeki dönemde kamu kurumları, eğitim ve medya alanlarında da test edilmesi bekleniyor.