#dil modeli

1 gönderi

Gemma 4

Deneme fırsatı bulduğum LLM. Gemma 3'ün sıçıp batırdığı yerlerde, mesela reasoning gibi, gayet güzel yanıt veriyor. Ayrıca Türkçe'ye hakimiyeti de güzel. Diğer modeller neyin küfür olup olmadığını bile zar zor anlarken bu küfür kalıplarını falan bile tanıyor. Üstelik denediğim model 7.5b parametreli olanı. Google'ın dediğine göre bu modelleri eğitirken gemini üzerinde öğrendikleri deneyimleri kullanarak sadece gerekli ve anlamlı şeyler kullanmışlar. Böylece gereksiz şeylerle dolmamış, kiloda hafif, zekası mermi gibi nokta atışı çalışabilen modeller mümkün olabilmiş. Bu modellerin akıllı telefonların GPU'sunda bile koşacak kadar hafif olduğunu iddia ediyorlar. Amaçları da zaten işlem gücü zayıf cihazlara bile zeka kazandırmakmış. Bu modeller ayrıca ses tanıma, görüntü tanıma gidi yeteneklere de sahipler ve 140 dilde eğitilmişler ve geniş bir bağlam penceresine sahip. 128k ile 256k token arasında hatırlama gücüne sahipler. Ayrıca büyük dil modelleri kadar gelişmiş kod yazma yeteneğine de sahipmiş. JSON çıktı üretebilmesi için de ince ayar yapmışlar. JSON çıktı almayı denemiştim, öyle strict bir JSON prompt falan girmenize gerek kalmadan konuşma diliyle bile verdiğiniz prompt'ta bahsettiğiniz JSON yapısına birebir uyumlu ve her seferinde aynı yapıyı koruyan yanıtlar veriyor. Agentic yetenekleri çok sağlam. Google'ın bu ufak modellerini yerel makinemizde koşturarak neredeyse büyük LLM'lere kafa tutar hale geldik gibi bir şey. Beğendim. #yapay_zeka #llm #gemma_4 #dil_modeli #yazılım
Gemma 4