xAI’ın ilk çok modlu yapay zeka modeli: Grok-1.5V

Elon Musk’ın yapay zeka girişimi xAI yeni çok modlu (multimodal) yeni modelini tanıttı. Grok-1.5V olarak da bilinen Grok-1.5 Vision, Grok-1’in yeteneklerini ileri taşıyor. Grok-1.5 Vision, metinlerin yanı sıra belgeler, fotoğraflar, ekran görüntüleri, grafikler ve diyagramları da anlayabiliyor.

Kurumun paylaştığı bilgilere göre model, akıllı uzamsal-zamansal algılama yeteneklerine sahip. Model, karmaşık metinlerle mantık yürütme, bilimsel resimleri yorumlama ve görsel içerikle insan benzeri bir şekilde etkileşim kurma becerisi ile öne çıkıyor. Grok-1.5 Vision, multidisipliner muhakeme alanında uzmanlaşarak diğer modellerle rekabet ediyor.

Hatta şirketin paylaştığı bilgilere göre; Grok-1.5 Vision, şirketin gerçek dünyadaki uzamsal anlayışı ölçümlenmesi için ortaya çıkardığı RealWorldQA ölçütünde rakipleri geride bırakıyor. Karşılaştırma tablosundaki rakipler arasında Grok-1.5 Vision, GPT-4V, Claude, 3Sonnet, Claude 3 Opus ve Gemini Pro 1.5 yer alıyor. 

Grok-1.5 Vision için birbirinden farklı kullanım örnekleri paylaşılıyor. Grok-1.5 Vision, çizimleri çocuklara özel hikayelere dönüştürebiliyor, bir grup obje arasında hangi objenin en büyük obje olduğunu anlayabiliyor, bir engel etrafındaki bir aracın sürücüsüne manevra konusunda destek olabiliyor, bir tabloyu CSV formatına dönüştürebiliyor, ahşap bir masanın çürüdüğünü anlayarak bunun değiştirilmesini talep edebiliyor. Ayrıca Grok-1.5 Vision kullanıcılara internette dolaşan meme’lerin bağlamını açıklayabiliyor. 

xAI geçtiğimiz ay Grok-1 ve Grok-1.5’in matematik ve kodlama yeteneklerini bir üst seviyeye taşıyan Grok 1.5 LLM’i duyurmuştu. Grok 1.5 LLM ayrıca daha uzun bağlamları işleyebiliyordu. Böylece söz konusu büyük dil modeli yanıtlarının doğruluğunu geliştirmek için daha fazla kaynaktan veri kontrol edebiliyordu. Buna ek olarak geçen ay Elon Musk’ın yapay zekası Grok, açık kaynak olarak yayınlandı. Grok-1.5V’nin ise X’in Premium+ hizmetinden yararlananlar başta olmak üzere erken aşama test kullanıcılarına yakında açılması planlanıyor. 

Bir yanıt yazın

Share to...