Anthropic’in pek çok değerlendirmede GPT-4o’yu geride bırakan yeni modeli: Claude 3.5 Sonnet

OpenAI rakibi Anthropic, yeni yapay zeka büyük dil modeli Claude 3.5 Sonnet‘yi tanıttı. Claude 3.5 Sonnet, Mart ayında duyurulan Claude 3’ün üzerine inşa edilen 3.5 modellerinin ilk yeni serisi olarak konumlanıyor. Bununla birlikte söz konusu model hem Anthropic’in yaklaşık 3 ay önce duyurduğu Claude 3 Opus’tan hem de piyasadaki rakiplerinden daha iyi performans gösteriyor. 

Claude 3.5 Sonnet’nin öne çıkan yetenekleri

Şirketin paylaştığı bilgilere göre; Claude 3.5 Sonnet, Claude 3 Opus’un iki katı hızda çalışıyor. Böylece Claude 3.5 Sonnet, bağlama duyarlı müşteri desteği sağlarken, çok adımlı iş akışlarının otomatikleştirilmesi gibi karmaşık görevleri yerine getirebilir. Modelin yüksek lisans düzeyinde muhakeme olarak tercüme edebileceğimiz GPQA, lisans düzeyinde bilgi olarak tercüme edebileceğimiz MMLU ve kodlama yeterliliği olarak tercüme edebileceğimiz HumanEval değerlendirmeleri dahil olmak üzere pek çok değerlendirmede rakiplerini geride bıraktığını görüyoruz. 

Kod yazımı

Ayrıca Claude 3.5 Sonnet, sıfır atış kod değerlendirmesinde (zero-shot code evaluation) yüzde 90,2 performans gösteren OpenAI’ın GPT-4o ve yüzde 84,1 performans gösteren Google’ın Gemini 1.5 Pro‘sunu geride bırakarak yüzde 92’ye ulaştı.

Anthropic’in belirttiğine göre; uygun araçlar sağlandığında, söz konusu model, Claude 3.0’ı aşan muhakeme yetenekleriyle bağımsız olarak kod yazabilecek, düzenleyebilecek ve çalıştırabilecek. Bu sayede geliştiriciler, Claude 3.5 Sonnet ile farklı kod tabanları arasında kolayca geçiş yaparken, eski uygulamaları yeni frameworklere göre güncelleyebilecek. 

Görme modeli 

Modelde aynı zamanda Anthropic’in muhakeme için geliştirilmiş en güçlü görme modeli de yer almakta. Böylece Claude 3.5 Sonnet’nin yazılı dil ve sembolleri, anlamak ve yorumlamak için temel yeteneklere kavuştuğunu söyleyebiliriz. Model, kullanıcıların yazdığı karmaşık matematik problemleri, çizelgeler ve grafikleri hızlı bir şekilde anlayıp yanıtlayabilir. Hatta modelin kusurlu görüntülerden bile metin transkripsiyonu yapabildiğini belirtmekte fayda var. 

200 bin token’a kadar ulaşan istemleri destekleyen Claude 3.5 Sonnet, Claude 3 model ailesi ile aynı bağlam boyutuna sahip. Model, milyon girdi token’ı başına 3 dolar ve milyon çıktı token’ı başına 15 dolara mal olmakta. Şirketin paylaştığı bilgilere göre Claude 3.5 Sonnet, Claude 3 Haiku ve Claude 3 Opus modellerine kıyasla daha ideal bir seçenek olarak karşımıza çıkmakta. 

Yeni Artifacts özelliği 

Bu sürümle beraber şirket, web arayüzü Claude.ai’ın yeni özelliği Artifacts’i tanıttı. Özellik kapsamında sohbet botunun yan kısmındaki sohbet kutusuna özel bir pencere ekleniyor. Claude’dan kod, metin içeriği veya web sitesi tasarımları oluşturmasını istediğinizde, bu bölge bir çalışma alanına dönüşecek. Böylece talep ettiğiniz eylemin gerçek zamanlı bir temsilini görebilirken, bu temsili düzenleyebilecek ve geliştirebileceksiniz. 

Artifacts çalışma alanı, şu anda önizleme aşamasında. Şirket, bu çalışma alanı aracılığıyla, kullanıcıların Claude ile müşterek çalışmalar yürütmesini hedefliyor. Zira bu özellikten önce kullanıcılar, bir kod parçacığı ya da web sitesi tasarımı istediğinde, verilen kodları başka bir arayüzde ya da editöre kopyalamak durumunda kalıyordu. Bu yeni özellik, bu durumu ortadan kaldırarak kullanıcıların, model ile doğrudan etkileşime girmesini sağlıyor. 

Claude 3.5 Sonnet’ye, Claude.ai ve Claude iOS uygulaması üzerinden ücretsiz olarak erişmek mümkün. Claude Pro ve Team planlarının aboneleri ise modele daha yüksek limitlerle erişebiliyor. Buna ek olarak Anthropic uygulama programlama arayüzü, Amazon Bedrock ve Google Cloud’un Vertex AI platformu üzerinden modeli kullanabileceğinizi belirtelim. Şirket Claude 3.5 model ailesini tamamlamak için Claude 3.5 Haiku ve Claude 3.5 Opus modellerini bu yılın sonlarına doğru yayına alacağını açıkladı. 

Bir yanıt yazın