DünyaGenelManşet

Claude-3 vs ChatGPT-4: En iyi yapay zeka modeli

Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son zamanların en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Peki en iyi yapay zeka modeli hangisi?

Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır lider olan GPT-4’ün geride kaldığını gösteriyor.

Liderlik Tablosu, “sohbet savaşları” sırasında jüriler tarafından değerlendirildi. Farklı konulardan çeşitli komutlar girerek sohbet botlarını test eden jüriler, karşılaştırma için Elo derecelendirme sistemini kullandı.

Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla zirveye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.

Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha önceki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıca Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.

İşte en iyi yapay zeka modeli listesi:

  1. Claude 3 Opus – 1253
  2. GPT-4-1106-preview – 1251
  3. GPT-4-0125-preview – 1248
  4. Bard (Gemini Pro) – 1203
  5. Claude 3 Sonnet – 1196
  6. GPT-4-0314 – 1193
  7. Claude 3 Haiku – 1181
  8. GPT-4-0613 – 1174
  9. Mistral-Large-2402 – 1153
  10. Qwen1.5-72B-Chat – 1153

GPT-4 geçen yıl piyasaya sürüldüğünde oldukça yüksek bir standart belirlemişti. Ancak Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış gibi duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.

Diğer Haberler

Başa dön tuşu