top of page

Yapay Zeka En Zor Matematik Sınavlarını Çözüyor, Ama Bakın Neyde Çuvallıyor!

Yapay zeka, karmaşık görevleri saniyeler içinde çözebiliyor ancak en basit işlemleri yapmakta ilginç bir şekilde zorlanıyor.



Günümüzde yapay zeka, fotoğrafları gerçeğe çok yakın şekilde oluşturabiliyor, roman yazabiliyor, karmaşık bilimsel problemleri çözüp üst düzey matematik testlerinden bile yüksek notlar alarak geçebiliyor. Fakat Edinburgh Üniversitesi'de yapılan yeni bir araştırma,yapay zekanın halen basit bir görevde çuvalladığını gözler önüne serdi: saat okumak. Nasıl oluyor da bu kadar kapsamlı bir sistem böylesine basit bir görevi yapamıyor? Araştırmacılar, yedi farklı çok modlu büyük dil modelini (MLLM) teste tabi tuttu.


Test kapsamında bu AI'lara farklı analog saat görüntüleri ve 10 yıllık takvimler gösterildi. Görev oldukça basitti: "Saat kaç?" veya "Yılın 153. günü hangi tarihe denk geliyor?" gibi sorulara yanıt vermeleri istendi. Sonuçlar ise şaşırtıcıydı...


AI Neden Zaman Kavramını Anlamakta Zorlanıyor?


AI'lar, analog saatlerde doğru zamanı tahmin etmede %25'in altında bir başarı oranı gösterdi. Romen rakamlarıyla yazılmış saatleri ve stilize edilmiş ibreleri okumakta güçlük çektiler. Sorun sadece sayıları görmekle değil, açılar ve konumlar arasındaki ilişkiyi anlamakta da yatıyordu. GPT-o1 modeli, takvim testlerinde bir tık daha iyi bir performans gösterdi.


Araştırmacı Rohit Saxena şu açıklamada bulundu:


Çoğu insan küçük yaşlardan itibaren saat okumayı ve takvim kullanmayı öğreniyor. AI’ın bu kadar temel bir beceride başarısız olması, onun gerçek dünyaya entegrasyonunda ciddi bir açık olduğunu gösteriyor.

Edinburgh Üniversitesi'nde araştırmayı yürüten ekibe göre, zaman kavramını anlayamayan bir AI, günlük hayatta büyük sorunlar çıkarabilir.




Comments


bottom of page