Bilim insanları, yapay zekanın güvenliği ve aktifliğini denetim eden 445 kıymetlendirme testinde “sonuçların geçerliliğini zedeleyecek” kusurlar olduğunu tespit etti.

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de ortalarında bulunduğu 14 kurumdan 29 araştırmacı, “Önemli Olanı Ölçmek: Büyük Lisan Modeli Kıyaslamalarında Yapı Geçerliği” başlıklı bir çalışma yaptı.
Bilim insanları çalışmada, yapay zekanın alt kısımlarından olan “doğal lisan işleme” ve “makine öğrenimi” alanlarının önde gelen konferanslarından alınan 445 kıymetlendirme testini sistematik olarak inceledi.
İncelemeler sonucunda, testlerin neredeyse hepsinin “sonuçların geçerliliğini zedeleyebilecek” kusurlara sahip olduğu sonucuna ulaşıldı.
Çalışmanın baş müellifi, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ait Guardian’a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.
Bean, kıymetlendirme testlerinin yapay zekayla ilgili tüm savların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin nitekim gelişip gelişmediğini anlamanın zorlaştığını kaydetti.







Yorum Yap