SON DAKİKA
--:--:--

super yazar

Yapay zekanın en çok hangi datalardan öğrendiği ortaya çıktı

Ortalarında ChatGPT’nin de yer aldığı büyük lisan modelleri sorgulamalara yanıt verirken en çok alıntıyı yüzde 40 ile Reddit toplumsal medya platformundan yapıyor.

0 Yorum Yapıldı
Bağlantı kopyalandı!
Yapay zekanın en çok hangi datalardan öğrendiği ortaya çıktı

ChatGPT’nin ortaya çıkışı ile gündeme gelen büyük lisan modelleri daha sonra Gemini, DeepSeek, Llama ve Grok üzere farklı modellerin de piyasa sürülmesiyle günlük hayatın ayrılmaz kesimlerinden biri haline geldi.

Kullanılan büyük lisan modellerinin yetenekleri tüm dünyada ses getirirken birebir vakitte bu modellerin beslendikleri kaynakların hangileri olduğu da uzun vakittir tartışmaların odağında yer alıyor.

ChatGPT’nin de bulunduğu birçok büyük lisan modeli karşılıklarını üretirken kamuya açık internet sitelerinden yararlanıyor.

REDDİT YÜZDE 40 İLE ZİRVEDE

İstatistik portalı Statista, yapay zeka lisan modellerinin hangi kaynağı ne kadar kullandığını araştırdı. Statista’nın haziran ayında yaptığı araştırmada yılın birinci çeyreğinde büyük lisan modelleri tarafından en çok alıntılanan web siteleri ortasında tepede yüzde 40,11 ile reddit.com yer aldı.

Uzmanlara nazaran, yapay zekanın aşikâr bahisler üzerine gerçek bireylerin tartışmalarının yer aldığı Reddit platformundan alıntı yapması, yapay zeka modellerini geliştirenlerin resmi bilgilerden çok gerçek şahısların doğal konuşmalarını daha çok öncelediklerini gösteriyor.

Büyük lisan modelleri Reddit’ten sonra en çok alıntıyı yüzde 26,3 ile “internet ansiklopedisi” olarak tanımlanan Wikipedia’dan alıyor.

Yapay zekanın en çok hangi datalardan öğrendiği ortaya çıktı

Araştırmaya nazaran düzenlenmiş makaleleri kullanan Wikipedia, rastgele bir düzenleme süzgecinden geçmeyen Reddit bilgilerine nazaran bir oldukça geride kalmış gözüküyor.

Hangi lisan modelinin hangi kaynağı ne kadar sıklıkla gösterdiği belirtilen listede 3. sırada yüzde 23,5 ile Youtube, yüzde 23,2 ile Google, yüzde 21 ile yelp.com, yüzde 19,9 ile Facebook, yüzde 18,7 Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile mapbox.com ve yüzde 11,2 ile openstreetmap.com geliyor.

Google ile Reddit ortasında yapay zekayı eğitme anlaşması

Öte yandan yapay zeka modellerinin eğitilmesi ile ilgili toplumsal medya devleri ile yapay zeka üreticileri ortasında da mutabakatlar yapılıyor.

2024 yılında Google ile Reddit ortasında yapılan muahedeye nazaran, Google’ın yapay zekaları Reddit bilgileriyle de besleniyor.

Reuters’ta yer alan habere nazaran, muahede kapsamında Google, Reddit’e yıllık 60 milyon dolar ödeme yapacak. Reuters imzalı bir öbür habere nazaran Reddit, OpenAI şirketi ile ChatGPT’de kullanılmak üzere bir bilgi paylaşımı muahedesi daha yaptı.

Böylece bugün yapay zekanın verdiği karşılıklardaki Reddit tesiri yapılan mutabakatlarla da perçinlenmiş oldu.

Yorum Yap

Yazarın Diğer Yazıları
İspatlandı: Karanlık unsur, klasik fizik kurallarına uyuyor
İspatlandı: Karanlık unsur, klasik fizik kurallarına uyuyor
Barış Alper Yılmaz’ın Kariyerinde Yeni Bir Dönüm Noktası!
Barış Alper Yılmaz’ın Kariyerinde Yeni Bir Dönüm Noktası!
Nintendo Switch 2’nin satışları 10 milyonu geçti
Nintendo Switch 2’nin satışları 10 milyonu geçti
iPhone Air akabinde Huawei’den ince gövdeli Mate 70 Air
iPhone Air akabinde Huawei’den ince gövdeli Mate 70 Air
Derbi VAR Kayıtları: Kırmızı Kart Kararındaki Tartışmalar Ortaya Çıktı
Derbi VAR Kayıtları: Kırmızı Kart Kararındaki Tartışmalar Ortaya Çıktı
Sergen Yalçın’ın Kırmızı Kart Sebebi Açıklandı: Soyunma Odasında Neler Yaşandı?
Sergen Yalçın’ın Kırmızı Kart Sebebi Açıklandı: Soyunma Odasında Neler Yaşandı?

Yazarlarımız