Botların Veri Kazıması ve Telif Hakkı

22/06/2024

Engelleri Görmezden Geliyor Veya Aşıyorlar...

08:13:26

OpenAI ve Anthropic, Botların Çevrimiçi İçeriği Kazımasını Engelleyen Yerleşik Bir Kuralı Görmezden Geliyor

Görünüşe göre, dünyanın en büyük iki yapay zekâ girişimi, medya yayımcılarının ücretsiz model eğitim verileri için web içeriklerini kazımayı durdurma taleplerini görmezden geliyor. OpenAI ve Anthropic‘in, web sitelerinin otomatik olarak kazınmasını engelleyen robots.txt adlı yerleşik bir web kuralını ya görmezden geldikleri ya da atlattıkları tespit edildi…

Yayımcılar ve YZ şirketleri arasında ücretli lisans anlaşmalarına aracılık etmeyi amaçlayan bir girişim olan TollBit, birkaç YZ şirketinin bu şekilde hareket ettiğini tespit etti ve Reuters tarafından daha önce bildirilen Cuma günkü bir mektupla bazı büyük yayımcıları bilgilendirdi. Mektupta, kuralı ihlal etmekle suçlanan YZ şirketlerinden herhangi birinin adı yer almadı.

OpenAI ve Anthropic, robots.txt’ye saygı duyduklarını ve GPTBot ve ClaudeBot adlı özel web tarayıcılarını engellediklerini kamuoyuna açıkladılar.

Ancak TollBit‘in bulgularına göre, iddia edildiği gibi bu tür engellemelere uyulmuyor. OpenAI ve Anthropic de dahil olmak üzere yapay zekâ şirketleri, belirli bir web sitesi veya sayfadaki tüm içeriği almak veya kazımak için robots.txt’yi “atlamayı" tercih ediyor.

OpenAI sözcüsü, BI‘yı Mayıs ayında yayımlanan ve şirketin “yeni bir modeli her eğittiğimizde web tarayıcısı izinlerini dikkate aldığını" söylediği kurumsal bir blog gönderisine işaret etmenin ötesinde yorum yapmayı reddetti. Anthropic‘in sözcüsü ise yorum isteyen e-postalara yanıt vermedi.

Robots.txt, 1990’ların sonlarından bu yana web sitelerinin bot tarayıcılara verilerinin kazınmasını ve toplanmasını istemediklerini söylemelerinin bir yolu olarak kullanılan tek bir kod parçasıdır. Web’i destekleyen gayri resmi kurallardan biri olarak yaygın bir şekilde kabul görmüştür.

Üretken yapay zekânın yükselişiyle birlikte, startup’lar ve teknoloji şirketleri en güçlü yapay zekâ modellerini oluşturmak için yarışıyor. Anahtar bileşen ise yüksek kaliteli veri. Bu tür eğitim verilerine duyulan açlık, robots.txt ve bu kodun kullanımını destekleyen gayri resmi anlaşmaların altını oydu.

OpenAI, popüler sohbet robotu ChatGPT‘nin arkasında yer alıyor. Şirketin en büyük yatırımcısı Microsoft‘tur. Anthropic, bir başka nispeten popüler chatbot olan Claude‘un arkasında. En büyük yatırımcısı Amazon‘dur.

Her iki chatbot da kullanıcı sorularına insan kıvamında yanıtlar veriyor. Bu tür yanıtlar ancak, üzerine inşa edildikleri yapay zekâ modellerinin, çoğu telif hakkı altında olan ya da başka bir şekilde üreticilere ait olan web’den kazınmış büyük miktarda yazılı metin ve veri içermesi nedeniyle mümkündür.

Geçen yıl birkaç teknoloji şirketi ABD Telif Hakkı Ofisi‘ne, yapay zekâ eğitim verileri söz konusu olduğunda web’deki hiçbir şeyin telif hakkı kapsamında değerlendirilmemesi gerektiğini savundu.

OpenAI, BI‘ın sahibi olan Axel Springer de dahil olmak üzere içeriğe erişim için yayımcılarla birkaç anlaşma yaptı. ABD Telif Hakkı Ofisi, YZ ve telif hakkı konusundaki kılavuzunu bu yıl içinde güncellemeye hazırlanıyor.

Bu içeriği beğendiyseniz lütfen çevrenizle paylaşınız…

Arşivden

Hibrit Çalışma Kalıcı1 Milyar Işık Yılı Uzaklıktaki SesYavaş İlerleyen Bir Felaketİstenmeyen Bağışıklık Tepkisi2100’de Dünyanın En Kalabalık ÜlkeleriSessiz Şimşekler Tuhaf Bir Durum Değildirİddia: Ayrılık Tohumları EkiyorAğaçlar Öksürmeye BaşladıFreskleri Onarmak İçin Bakteri YetiştiriyorYeni “007 James Bond” Kim Olacak

Etiketler: BOT, OPENAI, VERİ

Botların Veri Kazıması ve Telif Hakkı

Engelleri Görmezden Geliyor Veya Aşıyorlar...

OpenAI ve Anthropic, Botların Çevrimiçi İçeriği Kazımasını Engelleyen Yerleşik Bir Kuralı Görmezden Geliyor

Bu içeriği beğendiyseniz lütfen çevrenizle paylaşınız…

Senin İçin Tavsiye Ediliyor