Şimdi Ara

OpenAI, GPT-4’ü eğitmek için YouTube videolarını kullandı!

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
9
Cevap
0
Favori
334
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
5 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • OpenAI, GPT-4’ü eğitmek için YouTube videolarını kullandı!
    2021'in sonlarına doğru yapay zeka şirketi OpenAI’ın bir tedarik sorunuyla karşı karşıya kaldığı belirtiliyor. Ancak bu tedarik sorunu bir ürün olarak nitelendirilmiyor. OpenAI, son yapay zeka sistemini geliştirirken internetteki tüm saygın İngilizce metin rezervlerini tüketmişti. Teknolojisinin bir sonraki sürümünü eğitmek için daha fazla veriye ihtiyacı vardı. Aktarılanlara göre OpenAI, bu veri ihtiyacını karşılamak için YouTube videolarını kullandı.



    OpenAI, GPT-4’ün eğitiminde YouTube’u kullandı



    Geçtiğimiz Eylül 2022’de OpenAI, konuşma tanıma ve transkripsiyona yönelik yapay zeka modeli Whisper’ı tanıttı. New York Times'ın raporuna göre Whisper, YouTube videolarındaki sesleri yazıya dökerek GPT-4’ü daha akıllı hale getirecek yeni konuşma metinleri oluşturdu. OpenAI’ın Whisper’ı kullanarak 1 milyon saatten fazla videonun transkripsiyonunu yaptığı bildiriliyor. Times, OpenAI başkanı Greg Brockman'ın kullanılan videoların toplanmasında bizzat çalıştığını yazıyor.



    Bu haberin YouTube CEO'su Neal Mohan’ın geçtiğimiz günlerde verdiği bir röportajdan sonra gelmesi dikkat çekici. Mohan, röportajda OpenAI'ın yeni metinden video oluşturucusu Sora'yı eğitmek için YouTube videolarını kullandıysa bunun platformun politikalarının açık ihlali olacağını söylemişti.



    Ayrıca Bkz.YouTube, devrimsel OpenAI Sora yapay zekasının eğitimi için açıklama yaptı



    Google sözcüsü Matt Bryant, yaptığı açıklamada, Google kuralları uyarınca YouTube içeriğinin izinsiz olarak kazınması ya da indirilmesinin yasak olduğunu ve OpenAI’ın böyle bir kullanıma giriştiğinden de haberdar olmadıklarını söyledi. Öte yandan OpenAI ise bunun yasal olarak tartışmalı bir konu olduğunu ancak yine de “adil kullanım” alanına girdiğine inanıyordu. Ek olarak Google da Gemini gibi yapay zekalarını eğitmek için sınırlı YouTube içeriğini kullandığını kabul ediyor, ancak bunlar onayı alınmış içerik üreticilerin videolarını kapsıyor.



    Veri, yeni altın oldu



    OpenAI, GPT-4’ü eğitmek için YouTube videolarını kullandı!
    Veri hacmi yapay zeka konusunda en değerli faktör olarak kabul ediliyor. Bir yapay zeka modelinde kullanılan veri ne kadar çoksa dolaylı olarak modelin o kadar gelişmiş olduğu varsayılıyor. Önde gelen sohbet robotu sistemleri, üç trilyon kelimeye kadar uzanan dijital metin havuzlarından ya da 1602'den beri el yazmalarını toplayan Oxford Üniversitesi Bodleian Kütüphanesi'nde depolanan kelime sayısının yaklaşık iki katını öğrenmiş durumda.



    Wikipedia ve Reddit gibi sitelerin bulunduğu internet yıllarca sonsuz bir veri kaynağı olarak kullanıldı. Ancak yapay zeka geliştikçe, teknoloji şirketleri daha fazla veriye aç hale geldi, artık bu sitelerdeki veriler tüketildi. Her gün arama sorguları ve sosyal medya gönderileri üreten milyarlarca kullanıcısı olan Google ve Meta, gizlilik yasaları ve kendi politikaları nedeniyle yapay zeka için bu içeriğin çoğundan yararlanamıyordu. Ancak geçtiğimiz aylar ve yıllarda yapılan değişikliklerle bazı içeriklerin eğitim verisi olarak kullanılmasının önü açıldı.



    Bununla birlikte teknoloji şirketlerinin internetteki yüksek kaliteli verileri 2026 yılına kadar tüketmesi bekleniyor. Yani şirketler veriyi üretildiğinden daha hızlı kullanmaya başlıyor. Teknoloji şirketleri yeni verilere o kadar aç ki bazıları "sentetik" bilgi geliştiriyor. Sentetik verileri insanlar tarafından oluşturulan organik veriler değil, bizzat yapay zeka tarafından üretilen (ses, görsel, metin ve kodlar) verileri içeriyor. Başka bir deyişle, sistemler kendi ürettikleri verilerden öğreniyorlar.




    Kaynak:https://www.engadget.com/openai-and-google-reportedly-used-transcriptions-of-youtube-videos-to-train-their-ai-models-163531073.html
    Kaynak:https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html







  • bosuna tekel degil youtubeler googleler bi planlari var elbet 🙂

    < Bu ileti Android uygulamasından atıldı >
  • Microsoft'un ve OpenAI'ın başını fena ağrıtacak bu durum.


    Çünkü Gemini ile istediği verimi alamadı Google ve ChatGPT'ye kaptırdı o işi, Google acısını fena çıkaracaktır Microsoft'dan.

  • daha akıllı hale gelmek için deniyor peki o youtube videolarında bahsi geçenlrin gerçek kesin bilgi olduğu nereden belli? sadece kelime öğrenmekse tamam da


    politika ihlali sıkıntı, sentetik bilgi soru işareti. bu iş acayeap

  • Google v içerik üreticileri dava açmalı.hem kullanıyor hem de para vermiyor

  • Kullanıcı verisi kazırken iyi oluyordu, Google, ben mesela şunu da merak ediyorum: Çok oyunculu ağ oyunlarında yayınlar yapılıyor, o yayınlardaki diğer oyuncuların telif hakları ne alemde? Ben Steam forumunda bu soruyu sorduğumda anında engellendi.

  • lterlemez L kullanıcısına yanıt

    herhangi bir hakları yok. kayıt olurken / satın alırken onaylatıyorlar şartları.

  • Halikarnas Şakşakçısı kullanıcısına yanıt

    Oyunun yapımcısını demiyorum, Google'ı diyorum.

  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.