Şimdi Ara

AlphaGo algortiması kullanarak Python ile Hedef 4 oyunu geliştirme

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
4
Cevap
0
Favori
712
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • Biliyorsunuz 2016 Mart ayında Google'a ait DeepMind AlphaGo AI programı 18 yılın dünya şampiyonu Lee Sedol'u go oyununda yenmişti.

    AlphaGo'yu geliştiren ekip 2017'nin Ekim ayında bir makale yayımladı. AlphaGo algoritmasını geliştirip adına AlphaGo Zero adını verdi. Zero, yani Sıfır'ın anlamı şu: Yeni algoritma hiç bir go oyuncusunun deneyimine ihtiyaç duymadan, sıfır deneyimle ve sadece kendi kendine 72 saat oynayarak önceki algoritma olan AlphaGo'yu 100-0 yenebiliyor.

    Aynı ekip Aralık 2017'de yeni bir makale yayımladı. Yeni algoritmanın adı AlphaZero. Ekip AlphaGo Zero'dan neden Go'yu sildiğini makalede açıklıyor. Yeni algoritmayı öyle bir genelleştirmişler ki, yeni algoritma, zar atma gibi içinde belirsizlik olmayan her tür oyunu go oyununda olduğu gibi sıfırdan ve kendi kendine öğrenebiliyor ve o oyunda dünyanın en iyisi olabiliyor. Örneğin AlphaZero'ya satranç kuralları verilirse, sadece kendi kendine oynayarak satranç dünya şampiyonu StockFish programını; Japon satrancı olan shogi kuralları verilirse, sadece kendi kendine oynayarak shogi dünya şampiyonu Elmo programını yenebiliyor. Üstelik öğrenme süresi 24 saatten kısa.

    Bir üniversite kuruluşu olan Applied Data Science firması büyük bir iyilik yapıp AlphaZero algoritmasını Python ve Keras kullanarak Hedef 4 oyununa uyarlamış. Hedef 4 nedir derseniz: AlphaGo algortiması kullanarak Python ile Hedef 4 oyunu geliştirme

    İşin güzel yanı kodları inceleyip çalıştırmakla kalmayıp, başka oyunlara da uyarlayabilirsiniz. game.py kısmı Hedef 4'ün kurallarını tanımlıyor. Bu kuralları başka bir oyunun kurallarıyla değiştirerek kendi oyununuza AlphaZero algoritması yüklemek mümkün.

    Ancak tahmin edeceğiniz üzere oyunun eğitilmesi çok güçlü bilgisayar kaynağı gerektiriyor. Bu amaçla bulut ortamındaki kaynakları araştırmak lazım. Aksi halde evdeki bilgisayarda eğitimin haftalarca sürmesi mümkün.
    https://medium.com/applied-data-science/how-to-build-your-own-alphazero-ai-using-python-and-keras-7f664945c188
    https://medium.com/applied-data-science/alphago-zero-explained-in-one-diagram-365f5abf67e0

    AlphaGo algortiması kullanarak Python ile Hedef 4 oyunu geliştirme

    Ben de Python'ı ve algoritmaları yeni öğrenen biri olarak, uygulamayı çalıştırabilecek bir platform araştırıyorum.



    < Bu mesaj bu kişi tarafından değiştirildi Bahadir.Gurel -- 8 Ocak 2019; 15:33:35 >







  • quote:

    Orijinalden alıntı: requizm

    Github linkini atayım:
    https://github.com/AppliedDataSciencePartners/DeepReinforcementLearning
    Bir konuyu atlamışım. Bendeki Python 3.7.2

    sitede paylaşılan kodlar 3.7.2 ile uyumlu değil. 3.6.4 ve sonrası için uyumlu kodların adresi şu:https://github.com/jdori/DeepReinforcementLearning




  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.