Menciptakan Kecerdasan Buatan: DeepZind's AlphaZero

11 Mei 1997, hari khusus untuk Inteligensi Buatan. Itu pada hari itu bahwa untuk pertama kalinya sebuah program komputer bernama Deep Blue mampu mengalahkan juara dunia catur di bawah kondisi turnamen.

Banyak yang telah berubah untuk AI sejak saat itu, dengan cara yang baik. Beberapa tahun terakhir telah menikmati langkah besar dan terobosan dalam penelitian AI. Mesin menjadi lebih cerdas dan, yang lebih penting, melalui semua penelitian ini kita mulai mendapatkan pemahaman yang lebih jelas tentang apa sebenarnya kecerdasan manusia. Hanya dengan pemahaman konkret tentang kecerdasan kita dapat benar-benar membangun mesin cerdas.

DeepMind telah berada di garis depan revolusi AI.

DeepMind

DeepMind Technologies adalah perusahaan Inteligensi Buatan Inggris. Pada 2014 mereka dibeli oleh Google karena keahlian mereka yang terkemuka di dunia dalam AI. Sejak mereka pertama kali memulai, mereka telah mengambil celah paling ambisius di dunia dalam memecahkan AI.

Kreasi terbaru mereka juga yang paling mengesankan: AlphaZero

AlphaZero adalah sistem AI yang belajar sendiri, dari awal, cara menguasai permainan catur, shogi (catur Jepang), dan Go. Untuk membuktikan keunggulan AlphaZero, itu dicocokkan dengan juara dunia di setiap pertandingan. AlphaZero muncul sebagai pemenang.

Game dan Kecerdasan

Dalam upaya membangun mesin cerdas, para peneliti ditantang untuk pertama-tama menjawab apa sebenarnya kecerdasan itu. Itu bukan pertanyaan langsung untuk dijawab!

Apa yang Anda pikirkan ketika seseorang meminta Anda untuk mendefinisikan kecerdasan? Orang mungkin membayangkan seseorang yang mereka pikir cerdas. Mereka tahu hal-hal yang tidak dimiliki orang lain. Tetapi bahkan lebih dari itu, mereka dapat menggunakan pengetahuan itu dalam bentuk semacam keterampilan untuk mencapai suatu tujuan.

Tujuan biasanya adalah sesuatu yang agak sulit untuk dicapai. Itu harus membutuhkan pengetahuan, keterampilan, atau pemahaman yang lebih dalam: kecerdasan.

Kemampuan untuk bermain dan memenangkan permainan adalah bentuk kecerdasan. Game memiliki aturan dan tujuan. Semua pemain bermain dengan aturan yang sama dan berusaha mencapai hal yang sama: menangkan permainan. Menang membutuhkan pengetahuan tentang cara memainkan permainan dan cara menggunakan pengetahuan itu sedemikian rupa untuk mengalahkan lawan Anda.

Persyaratan pengetahuan yang sangat terspesialisasi dan canggih ini untuk bisa menang adalah alasan mengapa board game telah lama digunakan sebagai test-bed untuk sistem AI. Jika kita ingin sistem kita dapat memenangkan permainan catur tidak hanya melawan seorang amatir tetapi juga melawan yang terbaik di dunia, seorang grandmaster, maka sistem itu lebih tahu banyak tentang catur! Perlu melihat banyak gerakan ke depan, memahami posisi papan, keuntungan masing-masing pemain, dan untuk memiliki pemahaman yang lebih dalam dan intuisi dari permainan itu sendiri daripada lawannya. Perlu cerdas.

Kasparov vs Deep Blue (kiri) dan Sedol vs AlphaGo (kanan)Catur dan Pergi

Catur telah menjadi permainan utama studi untuk AI sampai tak lama setelah Deep Blue mengalahkan Gary Kasparov. Mesin catur, program komputer yang dirancang agar benar-benar hebat dalam catur, menjadi populer beberapa tahun kemudian dan sekarang dapat ditemukan di hampir setiap komputer dan permainan catur ponsel yang dapat Anda temukan! Jadi, sementara sistem AI masih mengacu pada permainan catur demi ketelitian, para peneliti telah pindah ke menciptakan sistem yang bisa menang di permainan yang lebih menantang: Pergi.

Go adalah permainan strategi lain di mana tujuannya adalah untuk mengelilingi lebih banyak wilayah daripada lawan. Kedengarannya sederhana, tetapi kedalaman pemikirannya bisa dibilang jauh lebih dari catur. Hanya untuk perbandingan sederhana untuk melihat perbedaan dalam kompleksitas, Catur dimainkan pada papan 8x8 = 64 kotak sedangkan Go dimainkan pada kotak 19x19 dengan 361 persimpangan (titik di mana Anda dapat bermain)! Jumlah gerakan yang mungkin di Go jauh lebih tinggi daripada catur.

Kerumitan yang sangat besar inilah yang menyebabkan para peneliti memilih untuk mengikuti permainan Go bergerak maju. Jika sistem AI dapat dibangun untuk mengalahkan juara dunia dalam permainan yang kompleks seperti Go, maka ia harus memiliki beberapa bentuk kecerdasan. Paling tidak itu bisa memberi kita petunjuk dalam menemukan dari mana alasan dan intuisi yang diperlukan kecerdasan berasal.

AlphaZero: Mesin yang Cerdas

Di masa lalu, sistem AI dirancang untuk satu game tertentu, sehingga Anda tidak dapat menggunakan sistem AI yang sama yang Anda buat untuk catur untuk game Go. Tapi AlphaZero bukan kuda poni satu trik! AlphaZero adalah sistem AI generik yang secara teori dapat belajar bermain dan menang di level profesional di banyak gim. Sejauh ini, ia telah membuktikan dirinya dalam permainan Catur, Shogi, dan Go, semuanya menggunakan algoritma yang sama.

Penggambaran AlphaZero AI, milik DeepMind

Terobosan paling menarik yang dilakukan AlphaZero adalah pembelajaran luar biasa dengan bermain sendiri. Anda tahu, untuk berlatih permainan catur, shogi, dan Go, AlphaZero tidak bermain melawan lawan manusia yang sebenarnya. Itu belajar semua keterampilannya dengan bermain melawan dirinya sendiri, tanpa pengetahuan yang diberikan tetapi aturan dasar permainan.

Agar AlphaZero mempelajari setiap game, jaringan saraf akan memainkan jutaan game melawan dirinya sendiri. Karena ini dimulai tanpa pengetahuan tentang apa permainan dan strategi yang baik, itu akan melalui banyak fase coba-coba untuk memulai, bermain cukup acak. Tetapi, seiring berjalannya permainan, proses penguatan pembelajaran mendorong sistem untuk memainkan lebih banyak gerakan "positif" dan menghindari yang "negatif".

Pembelajaran penguatan AI didasarkan pada sistem penghargaan. AI akan menerima semacam skor hadiah positif untuk memenangkan permainan dan negatif untuk kekalahan. Seiring waktu, sistem akan belajar untuk memaksimalkan nilainya.

Mengamati permainan yang dimainkan Alpha Zero setelah sepenuhnya terlatih, para juara dunia dari semua pertandingan menemukan bahwa AlphaZero berhasil mempelajari strategi konvensional dari permainan yang biasa dimainkan oleh para grandmaster. Sebagai contoh, AlphaZero sering memainkan strategi pembukaan catur yang paling umum dan menunjukkan keterampilan berpengalaman dalam mempertahankan Raja seperti seorang profesional.

Tetapi hal yang benar-benar istimewa tentang Alpha Zero bukanlah mengetahui apa yang diketahui oleh juara lain, tetapi mengetahui apa yang tidak mereka ketahui. Melalui permainannya sendiri, Alpha Zero tidak terbatas hanya bermain melawan apa yang bisa dipikirkan manusia. Itu memiliki fleksibilitas untuk memainkan setiap gerakan yang mungkin, membuka pembelajarannya untuk permainan tidak konvensional dan strategi yang belum pernah dilihat sebelumnya.

"Beberapa gerakannya, seperti memindahkan Raja ke tengah papan, bertentangan dengan teori shogi dan - dari sudut pandang manusia - tampaknya menempatkan AlphaZero dalam posisi berbahaya. Tapi luar biasa itu tetap di kontrol papan. Gaya bermainnya yang unik menunjukkan kepada kita bahwa ada kemungkinan baru untuk permainan. “
- Yoshiharu Habu, profesional 9-dan, satu-satunya pemain dalam sejarah yang memegang semua tujuh gelar shogi utama

Keterampilan semacam itu dilihat oleh para ahli sebagai kreatif, sesuatu yang akan membutuhkan tingkat pengetahuan dan keterampilan yang super manusiawi: kecerdasan. Untuk membuat sistem cerdas yang mampu memecahkan berbagai masalah dunia nyata, mereka perlu dirancang sedemikian rupa sehingga mereka memiliki pemahaman yang baik tentang aturan, tetapi juga cukup fleksibel untuk melakukan eksplorasi mereka sendiri. Mereka juga harus bisa menjadi terampil dalam banyak hal yang berbeda dan tidak dikunci dalam satu permainan.

AlphaZero menunjukkan beberapa tanda awal itu. Ini menunjukkan bahwa algoritma tunggal dapat belajar bagaimana memahami pengetahuan saat ini, dan kemudian mendorong lebih dari itu. Ini adalah langkah ke arah yang benar untuk menciptakan kecerdasan.

Jika Anda ingin mempelajari lebih lanjut tentang AlphaZero, Anda dapat membaca posting blog DeepMind atau makalah penelitian mereka yang diterbitkan dalam Science Journal.

Ingin belajar?

Ikuti saya di twitter tempat saya memposting semua tentang AI, Teknologi, dan Sains terbaru dan terhebat!