Tag Archives: Machine Learning

Machine Learning in Action : เริ่มต้นด้วยเกมเล็กๆอย่าง Tic Tac Toe

มีไอเดียอยากลองทำเกมง่ายๆ ที่สามารถเรียนรู้ หรือพัฒนาตนเองได้ด้วยประสบการณ์ที่ตัวมันได้พบเจอมา ซึ่งมันก็มีหลายเทคนิคที่มีใช้กันอยู่ และที่เห็นว่าน่าสนใจก็เป็น Q-Learning และ Minimax ทั้งสองเทคนิคล้วนแล้วแต่เป็น State–Action–Reward–State คือ เริ่มต้นคิดจาก State ปัจจุบัน เพื่อหา Action และประเมินผลเป็น Reward จาก State อีกที ซึ่งเหมาะสมมากที่จะนำมาใช้ในระบบเกม ส่วนเกมที่สนใจจะนำมาทดลองนั้น ก็เป็นเกมง่ายๆ อย่างเกม Tic Tac Toe ที่มีรูปแบบไม่เยอะมากนัก กฎกติกาไม่ซับซ้อน และเป็นการแข่งขันกันของสองผู้เล่น ทำให้ระบบสามารถเรียนรู้ หรือเลียนแบบ วิธีการเล่นของฝั่งตรงข้ามได้โดยง่าย ผ่าน State ที่ได้บันทึกไว้ก่อนหน้านี้เท่านั้นเอง ข้อเสียของวิธีการใช้ State แบบนี้คือ รูปแบบในการเล่นมักจะถูกจำกัดอยู่เฉพาะจากประสบการณ์ที่ผ่านมาเท่านั้น แม้จะเป็นการเลือกวิธีการเล่นที่ดีที่สุด แต่ก็จะดีที่สุดเท่าที่รู้อยู่เท่านั้น ดังนั้นถ้าประสบการณ์ของมันเต็มไปด้วยวิธีการที่ไม่มีคุณภาพ หรือไร้ประสิทธิภาพแล้ว

“หมากล้อม” เกมกระดานที่ได้ชื่อว่าซับซ้อนที่สุดได้ถูก AI พิชิตอย่างสมบูรณ์

หลังจาก AlphaGo มีชัยเหนือ Lee Sedol นักเล่นหมากล้อมมืออัน 4 ของโลก 4-1 เกม ในการแข่งขันเมื่อเดือนมีนาคมปีที่แล้ว AlphaGo ก็มีข่าวความท้าทายใหม่ๆ ออกมาเป็นระยะ ไม่ว่าจะเป็นการเตรียมตัวเรียนรู้เพื่อลงสู่สนามของเกมวางแผนระดับตำนานอย่าง Starcraft และมีส่วนพัวพันกับนักเล่นหมากล้อมบนอินเตอร์เน็ตผู้ลึกลับ ที่สร้างความสะเทือนในโลกของนักเล่นหมากล้อมบนอินเตอร์เน็ตในช่วงหยุดยาวปีใหม่ที่ผ่านมา วันนี้ก็ถึงเวลาของ Ke Jie นักเล่นหมากล้อมมือวางอันดับหนึ่งของโลกคนปัจจุบัน พฤษภาคมปี 1997 ชัยชนะของ Deep Blue ที่ถูกพัฒนาโดย IBM ที่มีต่อแกรี คาสปารอฟ ( Garry Kimovich Kasparov ) แชมป์หมากรุกโลกในเวลานั้น ด้วยคะแนน 3-1/2 ต่อ 2-1/2 และเป็นคอมพิวเตอร์เครื่องแรกที่สามารถเอาชนะแชมป์หมากรุกโลกได้สำเร็จ แต่ก็มีข้อกังขามากมาย ทำให้ในวันนั้นแม้ว่าแชมป์หมากรุกโลกจะแพ้ แต่ผู้คนยังไม่ได้รู้สึกถึงความมหัศจรรย์ของสิ่งที่เกิดขึ้นมากนัก เนื่องจากกลไกของหมากรุก