Sau 20 ngày chơi tại một sòng bạc ở Pittsburgh, bang Pennsylvania, một AI được xây dựng bởi hai nhà nghiên cứu tại ĐH Carnegie Mellon đã chính thức đánh bại bốn cao thủ poker với số tiền lên đến hơn 1,7 triệu USD. Cả bốn người chơi cũng đều kết thúc cuộc chơi với số chip âm. Hai tác giả chưa chia sẻ chi tiết về cách vận hành của trí tuệ nhân tạo này.
Người chơi poker chuyên nghiệp Jason Les đang đấu trí với Libratus tại Rivers Casino, Pittsburgh, vào ngày 11/1. |
Texas Hold 'Em không giới hạn là hình thức đặc biệt phức tạp của poker, vốn phần lớn dựa vào các chiến lược cá cược dài hạn và lý thuyết trò chơi. Trong 20 năm qua, máy đã chiến thắng những người chơi cừ nhất của các bộ môn cờ caro, cờ vua, xếp chữ trí tuệ Scrabble, đố vui kiến thức Jeopardy và thậm chí cả trò cờ vây cổ xưa. Nhưng không có AI nào từng đánh bại con người trong một trò chơi cực đoan với "thông tin không hoàn hảo", một trò chơi phụ thuộc phần lớn vào yếu tố ẩn như các lá bài đang úp trên mặt bàn, đòi hỏi mức độ nhất định của trực giác, chưa kể đến may mắn.
Libratus, tiếng Latin nghĩa là "cân bằng", được thiết kế và lập trình bởi GS. Tuomas Sandholm và nghiên cứu sinh Noam Brown của Carnegie Mellon, một đại học tư thục ở Pittsburgh, bang Pennsylvania. Gần hai năm trước đây, bộ đôi đã thách thức một số tay chơi hàng đầu và bị thua cuộc. Nhưng lần này, họ thắng đậm sau 20 ngày thi đấu với thất bại của cả bốn người chơi.
"Đúng, poker chỉ là một trò chơi. Nhưng lý thuyết trò chơi giúp Libratus chiến thắng có thể được vận dụng trong kinh doanh, bán đấu giá đến các cuộc đàm phán chính trị", GS. Michael Wellman, ĐH Michigan, chuyên gia về lý thuyết trò chơi, nhận định.
Trong trò chơi Texas Hold 'Em không giới hạn, người chơi không nhất thiết phải cố gắng để giành chiến thắng ở mỗi ván bài nhỏ mà phải cân não để thắng được nhiều tiền nhất. Điều đó đồng nghĩa với việc phải phát triển chiến lược cá cược để có thể trụ lại qua hàng chục ván và giành chiến thắng. Một máy tính có thể làm chủ trò chơi này phải có khả năng bắt chước, mô phỏng trực giác của con người mà các chiến lược này đòi hỏi.
Những người chơi bại trận bởi máy tính cho biết AI Libratus rất giỏi gọi bài. Nó biết khi nào nên lừa gạt, hay khi nào nên đặt cược thấp với những quân bài cực tốt, cũng như khi nào nên thay đổi cách đặt cược để thoát khỏi cuộc đấu bài.
Chiến thắng của Libratus được ĐH Carnegie Mellon đánh giá là sự kiện lịch sử. Trong ảnh, tác giả của AI đang theo dõi diễn tiến các ván bài. |
Cho đến nay, GS. Sandholm vẫn ngần ngại chia sẻ cách thức hoạt động của Libratus nhưng ông hứa sẽ làm sáng tỏ chi tiết trong những ngày tới.
Bốn người chơi gồm McAulay, Kim Dong, Jason Les và Jimmy Chou tin rằng lối chơi của máy đã thay đổi và phát triển từng ngày. Khi họ tìm thấy một lỗ hổng nào trong cách chơi của máy thì điểm yếu đó cũng rất nhanh chóng được đóng lại. "Nó dường như học hỏi được cách chúng tôi chơi và khai thác nó", Mc Aulay nói.
Sandholm và Brown có thể đã nghiên cứu để thay đổi hành vi của cỗ máy từ ngày này sang ngày khác, như họ đã từng làm với phiên bản Claudiro hai năm trước. Nhưng AI này cũng có thể đã học từ chính những trận đấu khi nó đang diễn ra.
Ngọc Dung (theo Weird)
Ý kiến
()