Создатель покерного бота Claudico о будущем покера и роботостроения

Создатель покерного бота Claudico о будущем покера и роботостроения

Ноам Браун – один из создателей компьютерного робота Baby Tartanian 8, также известного как Claudico, рассказал о том, как создавался этот умнейший покерный бот, а также поделился мнением о будущем роботостроения.

Чемпионат по покеру среди компьютерных ботов проводится с 2006 года, но безлимитный Холдем стал частью программы только два года спустя. В 2008 году «BT8» рассматривал лишь четыре варианта во время игры: фолд, колл, ставку размером с пот и олл-ин. Вспоминая это, Браун рассказывает:

«Во время игры люди видят перед собой возможные комбинации карт и на основе этого принимают различные решения. Другими словами мы группируем карты в зависимости от их силы и применяем разные действия к каждой группе. Так вот в 2008 году бот распределял комбинации на ривере примерно по 500 группам. На данный момент в нашем распоряжении есть более миллиона групп».

«На последнем чемпионате мы разделили пьедестал с двумя командами, которые не имеют никакого отношения к ученым. Один из них профессиональный разработчик и игрок в покер, а другой бывший сотрудник Google. Один и другой получили по $10,000», - говорит специалист.

Однако Ноам утверждает, что даже с помощью сильнейших покерных ботов в ближайшее время вряд ли удастся разработать оптимальную выигрышную стратегию для безлимитного холдема. Такие стратегии называют «решением» и в данный момент многие считают, что некоторые разновидности покера уже «решены». Одной из таких разновидностей является лимитный холдем, но по мнению Брауна в плане решения лимитный и безлимитный холдем не имеют ничего общего.

Дуглас Полк в игре против бота Claudico

«Нельзя сравнивать лимитный и безлимитный холдем. В первом Вы делаете выбор между тремя действиями: колл, фолд и пас. Во втором у Вас есть множество вариаций. Вы можете делать ставку любого размера, а ведь каждую из них компьютер распознает как отдельное действие», - утверждает Ноам.

«При желании найти оптимальную стратегию в безлимитном холдеме, если брать программу соревнований с 20,000 фишек, Вам придется учитывать безумное количество комбинаций. Их число равняется примерно 10 в 163 степени (10 с 163 нолями). Для сравнения в лимитном холдеме число комбинаций намного меньше – 10 в 15 степени. Поэтому я считаю, что в ближайшее время безлимитный холдем не удастся «решить» никому. Конечно, будут созданы более умные компьютерные программы, с которыми не смогут даже рядом стоять нынешние звезды покера, но между этим и «решением» безлимитного холдема огромная разница», - утверждает Браун.

Далее создатель «BT8» рассказал, что многие считают покерных ботов неспособными блефовать, но это далеко не так.

«Роботы умеют блефовать, и я не считаю это удивительным. Только представьте, что боты моделируют триллионы раздач и воспринимают блеф совсем не так как мы. Попадая в похожую ситуацию несколько раз подряд робот понимает, что поставив, выиграет больше денег», - говорит он.

Естественно, у роботов также есть «ахиллесова пята». К примеру, они сильны только в играх один на один. В игре против пяти противников робот выглядит не так успешно, как в хедс апе, однако, по словам Брауна, эта проблема вскоре будет доработана. К слову, соревнование между роботами за столами 6-мах запланировано уже на 2017 год.

Другим слабым местом искусственного интеллекта является невозможность вычислять слабость оппонента и подстраиваться под нее. Для этого роботу необходимо сыграть триллионы раздач, чего человек просто не в состоянии сделать. Как утверждает Ноам Браун, играя между собой, роботы достигают равновесия Нэша, то есть находят оптимальную игру.

«В этом и есть преимущество людей – они могут найти у соперника слабое место и выиграть у него максимальное количество денег. Увы, даже играющий по GTO бот не способен выиграть максимум у оппонента.

Если бы у бота была возможность сыграть с человеком триллион раздач, он совершенно точно выработал бы против него оптимальную стратегию и нашел слабые места, но пока это нереально. Поэтому сейчас мы работаем над тем, чтобы робот вырабатывал стратегию на основе гораздо меньшего количества раздач. Но пока это является самым слабым местом покерных ботов», - подвел итог Браун.

Комментарии (0)

Зарегистрируйтесь или , чтобы оставить комментарий