출처 https://web.archive.org/web/20141201093321/http://www.twoplustwo.com/magazine/issue117/david-skla...

mobilebanner

조회 수 2464

추천 수 9

2021.08.14 04:33:08

출처

https://web.archive.org/web/20141201093321/http://www.twoplustwo.com/magazine/issue117/david-sklansky-game-theory-optimized-poker-collusion.php

 

https://web.archive.org/web/20141231180913/http://www.twoplustwo.com/magazine/issue120/david-sklansky-gto-three-handed-game-part-two.php

 

1.

 

두명 이상이 참여하는 포커 상황에서 게임 이론을 적용하는것은 일반적으로 매우 복잡한 주제이지만 간단한 예시도 있다. 나는 다음 문제를 통해 멀티웨이 상황에서 GTO전략을 어떻게 계산할수 있는지, 그리고 어떻게 ‘콜루젼’이 완벽한 전략을 구사하는 플레이어도 이길수 있는지 설명할 것이다.

 

세명의 플레이어가 있다고 가정하자. 이들은 각각 넛부터 (다른 모든 핸드에게 지는)넛 로우까지의 핸드중 하나를 딜링 받는다. 예를 들어서 어떤 핸드는 상위 20%에 속해서 다른 80%의 핸드들을 이길수 있다. 모든 플레이어들은 각자 $3씩 앤티를 낸다. 이후 플레이어들은 이 $9 팟에 $2씩 더 벳을 할지 말지를 결정해야한다. 모든 플레이어들은 동시에 결정을 내릴것이고 다른 사람이 어떤 결정을 내릴지 미리 알수 없다.

 

아무도 벳을 하지 않는다면 세사람 모두 앤티를 돌려받는다. 한명만 벳을 한다면 그는 팟을 이기고 $6의 순수익을 얻는다. 한명 이상이 벳할 경우 벳을 한사람들의 핸드들을 비교하고 가장 좋은 핸드를 가진 사람이 팟(두사람이 붙을경우 $13, 세사람 모두 붙을경우 $15)을 이긴다. 벳을 하고 쇼다운에서 진사람은 $5을 잃는다. 벳을 하지 않고 먹을 해서 진사람은 $3을 잃는다. (나는 이 수치들을 계산의 편의를 위해서 골랐다.)

 

이 상황에서 최적의 전략을 계산하려면, 개패를 가진 플레이어의 입장에서 생각해야한다. 쇼다운에서 이길수 없는 핸드를 가진 사람은, 아무도 벳을 하지 않아서 앤티를 돌려받거나 자신의 핸드를 블러프로 돌려서 $6의 수익을 낼수있다. 이 블러프가 수익을 내려면 다른 두사람이 동시에 25%의 빈도로 폴드해야한다[0].

 

세사람 모두 같은 옵티멀 전략을 가질수밖에 없음에 주목하라. 이들은 모두 같은 확률로 핸드들을 받고 동시에 베팅을 한다. 따라서 개패로 블러프하는 경우 다른 두사람이 각자 절반이상의 핸드를 폴드해야 수익을 낼수 있음을 알수있다. 다른 두사람이 각각 50%의 빈도로 폴드할경우 적어도 한사람 이상이 75%확률로 콜을 따고 [1] 블러프는 평균적으로 -$2.25의 손해를 본다[2].

 

독자들은 GTO전략 구상중 중요한 부분이 상대방이 개패로 블러프했을때 수익을 내지 못하게 방어하는 것임을 알고있을것이다. 이 예제에서도 같은 논리가 적용된다. 옵티멀 전략을 위해서는 상위 50%의 핸드로 베팅해야한다.

 

검산을 위해서 다른 두사람이 이 전략을 구사할때 나머지 한사람이 익스플로잇을 할수 있는지 알아보자. 그 두사람이 정말로 GTO전략을 구사하고 있다면, 우리는 그보다 더 나은 전략을 찾지 못할것이다.

 

우리는 이미 상위 50%핸드만으로 베팅하는 전략에 블러프로 수익을 낼수 없음을 증명했다. 체크하나 베팅하나 EV-$2.25이다[3]. 하지만 넛로우 보다 조금더 좋은 핸드들은 어떨까? 이 게임에서는 가장 안좋은 핸드와 하위 50%핸드는 차이가 나지 않는다. 왜냐하면 다들 체크했을경우 쇼다운 없이 앤티를 돌려받을 것이기 때문이다. 따라서 우리가 하위 50%의 핸드를 들고있다면 상대들의 전략을 알고있다고 해도 그들의 EV-$2.25일것이다. 정확하게 50%에 속하는 핸드는 어떨까? 그 핸드조차도 -$2.25EV를 가진다. 이유를 알겠는가?[4]

 

50%보다 미세하게 좋은 핸드들을 다르게 플레이해서 이득을 볼수는 없을까? VR에퀴티가 50%보다 조금밖에 높지 않다면 다른 두 핸드들에게 질 가능성이 높아보인다. 하지만 계산 없이 순수 논리만으로도 왜 이런 생각이 틀린 생각인지 알수있다. 베팅을 하지 않을경우 EV-$2.25이지만, 베팅을 하면 이보다는 EV가 높다. 왜냐하면 상대방은 가끔씩 우리가 이기는 핸드(VR에퀴티가 50에서 우리 핸드 사이)로 콜을 할것이기 때문이다.

 

우리는 상대들의 전략을 알고도 이를 이기는 전략을 구상할수 없었고, 이는 GTO의 정의상 50%빈도 벳이 옵티멀 전략임을 의미한다. 하지만 만약 한사람이 GTO전략을 구사하고 나머지 두사람이 짱구를 굴리면 어떻게될까?

 

2.

나는 이전 글에서 3웨이 상황에서 GTO전략을 쉽게 계산할수 있는 예제를 소개했다. 각 플레이어들이 3달러씩 앤티를 내고, VR에퀴티가 0%부터 100%인 핸드를 딜링받는다.

 

포지션에 따라 차례대로 베팅하는 대신 그들은 동시에 2달러를 베팅할지 체크할지를 결정한다.

 

모두가 체크하기로 결정했다면 다들 앤티를 돌려받는다. 한사람이 베팅했다면 그가 팟을 이길것이고 두명 이상이 베팅한다면 가장 좋은 핸드를 가진 사람이 이긴다.

 

나는 이전 글에서 이 게임의 GTO전략은 상위 50%의 핸드로 베팅하는 것임을 보였다. 그 이유를 요약하자면, 두 사람 모두 상위 50%로 방어하면 나머지 한사람이 블러프로 수익을 낼수 없기 때문이다. 블러프를 하는 사람은 6달러를 따기 위해 2달러를 베팅하고 이 블러프는 25%의 확률로 먹힌다. 3 1 오즈에 3 1의 블러프 성공률인 셈이다.

 

따라서 상위 50%의 핸드로만 베팅하는것은 이론적으로는 익스플로잇할수 없는 전략이다. 이 전략은 최악의 경우 멘징할 것이고 너무 타이트하게 치는 사람들을 상대로는 약간의 수익을 낼수있다. 이유를 알겠는가?[5]

 

물론 이건 상대들이 반칙을 하지 않을 경우의 이야기이다. 상대들이 우리를 수술하러 왔다고 생각해보자. GTO전략이 우리를 구해줄수 있을까?

 

콜루젼은 흥미로운 주제로 나는 이를 자세히 연구해보았다. 몇몇 온라인 포커룸들이 나한테 자문을 구하기도 했고 말이다. 나는 이 주제에 대해 공개적인 자리에서 글을 쓰는걸 피하는 편이지만 이번 예제처럼 단순한 경우 짱구를 굴리는 사람들의 최적화된 전략은 매우 단순하다(그들이 들키는걸 걱정하지 않을경우). 두사람중 더 좋은 핸드를 가진 사람이 베팅하면 그만이다.

 

다양한 방법으로 왜 이 전략이 콜루더들에게 엣지를 주는지 계산할수있다. 많은 사람들은 가능한 모든 경우를 나누어서 EV를 합하겠지만 더 단순한 방법이 있다.

 

우선 콜루더중 한명이 상위 50% 핸드를 지니고 다른 한명은 아닐 경우에는 이 전략이 GTO전략이랑 다를게 없음에 주목하라. 따라서 우리는 콜루더들이 둘다 상위 50% 핸드를 들고 있을때와 둘다 하위 50%의 핸드를 들고있을때만 고려하면 된다.

 

두사람 모두 상위 50%의 핸드를 들고 있을 경우, 내통하는 전략은 사냥감의 핸드가 넛일 경우 $2베팅을 아껴서 이득을 볼수있다. 1/8의 확률로 세명 모두 상위 50%의 핸드를 들고있을 것이다. 1/3의 확률로 사냥감이 이긴다. 따라서 콜루더들은 24번중 한번 $2을 얻는다. 이로 인한 EV이득은 8 1/3 센트이다.

 

콜루더 둘다 하위 50%의 핸드를 들고 있을 경우, 한명이 벳으로 찔러볼것이다. (사냥감이 GTO전략을 구사한다면 어느 핸드로 찔러봐도 무관하지만 그나마 둘중에서 좋은 핸드로 찌른다고 하자). 1/2의 확률로 이들은 $6를 잃는 대신 $8를 잃을것이다. 따라서 8번중 한번 $2를 손해보는 것이다. 이는 25센트 EV손해를 의미한다. 하지만 8번중 한번 세명 모두 하위 50%의 핸드를 들고있었을경우 이 블러프로 $3의 이득을 볼수있다. 이는 37.5 센트의 EV이득이다. 결국 이 블러프는 총 12.5센트의 수익을 낸다.

 

종합하자면, 콜루더들은 한 핸드당 8 1/3 + 12 1/2 센트(20 5/6)의 수익을 낸다.

GTO전략을 구사하는 완벽한 플레이어는 이에 대응할수 없다. 이게 무슨 의미인지 생각해보기를 바란다.

 

[0] 6 * f - 2 (1 -f) = 0, f = 0.25

 

[1] 1 - 0.5 * 0.5 = 0.75

 

[2] bluff EV 0.75 * -5 + 0.25 * 6 = -2.25

 

[3] check EV 0.125 * 3 - 0.875 * (-3) = -2.25

 

[4] 베팅을 받는 핸드들중 이기는 핸드가 없기때문에 둘다 폴드해야 수익발생 bet EV 6 * 0.5 * 0.5 + (1 - 0.5 * 0.5) * (-5) = -2.25

 

[5] 저는 상대방의 블러프가 수익을 낼수 없고, 약한 베팅레인지를 이길수 있는 핸드를 포기해서 그렇다고 생각하고 넘겼습니다.

스크랩

bookbanner

댓글 수

 

6

2021.08.14 08:09:24

2021.08.14 08:43:14

2021.08.14 11:05:21

2021.08.14 15:08:04

2021.08.14 20:47:30

2021.08.15 14:07:26

댓글 작성은 로그인이 필요합니다.

클릭 시 로그인페이지로 이동합니다.

글 수

 

1,288

제목

글쓴이날짜
2015-01-21
2021-08-15
2021-08-14
2021-08-14
2021-08-14
2021-08-10
2021-08-08
2021-07-31
2021-07-27
2021-07-27
2021-07-27
2021-07-25
2021-07-19
2021-07-16
2021-07-15
2021-07-10
2021-07-07
2021-07-04
2021-07-04
2021-06-29
2021-06-28

검색

Copyright 2014. Pokergosu.com all rights reserved.

SUPPORT : [email protected]

한국 지역 게시글 중단 요청 : [email protected]

마케팅 대행사 - (주)에브리봇 서울특별시 서초구 강남대로 369 12층

POKERGOSU