본문 바로가기
글 수 218

 


2. PLO 헤즈-업 IP에서의 C-Bet을 위한 모델로서 팟-리밋 베팅 AKQ Game

 

- 두명의 플레이어가 있습니다 : 엘리스(OOP), 밥(IP)
- 팟 사이즈는 : P 
- 두 플레이어 모두 AKQ 덱에서 카드를 받습니다
- 엘리스는 아무것도 모르는 상태로 체크합니다
- 이제 밥은 체크하면서 쇼다운으로 갈수도 있고, 2/3 팟 C-Bet을 할 수도 있습니다
- 만약 밥이 벳하면, 엘리스는 폴드하거나 쇼다운을 위해 콜 할 수 있습니다
- 베팅 라운드가 끝날 때, 아무도 폴드하지 않았다면, 높은 카드가 쇼다운에서 승리합니다

 

우리는 밥의 C-Bet 결정에 대한 EV를 살펴볼 것 입니다.

PLO에서 C-Bet/Check 결정을 대표하기 위해서, 밥의 C-Bet 사이즈를 2/3x팟으로 설정했습니다.

실제로 우리는 때때로 더 적게, 혹은 더 많게 벳할 수 있지만,
2/3x팟 사이즈의 벳은 헤즈-업 IP 상황에서 평균적인 C-Bet 사이즈라고 추정하기 괜찮을 것 입니다.

 

만약 밥이 절대로 벳하지 않는다면, 포스트플랍에서의 EV는 제로가 될 것 입니다.
그러나 밥은 때때로 벳할 것이고, 이건 변화를 줄 것 입니다.

 

우리는 12부에서 그의 포지션과, 앨리스가 체크를 해야만 한다는 룰로 인해서 밥이 +EV인 상황을 갖고 있다고 살펴봤습니다.
(여기에서 살펴본 모델을 우리는 변환시켰습니다)

 

우리는 여기에서도 같지만, 우리가 선택한 벳 사이즈 때문에 다른 해결법을 갖는다는 것을 볼 것 입니다.

이제 우리의 선택 된 규칙을 기반으로, 이 모델 게임을 해결할 것 입니다.


이 게임을 푸는 것은 두 선수의 완전한 전략뿐 아니라 그들의 EV를 찾는 것을 의미합니다.

제로-섬 게임(레이크가 없는) 이기 때문에 밥에 상대적인 EV를 계산할 것 입니다.


앨리스의 EV는 밥의 반대가 될 것 입니다. (EV(Alice) =-EV(Bob))

 

 

2.1 축소한 지불 모형의 구축

 

우리는 게임의 축소 된 지불 모형을 구축하면서 시작할 수 있습니다.
이 테이블은 모든 플레이어들이 액션에 따른 모든 가능한 각각의 결과들을 포함하고 있습니다.

우리는 전-쇼다운 밸류(핸드의 베팅 결과로 인한 칩의 변화)를 볼 수 있고, 우리는 밥의 EV를 기준으로 계산합니다.

 

Payout matrix :

 

 

여기에서 우리는 앨리스의 전략들을 약어로 사용합니다

- C/C : Check-Call
- C/F : Check-Fold

 

예를 들어, 밥이 Q로 블러프할 때, 그의 C-Bet인 2/3xP를 잃게 될 것이고 (앨리스가 A/K로 콜 했을 때),

체크했다면 이길 수 없는 Q로, (앨리스가 A/K로 폴드했을 때) P를 이기게 됩니다.

 

완전한 지불 모형은 전략들이 좋고 나쁨에 관계없이, 게임에서 밥의 모든 가능한 결과를 완전한 밸류 리스트로 간단하게 나타내줍니다.

 

다음 단계는, 플레이어들이 선택할만한 이유가 없는 도미네잇 전략들을 제거하는 것 입니다.

그러면서 우리는 지불 모형을 줄일 수 있습니다.

 

만약 우리가 두가지 전략 S1, S2를 갖고 있고, S1이 S2에 비해서 절대로 나쁘지 않고, 때때로 좋다면, 우리는 S1이 S2를 도미네잇하고 있다고 말합니다.

우리는 수익을 극대화하려고 하는 플레이어들이 절대로 사용하지 않을 도미네잇 전략들을 제거하면서, 지불 모형을 간단하게 할 수 있습니다.

 

일단, 앨리스의 A를 가지고 하는 체크-폴드와 Q를 가지고 하는 체크-콜을 각각 제거하면서 시작할 것 입니다.

 

 

그리고, 우리는 밥의 도미네잇 전략인 K로 베팅하는 것과, A로 체크하는 것을 제거할 수 있습니다.

 

 

마지막으로 우리는 모두 자동적이며 EV에게 영향을 주지 않는 전략들을 제거하면서 단순화 할 수 있습니다.
이것은 앨리스가 Q로 체크-폴드하는 것과, 밥이 K로 체크하는 것 입니다.
앨리스와 밥의 최적 전략들을 위해 게임을 풀기 위해서 우리는 오직 아래의 부분을 고려하면 됩니다.

 

 

 


2.2 AKQ 게임의 해결

 

우리는 이제 수학적인 방정식들로부터 앨리스와 밥의 최적 전략을 도출해냄으로서 게임을 해결 할 수 있습니다.
밥은 항상 A로 벳을하고, 앨리스는 항상 A로 체크-콜 할 것 입니다.

그럼, 두 플레이어들의 전략들을 모두 열거하기 위해서 알아야하는 것들은 무엇입니까 :

- 밥이 얼마나 자주 Q로 블러프하는가?
- 앨리스가 얼마나 자주 K로 블러프캐쳐로 사용하여 콜을 하는가?

 

우리는 또한 정의가 필요합니다 :

 

* 최적의 전략
우리를 상대로 그녀의 전략을 변경함으로서 EV를 바꿀 수 없을 때, 최적의 전략이라고 말합니다.
그녀는 모두 같은 EV 결과값을 갖게 되기 때문에, 전략의 선택에 무관심하게 될 것 입니다.

 

* 밥의 최적 Q 블러핑의 빈도
밥의 Q로 블러프할 때, 앨리스는 물론 A로는 항상 체크-콜할 것 이지만, K를 가지고는 선택을 내려야 합니다.
그녀는 베스트 핸드이거나, 지고 있을 것이기 때문에, 그녀는 콜 해야 합니까 폴드해야 합니까?


밥이 최적의 C-Bet 전략을 사용하고 있을 때, 앨리스는 콜하던지 폴드하던지 무관심하게 될 것 입니다.

 

EV_Alice (call K) =EV_Alice (fold K)

 

밥은 항상 A를 갖고는 벳하고, 추가적으로 Q로 때때로 블러프 할 것 입니다.
b 는 이 경우에 Q를 가지고 밥이 블러핑 하는 빈도를 나타낼 것 입니다.


앨리스가 K로 콜하는 EV는 다음과 같습니다 :

 

EV_Alice (call K) =EV (Bob bets A) + EV (Bob bluffs Q)

 

밥은 절반은 A를 갖고 있을 것이고, 앨리스가 A를 만난다면, 그녀는 -2/3P를 잃게 됩니다.
(이 표기는 (-2/3)P 이고, -2(/3P)가 아닙니다)

 

밥이 절반을 Q를 갖고 있을 때, 그는 오직 b%만 벳을 할 것 입니다.
따라서 밥이 Q로 블러핑할 가능성은 1/2 x b = b/2 입니다, 그리고 이 경우에 앨리스가 콜을 하면 그녀는 +2/3P를 얻게 됩니다.

 

앨리스가 K로 콜하는 EV의 표현은 다음과 같습니다 :

 

EV_Alice (call K)
=EV (Bob bets A) + EV (Bob bluffs Q)
=(1/2)(-2/3P) + (b/2)(+2/3P)
=-P/3 + bP/3

 

이와 같은 라인의 추론은 앨리스의 K로 폴드하는 EV의 표현이 다음과 같다는 것을 말해 줍니다 :

 

EV_Alice (fold K) =(b/2)(-P) =-bP/2

 

우리는 이제 밥의 최적의 블러핑 빈도를 앨리스의 K로 콜하는 EV와 폴드하는 EV를 같게 설정함으로서 찾을 수 있습니다.

 

EV_Alice (call K) =EV_Alice (fold K)

-P/3 + bP/3 =-bP/2
-1/3 + b/3 =-b/2
-1 + b =-3b/2
b + 3b/2 =1
b(1 + 3/2) =1
b(5/2) =1
b =1/(5/2)
b =2/5

 

우리는 밥이 Q를 가지고 있을 때 2/5 = 40% 블러프를 해야한다는 결론을 내렸습니다.

 

* 앨리스의 K로 하는 최적 콜 빈도

우리는 유사한 접근 방식을 사용할 것 입니다.
앨리스가 최적의 플레이를 한다면, 밥은 Q로 체크, 블러프 하는 것에 무관심해 질 것 입니다.

 

이 밥의 무관심한 지점의 정의를 위해 우리는 이걸 볼 수 있습니다 :

 

EV_Bob (bluff Q) =EV_Bob (check Q)

 

밥이 Q로 체크-비하인드 하는 EV는 0입니다.
따라서 우리는 밥이 Q로 블러프할 때 밥의 EV의 표현만을 찾으면 됩니다.

 

EV_Bob (bluff Q)
=EV (Alice calls A) + EV (Alice calls K) + EV (Alice folds K)

 

이 표현의 첫번째 조건은, 앨리스가 A를 가지고 있을 확률 (1/2) 와 밥이 그가 콜을 받았을 때 잃는 것 (-2/3P)를 간단하게 곱한 것 입니다.

 

EV (Alice calls A) =(1/2)(-2/3P)

 

두번째 조건은, 앨리스가 K를 가지고 콜하고 폴드하는 것을 포함하고, 그녀가 콜하는 확률을 c 라고 할 것 입니다.
그리고 그녀가 폴드하는 가능성은 (1-c)가 될 것 입니다.


앨리스가 K로 콜했을 때, 밥은 -2/3P를 잃게 되고, 앨리스가 K를 폴드했을 때, 밥은 블러프로 P를 얻게 됩니다.


두 조건에 대한 EV 표현은 다음과 같습니다 :

 

EV (Alice calls K) =(1/2)(c)(-2/3P)

EV (Alice folds K) =(1/2)(1 - c)(P)

 

그리고 우리가 얻는 것은 : 

 

EV_Bob (bluff Q)
=EV (Alice calls A) + EV (Alice calls K) + EV (Alice folds K)
=(1/2)(-2/3P) + (1/2)(c)(-2/3P) + (1/2)(1 - c)(P)
=-P/3 - Pc/3 + P/2 - Pc/2
=-2P/6 - 2Pc/6 + 3P/6 -3Pc/6
=-2P/6 + 3P/6 -2Pc/6 - 3Pc/6
=P/6 -5Pc/6
=(1/6){P - 5Pc}

 

마지막으로, 우리는 앨리스의 최적의 콜 빈도를 밥의 블러프 EV와 체크 EV를 같게 설정하면서 찾을 수 있습니다. (0으로)

 

EV_Bob (bluff Q) =EV_Bob (check Q)
(1/6){P - 5Pc} =0
P - 5Pc =0
1 - 5c =0
5c =1
c =1/5

 

따라서, 우리는 앨리스가 K를 갖고 있을 때, 1/5 = 20% 콜 해야 한다고 결론내릴 수 있습니다.

 


2.3 AKQ 게임의 완벽한 해법

 

앨리스

- A로는 항상 체크-콜 한다
- K로는 1/5 = 20% 체크-콜 한다
- Q로는 항상 체크-폴드 한다

 


- A로는 항상 밸류-벳 한다
- K로는 항상 체크-비하인드 한다
- Q로는 2/5 = 40% 블러프 한다

 

마지막 단계는, 
우리가 방금 찾은 한 쌍의 최적의 전략에서 밥의 EV를 계산하는 것 입니다.

 


2.4 AKQ Game 의 밸류 (밥의 EV)

 

우리는 이제 앨리스와 밥이 서로에 대한 최적의 전략을 사용하도록 하고, 밥의 EV를 계산할 수 있습니다.
문제는 밥의 전-대결 값을 아래와 같은 6부분의 시나리오로 나눌 수 있습니다.

 

- Alice has A and Bob has K
- Alice has A and Bob has Q
- Alice has K and Bob has A
- Alice has K and Bob has Q
- Alice has Q and Bob has A
- Alice has Q and Bob has K

 

모든 시나리오의 확률은 1/6로 동일한 가능성을 갖고 있습니다.
우리는 먼저 각각의 시나리오에서 밥의 EV를 구하고나서, 모든 EV를 더하면서 그의 전체 EV를 찾을 수 있을 것 입니다.


Scenario 1: Alice has A and Bob has K

 

EV1 =(1/6)(0) =0

 

밥은 항상 체크-비하인드하고, 베팅은 없습니다.

 

Scenario 2: Alice has A and Bob has Q

 

EV2
=(1/6){EV (Bob bluffs) + EV (Bob checks)}
=(1/6){(2/5)(-2/3P) + (3/5)(0)}
=(1/6){-4P/15}

 

밥은 2/5번 블러프하고, 남은 3/5는 체크-비하인드 할 것 입니다.
그가 A를 상대로 블러프할 때, 그는 항상 2/3P를 잃고, 체크-비하인드 할 때는 아무것도 잃지 않습니다.


Scenario 3: Alice has K and Bob has A

 

EV3
=(1/6){EV (Alice calls) + EV (Alice folds)}
=(1/6){(1/5)(2/3P) + (4/5)(0)}
=(1/6){2P/15}

 

밥은 항상 벳 합니다. 앨리스가 1/5 콜하면서 밥은 2/3P를 얻고, 그녀가 4/5 폴드하면서 밥은 아무것도 얻지 못합니다.

 

Scenario 4: Alice has K and Bob has Q


EV4
=(1/6){EV (Bob bluffs) + EV (Bob checks)} 
=(1/6){(2/5){(1/5)(-2/3P) + (4/5)(P)} + (3/5)(0)}
=(1/6){-4P/75 + 4P/5}
=(1/6){-4P/75 + 60P/75}
=(1/6){56P/75}

 

밥은 2/5번 블러프하고, 3/5번 체크-비하인드 합니다.
그가 블러프할 때, 앨리스는 1/5번 콜하고 밥은 2/3P를 잃게 됩니다.
그녀는 나머지 4/5번 폴드하고, 밥은 P을 얻게 됩니다.
밥이 체크할 때 그는 얻는것이 없습니다.

 

Scenario 5: Alice has Q and Bob has A

 

EV5 =(1/6)(0) =0

 

밥은 항상 벳하고, 앨리스는 폴드할 것 입니다. 변하는 것은 없습니다.


Scenario 6: Alice has Q and Bob has K

 

EV6 =(1/6)(0) =0

 

밥은 항상 K로 체크하고, 변하는 것은 없습니다.

 

 

이 게임에서 밥의 총 EV는, 6가지 EV를 더하면서 찾을 수 있습니다.

 

Bob's EV
=EV1 + EV2 + EV3 + EV4 + EV5 + EV6
=0 + (1/6){-4P/15} + (1/6){2P/15}
+ (1/6){56P/75} + 0 + 0
=(1/6){-4P/15 + 2P/15 + 56P/75} 
=(1/6){-2P/15 + 56P/75} 
=(1/6){-10P/75 + 56P/75}
=(1/6){46P/75}
=23P/225

 

밥은 23P/225 = 0.102P를 그의 최적의 C-Bet 전략에서 법니다.
그의 EV는 팟 사이즈인 P에 선형적으로 증가되고, 팟이 커질수록, 밥에겐 더 좋아질 것 입니다.

이 건 패시브하고 약한 플레이어가 OOP에서

예를들어 3-Bet에 자주 플랫하는 것과 같이 빅 팟을 OOP에서 플레이하는 것이 일어 난 시나리오에서,
명백하게 유추할 수 있는 것 입니다.

 

약한 플랫 레인지로 OOP에서 좋은 플레이어를 상대하는 것은 매우 어렵고, 팟이 커질수록, 더 큰 어려움으로 다가올 것 입니다.
(만약 포스트플랍에서 여전히 스택이 깊을 경우에)

특히 만약 OOP에서 습관적으로 체크하면서, 프리플랍 어그레서에게 플레이를 지시하도록 하는 경우에 더 그렇습니다.

 

그러면 IP에서 플레이어는

편안하게 C-Bet 레인지를 발란스 된 밸류-벳(AKQ Game의 A와 같은)/블러프(AKQ Game의 Q와 같은) 비율을 가지고 설계할 수 있고, 
중간 정도의 핸드들(AKQ Game의 K와 같은)로 체크-비하인드하면서 프리 카드를 받을수도 있습니다.

(밸류-벳 하기엔 너무 약하고, 블러프로 돌리기엔 너무 강한 핸드들)

 

우리는 미래의 기사들에서 OOP 플레이어가 플랍에서 먼저 베팅하면서 조금 더 플레이하기 쉽게 만드는 것을 볼 것 이지만,
그럼에도 여전히 OOP에서 잘 플레이하는 것은 어렵습니다.

 

--

 

굿 런 !



조찐이

2015.11.26 00:39:36

짝짝짝짝짝..

폴드맨

2015.11.26 00:44:24

우와..대단....

조찐이

2015.11.26 13:40:28

감사.. 번역탭으로 다 옮겼슴당~~

포스잡고싶다

2015.11.27 09:01:08

음 어렵군@...
List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 번역 게시물의 표기 방식 통일 [6] 이방인 2015-01-21 2783
공지 번역 게시판 공지 - 150604 [1] 생컨 2015-01-18 2652
158 Crushing the Micro Omaha 1-5 [7] 조찐이 2016-02-03 1127
157 Crushing the Micro Omaha 1-4 [6] 조찐이 2016-02-02 1061
156 Crushing the Micro Omaha 1-3 [2] 조찐이 2016-02-01 1188
155 Crushing the Micro Omaha 1-2 [6] 조찐이 2016-02-01 1284
154 Crushing the Micro Omaha 1-1 [16] 조찐이 2016-02-01 1822
153 What is the red line? pt2 (完) [9] 당근 2016-01-27 1000
152 What is the red line? pt1. [6] 당근 2016-01-27 1319
151 pokers 1% 샘플 한글 의역본 pt9 (完) [1] 당근 2016-01-26 1311
150 pokers 1% 샘플 한글 의역본 pt8 [7] 당근 2016-01-26 1512
149 pokers 1% 샘플 한글 의역본 pt7 [4] 당근 2016-01-25 1321
148 pokers 1% 샘플 한글 의역본 pt6 [9] 당근 2016-01-24 1323
147 pokers 1% 샘플 한글 의역본 pt5 [6] 당근 2016-01-24 1439
146 pokers 1% 샘플 한글 의역본 pt 4  [5] 당근 2016-01-24 1368
145 pokers 1% 샘플 한글 의역본 pt 3 [14] 당근 2016-01-23 1989
144 pokers 1% 샘플 한글 의역본 pt 2 [8] 당근 2016-01-23 2370
143 pokers 1% 한글 번역본. [11] 당근 2016-01-23 3030
142 PLO From Scratch - Part 13b (完) [25] 이방인 2015-12-01 1533
141 PLO From Scratch - Part 13a.3 [1] 이방인 2015-11-27 821
» PLO From Scratch - Part 13a.2 [4] 이방인 2015-11-26 708
139 PLO From Scratch - Part 13a.1 [1] 이방인 2015-11-25 614