본문 바로가기
글 수 871

개요

 

이전에 '내가 터득한 프리플랍, 플랍 전략'이라는 제목으로 글을 썼었는데, 뭐 사실 진지하게 쓴 글은 아니다. 이걸로 대회에 나가서 우승할 리는 만무할테니까.
나는 포커를 아직 제대로 공부해본 적이 없다. 포커로 돈을 벌 생각은 아직 없기 때문이다. 실력은 뭐... 나의 숫자감각에 의존해 플레이 머니를 불리는 정도? '텍사스 홀덤 게임' 자체는 그 정도로 즐기고 있다.
대신 나는 다른 것에 관심이 있다. 포커의 최적화된 전략이다.
나는 오픈레인지나 3벳레인지를 암기하는 것보다는, 최적 액션과 레인지가 도출되는 과정에 관심이 많다.
가령, ATo보다 KQo가 왜 좋은가? 이것을 엄밀하게 분석해보고 싶은 것이다.
나는 수학적으로 이 게임을 파헤쳐볼 것이다.

 

이 글은 순수하게 나의 연구로만 이루어진 글이다. 그러니 여기 있는 모든 글자가 나의 저작권인 셈이다.

 

 

 

최선의 전략 취하기

 

GTO란 무엇일까? 흔히 상대방이 익스플로잇하지 못하게 하는 전략이라고 한다.
근데 '폴드만 하는 전략'도 상대방이 익스플로잇할 수 없지 않은가?

 

GTO란 게임 이론에서 곧 우월 전략을 의미한다. 즉, 상대방이 어떤 행동을 취하든 간에 관계없이 나에게는 최선인 전략이다. 강우월 전략은 그러한 전략이 딱 하나 존재하는 것이다. 약우월 전략은 두 개 이상 존재하는 것이다. 아마 GTO는 약우월전략일 것으로 예상한다. 플레이 방법이 많을 것이라는 것이다.

 

폴드만 하는 전략은 상대방이 이를 익스플로잇할 순 없지만 GTO가 아니다. 이게 왜 GTO가 아닌 지는 조금 더 깊게 들어가봐야 알 수 있다. 그러니 GTO 얘기는 잠시 미루고, 완전히 기초적인 것을 다뤄볼 것이다.

 

항상 상대방은 경쟁자에 대응해 최선의 전략을 취할 수 있는데, 그렇게 되면 우리가 얻을 수 있는 돈은 우월 전략으로 플레이할 때보다 줄어든다. 우리가 우월 전략으로 플레이하지 않을 때 상대방이 최선의 전략을 취한다면, 상대방은 우리를 익스플로잇하게 된다.

 

그런데 최선의 전략은 어떻게 취하는 걸까? 아니, 애초부터 모든 상황에서 최선이라는 게 가능하긴 한 걸까?

앞으로 우리가 나아가야할 길이 많다. 일단 지금은, 주어진 상황에서 최선의 전략을 찾는 방법부터 알아볼 것이다.

 

우리는 가위바위보라는 게임에서 어떻게 최선의 전략을 찾는 지 알아볼 것이다.

 

A와 B가 가위바위보 게임을 한다. A와 B에게는 가위, 바위, 보, 포기라는 선택지가 있다. 가위는 보를 이긴다. 보는 바위를 이긴다. 바위는 가위를 이긴다. 포기는 항상 진다. A와 B의 선택이 같으면 비긴다.

 

A가 바위를 80% 확률로, 포기를 20% 확률로 선택하는 전략을 취한다고 가정하자. B는 A의 그런 전략을 알고 있을 때, 어떻게 해야 A로부터 최대한 많이 이길 수 있을까? 정답은 보를 100% 확률로 내는 것이다. 이때 B의 100% 확률로 보를 내는 전략이 A에 대한 최선의 전략이 된다.

 

이번엔 A가 가위를 30% 확률로, 바위를 30% 확률로, 보를 30% 확률로, 포기를 10% 확률로 선택하는 전략을 취한다고 가정해보자. B는 무엇을 하면 될까? 포기를 하면 안 된다는 것은 확실하다. 그건 바보짓이니까. B가 가위를 낸다면 40% 확률로 이기고, 30% 확률로 비기고, 30% 확률로 질 것이다. 이건 B가 바위나 보를 냈을 때도 마찬가지이다. 즉 B는 포기를 하지 않는 선에서 뭘 내든 상관이 없는 것이다. 이것이 B의 A에 대한 최선의 전략이 된다.

 

이제 A는 가위를 40% 확률로, 바위를 30% 확률로, 보를 30% 확률로 낸다. 이제 B는 어떤 전략을 취해야 할까?
B가 가위를 낸다면, 30% 확률로 이길 것이다. 바위를 낸다면, 40% 확률로 이길 것이다. 보를 낸다면, 30% 확률로 이길 것이다.(물론 비기는 것을 고려한다면 보보다는 가위를 내는 것이 유리할 것이다. 하지만 여기서는 승률만 생각하도록 하자.)

 

B의 전략을 한 번 구상해보자.
B가 가위를 낼 확률을 P1, 바위를 낼 확률을 P2, 보를 낼 확률을 P3, 포기를 할 확률을 P4라고 하자.
항상 가위, 바위, 보, 포기 중 하나의 사건이 일어나므로 P1 + P2 + P3 + P4 = 1이다.
이제 B의 승률은 0.3*P1 + 0.4*P2 + 0.3*P3 + 0*P4가 될 것이다.
우리는 0.3*P1 + 0.4*P2 + 0.3*P3 + 0*P4의 최댓값을 구해야한다. 어떻게 해야겠는가?
이 문제는 재배열 부등식(Rearrangement inequality)을 이용하여 간단히 해결할 수 있다.

ddd1.png

뭔가 복잡해보이지만, 그렇게 어려운 건 아니다. P1, P2, P3, P4를 크기 순서대로 a, b, c, d로 재배열한 후, 모든 확률이 음이 아닌 실수이고 a가 가장 크다는 것을 이용해 준식이 0.4보다 작거나 같음을 도출한 것이다. 결국 0.3P1 + 0.4P2 + 0.3P3 + 0*P4의 최댓값은 0.4이다.(등호는 P2=1, P1=P3=P4=0일 때 성립한다.)

 

즉 B는 P2를 1인 전략으로 할 때, 다시 말해서 바위만 내는 전략을 취할 때 A에게서 가장 높은 승률을 얻을 수 있다. 이제 B는 A를 익스플로잇한다. B는 매번 40% 확률로 승리하고 A는 30% 확률로 승리한다.

 

 

 

익스플로잇의 피해 최소화하기

 

게임을 하는 동안 우리의 전략이 상대방에게 읽혀 익스플로잇 당하게 된다면 매우 곤란할 것이다. 익스플로잇하고 있는 상대의 전략을 알아차린다면 역공을 할 수도 있을 것이다. A가 보만 내는 전략으로 바꿔버려서 B의 바위만 내는 전략을 박살버린다든지. 하지만 복잡한 게임에서 상대방이 우릴 어떻게 익스플로잇하고 있는 지 알겠는가? 익스플로잇 당하는 줄도 모르다가 패배할 지도 모른다.

 

그러니 우리는 가능하면 익스플로잇 당하지 않는 상황을 만들고 싶다. 이 말은 즉슨, 내 전략에 대한 상대방의 최선의 전략이 최대한 적은 이득을 가지도록 해야한다는 것이다. 이제 우리는 익스플로잇 당하지 않는 전략이 뭔지 한 번 생각해볼 때인 것이다. 2편에서는 내쉬 균형에 대해서 다룰 것이다.

 

"상대방은 독심술사로 나의 전략을 완벽히 꿰고 있다. 이 상황에서 내가 취할 수 있는 최선의 전략이 뭘까?"



List of Articles
제목 글쓴이 날짜 조회 수 추천 수
전략 전략/번역 게시판에 본인 세션 올리지 마세요. [13] 생컨 2021-08-20 2913  
전략 전략/토론 게시판입니다. [10] 생컨 2016-10-03 8952  
번역 번역 게시물의 표기 방식 통일 [6] 이방인 2015-01-21 11011  
번역 번역 게시판 공지 - 150604 [2] 생컨 2015-01-18 11337  
'포인트금지' 미체크시 밴 없이 포인트 500씩 차감됩니다. [18] 포커고수 2022-05-17 2025 3
후방글/거래글은 "포인트금지" 체크해 주세요. file [14] 포커고수 2022-05-04 3837 1
베스트 댓글 추가 안내 [11] 포커고수 2022-04-27 2052 2
후방 글은 후방) 이라고 꼭 명시해주세요 [10] 포커고수 2022-04-08 4315 2
토너먼트 정보 제공 관련 주최측 사전 신청 안내 [9] 포커고수 2022-03-29 4225 5
2022 포커고수 게시판 규정 공지 포커고수 2022-02-08 10455 25
GTO 위자드 할인 코드 안내 file [16] 포커고수 2022-02-07 8702 3
1레벨 2레벨 거래글, 스테이킹 금지합니다. [477] 포커고수 2019-05-16 97479 2
번역 [Upswing Poker] 플랍 체크레이즈 후 턴플레이를 위한 3가지 팁 [4] 몽라쿤 2022-05-24 1277 3
번역 [Improve Your Poker] Getting an Overlay file [3] 플로프로 2022-05-23 765 2
번역 [Upswing Poker] 트립스 플레이 하기 [2] 몽라쿤 2022-05-23 906 4
번역 [업스윙포커] 플랍 베팅을 위한 4가지 규칙 [1] 마카오킴 2022-05-21 1351 2
번역 [RYE] 2022년에는 그만해야 될 네가지(두번째) [12] 유자차 2022-05-20 1870 20
번역 [업스윙 포커] 항상 베팅을 하는 사람을 이기는 방법 – 어그레시브한 플레이어 완벽 대응법 file [1] 마카오킴 2022-05-20 1300 4
번역 [Improve your poker] 4 poker myths file [1] 플로프로 2022-05-20 317 1
번역 [Upswing Poker] 캐시 게임에서 AJo로 플레이 하는 방법 file [6] 불페라 2022-05-20 716 6
번역 [업스윙포커] 포커에서의 고급 블러핑 기술 (Doug Polk작성) [1] 마카오킴 2022-05-19 1191 9
번역 [Improve Your Poker] Follow Your ABC's file [2] 플로프로 2022-05-19 519 5
번역 [업스윙 포커] 토너먼트에서 스몰 포켓 페어 플레이 하는 방법 file [4] 마카오킴 2022-05-18 1297 8
전략 [Wizard] 간단한 핸드리뷰 file [20] 미노리 2022-05-03 3755 7
번역 [Upswing Poker] 포커에서 솔버란 무엇일까? 솔버가 어떻게 동작하고 우리가 솔버를 어떻게 생각해야 하는지 [4] 몽라쿤 2022-04-30 2294 13
전략 3뱃 밸런싱의 이해 file [7] 터스기 2022-04-29 3225 8
번역 [Upswing Poker] 월드 클래스 플레이어들의 오버벳: 타이밍과 그 이유 [7] 몽라쿤 2022-04-29 2231 14
전략 GTO 전략을 위한 수학적 모델링 - 1편 file [56] 돈주는피쉬 2022-04-28 2570 6
전략 내가 터득한 프리플랍, 플랍 전략 [53] 돈주는피쉬 2022-04-22 5522 38
전략 프로 선수들처럼 오버벳 하는 방법 file [13] Savilla 2022-04-19 4245 20
번역 [Upswing poker] 포커에서 에쿼티란 무엇인가? [11] Binance 2022-04-15 2199 10
번역 [Upswing Poker] 캐시 게임에서 J9s로 플레이 하는 방법 [9] Binance 2022-04-13 2887 8