TIL

「게임이론: 전략과 정보의 경제학」 3장 - 혼합전략의 개념과 응용

Eric Ju 2025. 8. 29. 23:58

1. 강단계소거와 합리화전략

이전까지의 논의는 경기자가 순수전략만을 선택한다고 가정했다. 그러나, 혼합전략 및 무작위전략을 통해 여러 순수전략들 중 하나의 전략을 확률분포에 의해 선택할 수 있다. 순수전략 역시도 혼합전략의 극단점으로서 혼합전략의 특별한 한 형태라고 볼 수 있다. 강단계소거를 통해 남은 최후의 전략을 합리화전략이라고 말한다. 경기자 i의 순수전략집합 Si의 부분집합 Ri를 고려할 때, 경기자 i의 순수전략은 si, 혼합전략은 σi이고 경기자 i를 제외한 나머지 경기자들을 -i라고 한다면 합리화전략에 대한 엄밀한 정의는 아래와 같다. 일반적으로 합리화전략 집합은 약열등전략의 단계적 소거 과정에서 최후에 살아남은 행동집합에 포함되며, 2인전략형게임에서는 두 집합이 같다. 

(3.1) 
집합 Ri*가 다음 조건을 충족하면 경기자 i의 합리화전략 집합이라 부른다.

모든 si ∈ Ri*에 대하여 {σ-i ∈ Δ(R*-i) | si ∈ BRi(σ-i)} ≠ ∅ 임과 동시에
모든 si ∈ Si \ Ri*에 대하여 {σ-i ∈ Δ(R*-i) | si ∈ BRi(σ-i)} = ∅

 

2. 혼합전략 내쉬균형

홀짝게임은 제로섬게임이고, 이 경우에는 순수전략 내쉬균형이 존재하지 않는다. 그러나 전략의 범위를 혼합전략으로까지 확장하면 내쉬균형은 반드시 존재한다. 두 경기자가 정답을 맞추거나 상대를 속일 경우의 보수를 1, 반대의 경우를 -1이라 할 때, 그리고 경기자 1이 홀을 선택할 확률을 p라고 할 때, 경기자 2가 홀이라 추측하여 얻는 기대보수는 (2p - 1)이고, 짝이라 추측할 경우의 기대보수는 (1 - 2p)이다. 이 경우 경기자 2의 최선응수는 경기자 1이 홀을 선택할 확률 p에 달려 있다. p가 0.5를 초과할 경우 경기자 2는 홀이라 말하는 것이 최선이며, p가 0.5 미만일 경우 경기자 2는 짝이라 말하는 것이 최선이고, p = 0.5일 경우 경기자 2에게 홀, 짝의 선택은 무차별하다. 경기자 1의 최선응수도 이에 대칭한다. 따라서, 홀짝게임에 존재하는 단 하나의 내쉬균형은 두 경기자 모두 홀, 짝을 무차별하게 선택하며 절반의 빈도로 게임을 운용하는 것이다. 또한, 이때의 혼합균형에서 각 경기자가 얻는 기대보수는 0이다. 이를 통해 알 수 있는 점은, 혼합균형에서 경기자가 양(+)의 확률로 선택할 수 있는 행동은 모두 동일한 기대보수를 가져다 주며 따라서 사전적으로 무차별하다는 것이다. 

 

5. 정치경제적 소모전

소모전은 여러 경기자들이 하나의 목표를 향하여 각자 비용이 드는 노력이나 자금을 투입하여 경쟁하지만 승자는 단 한 명뿐이며 그 승자가 모든 것을 다 가져가는 게임으로 정의된다. 다음과 같은 사례가 이에 해당한다. A기업과 B기업이 가치가 6조원인 독점사업권을 따려고 할 때, 각 기업은 경쟁사가 얼마의 뇌물을 제공하는지 모르는 상태에서 자신의 뇌물액수를 결정한다. 이 경우, 사업자로 선정되지 못하더라도 이미 지불한 뇌물은 되돌려 받을 수 없고, 이와 같은 형태를 전원지불경매라고 부른다. 기업A가 지불한 뇌물액을 a조원, 기업B가 지불한 뇌물액을 b조원이라 할때, 개별 기업의 전략은 6조원 이하에서 뇌물액을 결정하는 것이다. 이 상황에서 각 기업의 보수는 다음과 같다.

만약 a > b이면, A는  (6 - a)를 얻고 B는 -b를 얻는다.
만약 a = b이면, A는  (3 - a)를 얻고 B는 (3 - a)를 얻는다.
만약 a < b이면, A는  -a를 얻고 B는 (6 - b)를 얻는다.

 

이 상황에서는 순수전략 내쉬균형이 존재하지 않는다. 상대의 뇌물액이 확정됐을 때, 조금씩이라도 혼합전략 내쉬균형은 가능하다. 즉, 상대기업이 주어진 확률분포에 의해 뇌물액을 정한다고 할 때 자신의 뇌물액을 정하는 확률분포를 바꿀 유인이 없는 상태가 존재한다는 것이다. 기업A가 a만큼의 뇌물을 지불하여 얻는 기대보수는 식 3.4와 같은데, 이때 두 기업이 맞닥뜨린 상황이 같으므로 각 기업이 똑같은 혼합전략 F를 선택하는 대칭적 내쉬균형을 구할 수 있다. 기업 A와 기업B가 각각 뇌물액을 선택하는 누적확률분포를 F라고 가정할 경우, 기업A 입장에서 b는 F(b)로부터 추출된 액수이므로, Pr(b < a) = F(a)이고 Pr(b > a) = 1 - F(a)이다. F(b)는 연속함수이므로 Pr(b = a) = 0이다. 이를 원래의 식에 대입하면 A의 기대보수는 결국 식 3.5와 같다. 혼합전략 내쉬균형에서 양의 확률로 선택될 가능성이 있는 모든 선택지는 동일한 기대보수를 가져다준다. 각 기업이 0과 6 사이의 구간에서 0이나 6을 선택할 가능성이 존재하고, 이때 기업의 기대보수는 0이므로 다른 모든 선택지의 보수도 0이어야 한다. 결론적으로 균형 혼합전략 F*(b)는 식 3.6과 같다. 구간 [0,6]에서 균등분포하는 확률변수라는 것이다. 즉, 각 기업은 6조원 이하에서 임의로 뇌물액을 선택하여 제공하는 것이 최선이다. 그러나 결국 두 기업이 지불하는 평균뇌물액의 합계는 6조원과 일치하므로, 이 과정에서 사업의 총가치만큼이 정치권으로 넘어가며 개별 사업자의 기대보수는 0이 된다. 이와 같은 경우 지대의 완전 소실이 초래되는 것이다.

(3.4) 6 × Pr(b < a) + 3 × Pr(b = a) + 0 × Pr(b > a) - a

(3.5) 6F(a) - a

(3.6) F*(b) = b/6