TIL

「게임이론: 전략과 정보의 경제학」 8장 - 반복게임

Eric Ju 2025. 9. 5. 23:19

1. 보복, 보상 및 협조

지금까지의 분석 대상은 일회게임이었지만, 현실에서의 대부분의 게임은 동일한 경제주체들의 반복적·지속적 활동으로 일어나고, 이처럼 동일한 상대방과 여러 기간에 거쳐 경쟁하는 전략적 상황을 반복게임이라고 부른다. 반복게임에서 경기자는 현재 뿐만 아니라 미래의 보수에도 관심을 가진다. 따라서 현재 게임에서 속임수로 얻을 수 있는 단기적 보상과 그에 따른 보복으로 인한 장기적 손실을 비교해볼 필요가 있다. 또한, 장기적 관점에서의 이익을 위해 상대에게 협조하는 것을 택할 수도 있다. 즉, 상대방을 속임으로써 당할 보복에 대한 두려움이나 협조체제를 유지함으로써 장래에 받을 보상에 대한 기대는 경기자간의 협로를 가능하게 만든다.

 

2. 반복게임의 요소와 균형

반복게임은 유한반복게임과 무한반복게임으로 구분된다. 일회게임에서 전략은 발생가능한 모든 상황에 대한 각 경기자의 완전한 행동 계획으로 정의되는데, 이는 반복게임에도 마찬가지로 적용된다. 지나간 단계에서의 경기자들의 행동 기록을 역사라고 부르는데, 반복게임에서 전략이란 과거 역사에 대응해 수립된 현재의 활동 계획이다. 즉, 첫 단계에 선택하고자 계획된 행동 및 둘째 단계 이후에 그 이전의 역사에 대응하여 계획된 행동이라는 것이다. 이때, 반복게임에서의 보수는 현재가치 총액이 아닌 평균할인보수로 계산한다. 이때, 경기자의 인내력을 나타내는 할인인자가 클수록 미래 보수에 주어지는 가중치는 커진다.

 

3. 유한반복게임

일회게임 G가 유일한 내쉬균형을 가진다면, 게임 G의 T회반복게임 G^T(δ)에는 유일한 부분게임완전균형이 존재한다. 할인인자 δ의 크기에 무관하게 t = 1로부터 t = T까지 모든 단계에 일회게임 G의 내쉬균형이 단순 되풀이되는 것이 바로 그것이다. 또한, 브노아-크리쉬나에 따르면 만약 두 개 이상의 내쉬균형을 갖는 전략형게임 G의 T회반복게임 G^T(δ)를 상정할 때, 할인인자 δ가 충분히 크고 동시에 수명 T가 충분히 길다면, 일회게임 내쉬균형에서 얻을 수 있는 보수보다 큰 어떠한 보수조합도 반복게임 G^T(δ)의 내쉬균형 보수로서 달성될 수 있다.

 

4. 재협상방지

재협상방지균형은 내쉬균형이나 부분게임완전균형보다 더 강력한 기준의 신빙성을 요구한다. 이 균형은 행위자들이 협력하여 얻을 수 있는 이익이 있음에도 불구하고, 이미 도출된 균형에서 벗어나 재협상하려는 유인을 억제한다. 부분게임 완전균형은 시간이 지나면서 행위자들이 기존의 합의를 이탈하고 재협상하려는 유인이 생기는 경우가 있는데, 재협상방지균형은 이러한 문제를 해결하기 위해 제시된 균형 개념이라고 할 수 있다. 예를 들어 국가가 범죄자를 처벌하는 근거는 대리 보복, 대가 지불, 국가의 평판 정립(평판효과)로 나뉠 수 있는데, 이때 두 번째 근거는 재협상방지의 관점에서 논리적 근거가 약하다. 범죄자는 법을 어긴 것에 대해 사과하면서도, 형벌의 비용 문제를 논하며 다시 범죄를 저지르지 않을테니 용서해달라고 주장할 수 있다. 국가는 형벌을 고집함으로써 얻을 보수보다 풀어줄 경우 얻을 보수가 더 크기에 범죄자의 제안을 받아들일 유인이 존재한다. 따라서, 범죄자로 하여금 그가 저지른 죄에 대해 대가를 지불하도록 한다는 논리는 재협상에 취약한 것이다.

 

5. 무한반복 죄수의 딜레마

유한반복 쥐수의 딜레마 게임에서는 반복횟수가 아무리 길어도 협조체제는 달성될 수 없다. 그러나 무한반복게임의 경우에는 완전히 달라진다. 배반 후 감수해야 할 보복의 위협 때문이다. 여기서 논의의 중심이 되는 행태변수는 미래에 대한 평가가치의 정도, 즉 할인인자의 크기이다.

무한반복게임에서의 부분게임이란 (t - 1)까지는 이미 지나왔고 시점 t로부터 출발하는 무한반복게임을 의미한다. 이때 부분게임완전균형은 균형 경로건 혹은 비균형 경로로 들어섰건 그 후속게임에서의 균형 전략조합이 최초에 제시된 전략조합과 일치해야 한다는 요건을 충족해야 한다. 이때, 단회이탈원리는 반복게임에서 특정 전략조합이 부분게임완전균형이라면 어떤 경기자에게도 단회이탈로 보수를 높일 수 없고, 또한 아무 경기자도 단회이탈로 보수를 높일 수 없다면 해당 전략조합은 부분게임완전균형이라고 설명한다.

 

6. 팃포탯의 이론과 실례

무한반복게임에서, 단회이탈의 유인이 없다고 해서 내쉬균형임이 보장되지는 않는다. 부분게임완전균형에는 적용되는 단회이탈원리가 내쉬균형에는 미적용됨을 보여주는 반례가 무한반복 죄수의 딜레마인 것이다. 또한, 이러한 형태의 죄수의 딜레마 게임에서 팃포탯 전략은 완전균형 전략일 수 없다. 만약 경기자들의 할인인자가 충분히 클 경우, 즉 경기자들이 미래지향적일 경우 경기자1의 t단계 이탈에 대해 경기자2가 (t + 1)단계부터 팃포탯을 고수하는 것보다 (t + 1)기에 한 번 C로 이탈한 다음 (t + 2)단계부터 팃포탯을 유지하는 것이 더 유리하기 때문이다.