합리적 선택이란?

우리는 살면서 여러 가지 선택의 기로에 놓이게 된다.

친구들과 만나 점심 메뉴를 고르거나, 방학 동안 아르바이트를 할지 안 할지 정하거나, 시험을 일주일 앞두고 자습 시간에 게임 한 판을 할지 고민하거나.

옷을 선택하는 짱구

그럴 때 가장 좋은 방법은 ‘최대의 효용’을 얻을 수 있는 선택 을 하는 것이다.

정확히는 효용에서 비용을 뺀 값이 극대화되는 선택이다.

보통 경제학에서는 이를 합리적 선택이라 하며, 이 개념은 시장 내에서 각 개인의 행동을 유추하는 데에 유용하게 사용되고 있다.

물론 합리적 선택의 정의가 무엇인지 알았다고 해서 모든 문제가 해결되는 것은 아니다.

진짜 문제는 최대의 효용을 얻는 선택이 무엇인지 찾는 것이기 때문이다.

이 글에서는 합리적 선택을 어떻게 찾을 수 있는지 그 방법을 간단히 알아보고, 뉴컴의 역설에 대해 설명하려 한다.


우월전략과 지배 원리

누가 아이스크림을 살지 친구와 결정해야 하는 상황.

당신과 친구는 ‘하나빼기’를 통해 승패를 가리고자 한다.

첫 턴에 당신은 가위와 바위, 친구는 가위와 보자기를 냈다.

이때 두 번째 턴에서 당신은 무엇을 내는 것이 합리적인 선택일까?

하나빼기를 하는 모습

아마 여러 번의 하나빼기 짬이 있는 사람은 직관적으로 가위를 내야 함을 알아챌 것이다.

그 이유를 풀어써보자면 다음과 같다.

  1. 만약 친구가 보자기를 냈다면 당신은 가위를 내는 것이 이득이며, 바위를 내는 경우 지게 된다.
  2. 만약 친구가 가위를 냈다면 당신은 바위를 내는 것이 이득이며, 가위를 낼 경우 비비게 된다.

친구가 무슨 선택을 하든 가위를 내면 적어도 지지는 않는다는 사실을 알 수 있다.

자신만만한 빅데이터

반대로 친구 입장에서는 뭘 내는 것이 이득일까?

똑같은 과정을 거치면 친구는 무엇을 내든 게임에서 질 수 있게 된다.

그러나 친구가 

가위를 내면 적어도 지지는 않겠다

라는 당신의 생각을 예측할 수 있다면 가위를 낼 것이다.

그것을 역으로 예측한다면 당신은 바위를 낼 것이고,

친구는 그것 또한 예측하여 보자기를 낼 것이고…

고장난 빅데이터

 그렇다. 결국은 운인 것이다.

그러니 비록 바위보다 불리한 경우가 있더라도 속 편하게 가위를 내는 것을 추천한다.

위의 하나빼기 상황과 달리 어떤 상황에서든지 우위를 점하는 전략이 있다면, 우리는 그 선택이 합리적임을 직관적으로 알 수 있다.

이러한 전략을 우월전략이라 하며, ‘우월전략이 합리적 선택이다’ 라는 전제를 지배 원리라 한다.

지배 원리는 투자에서도 중요한 개념이다.

A전자, B자동차, C조선 등 여러 기업들 중 어디에 투자해야 할지 고를 때,

동일한 수익률이라면 위험이 적은 것, 동일한 위험도라면 수익률이 큰 것을 선택하는 것이 합리적이라는 것이다.


기대 효용 극대화의 원리

어떤 선택이 합리적 선택인가를 파악하는 데 도움을 주는 원리에는 지배 원리 말고도 기대 효용 극대화의 원리도 있다.

기대 효용 극대화의 원리를 사용하는 예에는 간단하게 복권이 있다.

여기 A 복권과 B 복권이 있다.

A 복권의 가격은 5000원이고, 0.1% 확률로 100만원이 당첨된다.

B 복권은 가격도 5000원이고, 50% 확률로 9000원을 얻는다.

두 복권을 전부 구매할 수 없다면, 무엇을 고르는 것이 합리적일까?

우리는 기대 효용이라는 개념을 사용해서 쉽게 문제를 풀 수 있다.

여기서 잠깐! 기대 효용의 공식은 다음과 같다.

$E(u) = p(x_{1})u(x_{1}) + p(x_{2})u(x_{2})+…$

여기서 p(x)는 사건 x가 일어날 확률이고, u(x)는 그때의 효용이다..

그냥 수학에서의 기댓값 공식을 그대로 사용했음을 알 수 있다.

이제 효용의 값을 단순히 구매자의 이득/손해라 하고, 각 복권을 샀을 때의 기대 효용을 구하면,

  1. $E(u)=0.001 \times 1000000 - 5000 = -4000$
  2. $E(u)=0.5 \times 9000 - 5000 = -500$

B를 고르는 것이 그나마 합리적임을 알 수 있다.

당연하지만 이럴 때는 그냥 복권을 안 사는 것이 좋다.

심심풀이로 우리나라 로또의 기대 효용을 계산해보자.

로또 이미지

4, 5등을 제외한 로또의 당첨 수령금은 매번 달라지기에 1034회차인 2022년 9월 24일것을 따랐다.

$E(u)=\frac{1}{8145060} \times 2868856209 + \frac{1}{1357310} \times 65201278 + \frac{1}{35724} \times 1484916 + \frac{1}{733} \times 50000 + \frac{1}{45} \times 5000 - 1000 = -378.85928$

무려 380원 손해이다.

이제 여기에 당첨자가 여러 명일 때 당첨금이 배분되는 상황이랑 세금까지 따지자면 로또를 사는 것은 합리적이지 못한 행동으로 볼 수 있다.

이를 보고 미국의 작가인 앰브로스 비어스는 이렇게 말했다.

“로또는 수학을 못하는 사람에게서 걷는 세금이다. ”

바로 위의 명언 이미지

그러나 실제로는 380원 손해는 별볼일 없을뿐더러 당첨 시의 수령금이 압도적으로 높기 때문에 사람들은 여전히 로또를 사는 것이다.

아무튼 이렇게 기대 효용이 가장 높은 선택이 합리적 선택이라는 것이 ‘기대 효용 극대화의 원리’이다.


조건적 기대 효용 극대화의 원리

기대 효용 극대화의 원리를 좀 더 재밌는 상황에 적용해보자.

여기 철수와 영희가 있다.

사이졸은 철수와 영희

철수가 a1, a2 중 한 가지 전략을 선택하면, 영희가 그것을 보고 b1, b2 중 한 가지 전략을 이어서 선택한다고 해보자.

이때 철수의 효용은 u11, u12, u21, u22이며, 첨자에서 앞의 숫자는 철수의 선택, 뒤의 숫자는 영희의 선택을 의미한다.

효용 값을 임의로 정한 뒤, 이를 표로 나타내면 다음과 같다.

  b1 b2
a1 3 10
a2 8 4

이 상황에서 철수의 ‘합리적 선택’은 뭘까?

일단 지배 원리는 통하지 않는다.

u11 < u21, u12 > u21 에서 알 수 있듯 영희가 b1을 선택하면 a2가 유리하지만, 영희가 b2를 선택하면 a1이 유리하기 때문이다.

그러니 한 가지 조건을 추가하자.

영희는 철수를 괴롭히고 싶어한다.

그렇다면 영희는 철수가 a1을 선택할 때는 b1을, 철수가 a2를 선택할 때는 b2를 선택할 것이다.

결국 철수는 u11을 얻는가, u22를 얻는가 두 상황만 따지면 되므로 그나마 유리한 a2를 선택할 것이다.

이를 조건부 확률의 개념을 이용해 수식으로 쓰면 다음과 같다.

  1. $E(u(a_{1})) = P(b_{1}|a_{1}) \times u_{11} + P(b_{2}|a_{1}) \times u_{12} = 3$
  2. $E(u(a_{2})) = P(b_{1}|a_{2}) \times u_{21} + P(b_{2}|a_{2}) \times u_{22} = 4$

만약 영희가 70% 확률로 철수를 괴롭히는 선택을 한다면 철수의 각 선택에 대한 기대 효용은 다음과 같다.

  1. $E(u(a_{1})) = 0.7 \times 3 + 0.3 \times 10 = 5.1$
  2. $E(u(a_{2})) = 0.3 \times 8 + 0.7 \times 4 = 4.2$

이때는 a1을 선택하는 것이 더 좋다.

이처럼 조건부 확률에 근거하여 구한 기대 효용을 조건적 기대 효용이라 하며,

이때 합리적 선택을 구하는 원리를 조건적 기대 효용 극대화의 원리라 한다.

이 글에서는 약칭으로 조건적 기대 효용을 CEU (conditional expected utility), 조건적 기대 효용 극대화의 원리를 CEU 극대화의 원리라 하자.


뉴컴의 역설

이제 뉴컴의 역설을 다룰 때가 됐다.

여기 방 안에 상자 2개 A, B와 로봇 1개가 있다.

상자 A는 투명하여 그 안에 50000원이 있음이 명백히 보인다.

그러나 상자 B는 불투명하여 ‘500만원?’이라 적힌 메모만 보일 뿐 그 안은 보이지 않는다.

일단 두 상자 모두 가지고 나서려는 당신.

그때 로봇에 알람 소리가 나더니 다음과 같은 메시지가 떴다.

‘나는 이 세상의 미래를 정확히 예측하는 빅데이터.

당신이 상자 B만 가져가리라 예측한 경우에만 상자 B에 500만원을 넣어 놓았다.

만약 상자 2개를 모두 가져간다고 예측했을 경우 상자 B에 아무것도 넣어놓지 않았다.’

당신을 예측하는 빅데이터 로봇

결국 당신은 상자 2개를 다시 바닥에 내려놓고 생각에 빠진다.

어찌하라는 말인가.

뉴컴의 역설 상황

일단 현재 상황을 행렬로 나타내면 다음과 같다.

  s1 s2
a1 50000 5050000
a2 0 5000000

여기서 a1은 두 상자를 모두 가져가는 선택, a2는 상자 B만 가져가는 선택이며,

s1은 로봇이 a1을 예측하여 상자 B에 아무것도 넣지 않았을 경우,

s2는 로봇이 a2를 예측하여 상자 B에 500만원을 넣어놓은 경우이다.

당연하지만 상자 A만 가져가는 경우는 a1, a2에 비해 이득을 볼 수 없기 때문에 고려 대상에서 배제한다.

일단 지배 원리에 의해 a1이 합리적인 선택이라는 것은 명백하다.

s1이든 s2이든 간에 a1이 a2보다 더 큰 이익을 얻을 수 있기 때문이다.

그러나 CEU를 따지면 이야기는 달라진다.

이 빅데이터 로봇이 미래를 100% 확실하게 예측한다면 P(s1|a1) = 1, P(s2|a2) = 1이기 때문이다.

이때 조건적 기대 효용은 E(u(a1)) = 50000, E(u(a2)) = 5백만 이다.

그렇다면 결론은 a2가 합리적이라는 것이다.

숫자를 보면 짐작이 가겠지만 굳이 100%가 아니더라도 예측률이 충분히 높다면 a2가 합리적이라는 결론이 도출된다.

혼란스러운 상황

뭔가 이상하다.

분명 지배 원리에 따르면 a1이 합리적인 선택인데, CEU 극대화의 원리를 따르면 a2가 합리적인 선택이 되어버린다.

그래서 이 상황이 역설인 것이다.


역설의 해답?

역설을 발견한다면 그 풀이도 찾아보는 것이 인지상정.

이 역설에 대한 해답은 철학자들 사이에서도 갈린다.

노직(Nozick)은 로봇의 100% 미래 예측이 통하는 상황에 대해 지배 원리를 적용하면 안 된다고 말한다.

즉, 그에 따르면 a2가 합리적이지만, 여전히 찜찜한 느낌은 지울 수 없다.

왜 지배 원리를 적용하면 안 되는지 그 이유를 명백히 설명하지 못하기 때문이다.

반면 슐레징거(Schlesinger)는 a1이 합리적 선택이라는 더 강력한 논증이 있다고 주장한다.

이 논증을 위해 그는 ‘조언자’ 의 존재를 가정한다.

만약 상자 B의 내부까지 들여다볼 수 있는 조언자가 있어 당신의 선택을 도와주려 한다면, 당신은 무슨 조언을 듣게 될까?

조언자의 모습

조언자는 상자 B에 돈이 있든 없든 두 상자 모두 가져가는 편이 이득이라고 조언할 것이다.

그렇다면 a1이 합리적인 선택지가 됨을 알 수 있다.

이 논증에서 문제가 되는 것은 조언자의 합리적 선택이 당신의 합리적 선택과 동일할 수 있는가이다.

잠시 다른 상황을 생각해보자.

만약 A’ 상자를 열면 80% 확률로 3만원을 얻지만, 20% 확률로 아무것도 얻지 못한다.

또한, B’ 상자를 열면 확정적으로 1만원을 얻게 된다.

두 상자 중 하나만 열 수 있으며, c1은 A’ 상자를 여는 선택, c2는 B’ 상자를 여는 선택이라 하자.

기대 효용을 따져면 E(u(c1)) = 30000*0.8 = 24000, E(u(c2)) = 10000*1.0 =10000 이기 때문에 c1이 합리적 선택이다.

그러나 조언자가 c1 상자의 내부를 봤을 때 그 안이 비어있다면 당신에게 상자 c2를 열라고 조언할 것이다.

이렇게 되면 당신에게 있어 합리적 선택은 c2로 바뀐다.

조언자의 여부에 따라 합리적 선택이 바뀐 것이다.

즉, 슐레징거의 논증은 조언자의 존재를 가정했을 때부터 이미 의심스러운 논증이 되어버린다.

한편 내가 참고한 논문의 필자인 이종권에 의하면 a1이 합리적 선택이라 한다.

그에 따르면 상황이 s1이든, s2이든 간에 a2 선택을 하게 된다면 상자 B를 연 뒤 당신은 후회를 하게 된다.

만약 두 상자 모두 가져왔더라면 50000원을 더 얻었을 수 있었을텐데.

이러한 후회의 존재 때문에 a1이 합리적이라는 것이다.

철학에 대해 문외한인 내가 보기엔 왠지 지배의 원리를 다시 한 번 요약하는 것 같은 논증이다.

실제로 설문조사를 하면 어떨까?

2009년에 철학 교수  931명을 대상으로 설문조사를 한 결과 21.3%가 a1 선택을, 31.4%가 a2 선택을 지지하는 것으로 나타났다.

참고로 나머지 48.3% 인원은 결정을 하지 못했거나 문제에 대해 익숙하지 않다며 응답을 하지 않았다.

반면 2016년에 일반인들을 대상으로 31854명을 대상으로 설문조사한 결과 46.5%가 a1, 53.5%가 a2를 지지하였다.

신기한 점은 어느 한 선택지가 압도적으로 높은 비율을 보이지는 않는다는 것이다.

박빙의 지지율


완벽한 예측자는 존재 가능한가?

역설을 풀어보려다 오히려 그 난해함만 더 잘 알게 되었다.

그러나 어쩌면 시야를 돌리면 이 역설의 해답은 명료할지도 모른다.

바로 100% 미래 예측이 가능한 존재는 이 세상에 없다고 놓는 것이다.

이러면 뉴컴의 역설 상황 자체를 ‘완벽한 예측자는 없다’라는 명제의 귀류 논증으로 사용할 수 있을 것이다.

실제로 고전역학에서 말하는 라플라스의 악마가 이와 유사하다.

이 세상에 존재하는 모든 입자의 위치와 운동량 상태를 S(t) 라 하자.

뉴턴의 운동 법칙만 잘 사용한다면 현재의 S를 통해 미래의 S를 계산할 수 있으며,

역으로 현재의 S를 통해 과거의 S를 유추할 수 있다.

라플라스의 악마는 현재의 S를 정확하게 알고 있는 존재로, 과거에 대한 정보 역시 계산 가능하며, 미래에 대한 정보들도 100% 정확도로 예측할 수 있는 존재이다.

라플라스의 악마 이미지

이러한 존재가 있다면 뉴컴의 역설을 현실에 구현할 수 있을지 모르겠지만, 현실은 그렇게 만만하지 않다.

일단 우주의 모든 입자의 위치와 운동량을 정확히 아는 것은 불가능하다.

이는 단순히 측정상의 오차를 이야기하는 것이 아니며, 양자역학의 불확정성 정리에 의한 필연적인 한계이다.

또한, 복잡계 이론도 한몫한다.

우리가 사는 우주는 수많은 입자가 다양한 상호작용을 하는 복잡계로서,

초기에 0.00000001% 의 매우 작은 오차로 S를 측정하더라도, 이 차이는 시간이 지날수록 매우 큰 차이를 불러일으키게 된다.

참고로 주식시장이 복잡계의 대표적인 예이다.

작년 주식차트만 보더라도 미래를 예측하는 것이 얼마나 힘든 일인지 알 수 있다.

팔을 든 기영이의 형상을 한 주가 그래프

결국 완벽한 예측자는 존재할 수 없다는 것이 결론이다.


마무리

다만 여전히 뉴컴의 역설이 완전히 해결된 것은 아니다.

빅데이터 로봇의 정확도가 굳이 100%가 아니더라도 충분히 높기만 하면 지배 원리와 CEU 극대화의 원리가 여전히 상충하기 때문이다.

그러나 나는 철학에 큰 흥미가 없기 때문에 이만 이야기를 마치고자 한다.

아마 다음 글은 고전역학의 결정론이나 불확정성 원리에 대한 글이 될 것이다.

다음 글이 올라올 동안 여러분들이 철학자가 되어 이 역설을 명료하게 해결해주길 바란다.

마무리 인사


 Refference

  1. 매일경제 경제용어사전: 지배원리
  2. 위키백과: 기대효용가설
  3. 이종권 - 뉴컴의 역설과 합리적 선택
  4. 뉴컴의 역설 설문자료 1 (철학자 대상)
  5. 뉴컴의 역설 설문자료 2 (일반인 대상)
  6. 위키백과: 복잡계
  7. 위키백과: 라플라스의 도깨비

이미지 출처 

  1. 뉴컴의 역설 설명 사진
  2. 라플라스의 악마 이미지
minwoo.ko's profile image

고민우(minwoo.ko)

2022-09-28 18:39

Read more posts by this author