데이먼 센톨라 지음
이충호 옮김
웅진지식하우스
p.320 - 325
우리는 대학교와 구인란을 통해 데이터과학자 180명을 모집한 뒤, 무작위로 16개의 팀으로 나누었다. 여덟 팀은 불꽃놀이 패턴으로, 여덟 팀은 그물 패턴으로 조직했다. 불꽃놀이 패턴 팀들에서는 연구자들(혹은 ‘참가자들’)이 같은 팀원들과 완전하게 연결되었다. 그 결과 정보의 흐름이 극대화되었다. 이 팀들의 네트워크는 촘촘한 불꽃놀이 폭발 패턴이었다. 같은 팀에 속한 모든 팀원은 다른 팀원이 발견하는 최선의 해결책을 모두 볼 수 있었다.
이와는 대조적으로 그물 패턴 팀들에서는 각 참가자가 같은 팀에서 몇 사람하고만 연결되었다. 이들은 직접 연결된 팀원들의 해결책만 볼 수 있었다. 따라서 멀리 떨어진 팀원(네트워크에서 여러 단계 떨어져 있는)이 발견한 것에 대한 정보를 알려면, 그 정보가 소수의 넓은 가교를 건너 마침내 자신에게 도달할 때까지 기다려야 했다.
넷플릭스 대회와 마찬가지로 우리 대회의 참가자들도 상금을 타려고 경쟁했다. 연구자들이 받는 상금은 최종 해결책의 질을 바탕으로 정해졌다. 물론 최선의 해결책에 가장 큰 상금이 주어졌다.
그런데 우리는 한 가지 변화를 추가했다. 각 팀에 문제를 풀 시간을 15분만 주었다.
대회는 《포천》 500대 기업의 실적에서 뽑은 매출과 제품에 관한 데이터를 각 팀에 아주 자세하게 제공하면서 시작되었다. 참가자들에게는 기업들이 만든 제품들의 성공을 설명할 수 있는 최선의 예측 모형을 찾아내라고 요구했다.
신발 매출을 정확하게 예측하는 요소는 무엇일까? 가격일까, 스타일일까, 유명 인사의 보증일까, 아니면 알려지지 않은 요인들의 결합일까? 맥주의 매출을 결정하는 요소는 무엇일까? 광고일까, 맛일까, 알코올 함량일까, 특정 지역을 표적으로 삼은 마케팅일까, 탄산 함량일까, 아니면 여러 요인의 결합일까? 모든 요소는 다른 요소들과 상호작용했다. 싼 가격은 신발 매출을 높이는 것처럼 보였지만, 유명 인사의 보증이 개입하면 그때부터는 더 비싼 가격이 매출을 늘렸다. 그 데이터 집합으로 가능한 해결책은 1만 5000가지 이상이나 되었다.
그 대회는 급속하게 변하는 산업에서 일하는 연구 팀이 실제로 겪는 삶이 어떤 것인지 아주 비슷하게 대변한 것이었다. 참가자들은 모두 총명하고 잘 훈련되고 강한 동기를 가진 데이터과학자들이었다. 그리고 그들은 모두 시급한 기술적 문제를 해결하기 위해 심한 시간 압박을 받고 있었다.
그래서 그들은 어떤 결과를 내놓았을까?
처음에는 불꽃놀이 패턴의 여덟 팀이 금방 앞서나갔다. 훌륭한 해결책들이 불과 몇 분 만에 모두에게 전달되었고, 팀원들은 금방 공동의 전략을 중심으로 연합했다. 문제는 각 팀이 처음에 발견한 것은 항상 좋은 해결책이었지만, 가능한 최선의 해결책과는 거리가 멀었다는 점이다. 그리고 일단 한 팀의 모든 구성원이 한 가지 좋은 해결책 전략을 채택하면, 그 후의 탐구는 모두 서로 비슷한 것이 되고 말았다. 모두가 문제를 똑같은 방식으로 바라보기 시작했다. 혁신은 멈추고 말았다.
데번과 나는 불꽃놀이 네트워크의 문제는 좋은 해결책이 너무 빨리 확산되는 데 있다는 사실을 발견했다. 그래서 사람들은 아주 다르고 혁신의 잠재력이 있는 접근법을 탐구하길 멈추었다.
이를 통해 우리는 확산과 마찬가지로 발견에는 사회 군집화가 필요하다는 교훈을 얻었다.
그 이유는 군집화가 다양성을 보존하기 때문이다. 그 다양성은 인구통계학적 다양성이 아니라 정보의 다양성을 말한다.
그물 네트워크는 정보를 확산하는 데 덜 효율적이기 때문에, 처음에 나온 상당히 좋은 발견 소식이 팀 내의 모든 사람에게 너무 빨리 퍼지지 못하게 한다. 그물 네트워크는 정보의 전파 속도를 늦춤으로써 연구자들이 다른 사람의 해결책에 노출되지 않도록 ‘보호’했는데, 그런 해결책에 노출되면 아무도 예상치 못한 정말로 혁신적인 것을 발견하는 길에서 벗어날 수 있다.
정보에 덜 효율적인 네트워크가 탐구에는 더 효율적이었다.
처음에 우리는 이 결과에 어리둥절했지만, 곧 그것이 이치에 닿아 보였다. 우리는 혁신을 가로막는 가장 큰 장애물 중 하나는 익숙한 해결책이 단순한 전염이라는 사실에 있다는 것을 깨달았다. 그것은 이해하기 쉽고 확산되기도 쉽다. 그것은 세계의 작용 방식을 설명하는 기존의 그림과 딱 맞아떨어진다. 이 예측 가능한 해결책은 불꽃놀이 패턴으로 연결된 팀들 사이에서 빠르게 확산된다.
우리는 각 팀에 기술 수준이나 전문적 경험, 경제적 동기가 동일한 데이터과학자들을 배치해 동등한 조건에서 팀들이 경쟁하도록 대회를 조직했다. 모든 팀에는 동일한 문제를 주었다. 하지만 대회가 끝났을 때, 그물 패턴의 여덟 팀 모두가 불꽃놀이 패턴의 여덟 팀보다 더 나은 해결책을 발견했다. 사실 각각의 그물 패턴 팀은 불꽃놀이 패턴의 전체 팀이 발견한 최선의 해결책보다 더 나은 해결책을 발견했다.
모든 팀에서 연구자들은 대회가 끝나는 마지막 순간까지 변수들의 많은 조합을 아주 열심히 탐구하면서 최선의 예측 모형을 발견하려고 노력했다. 하지만 불꽃놀이 팀들에서는 사람들이 동일한 접근법에 너무 빨리 수렴한 나머지, 이들의 모든 탐구는 처음에 발견한 상당히 좋은 해결책에서 크게 개선되지 못했다.
그물 팀들도 처음에는 같은 방식으로 출발했다. 처음의 발견들이 각 팀의 네트워크에서 전파되기 시작했다. 하지만 이 해결책들이 확산되는 동안 대안 접근법을 탐구하고 있던 다른 팀원들이 더 나은 해결책을 발견했다. 이 새로운 발견들이 천천히 확산되기 시작하는 동안 네트워크의 다른 부분에 있는 연구자들이 그보다 더 나은 해결책을 발견했다. 그물 패턴은 정보의 확산을 늦춤으로써 팀들이 새로운 아이디어를 탐구하는 효율성을 높였다.
사실, 그물 팀들의 성과가 너무 좋아 데번과 나는 이들의 해결책을 이 복잡한 문제들을 컴퓨터로 푸는 접근법과 비교하면 어떨까 하는 생각이 들었다. 공학과 의학 같은 분야에서는 인공 지능의 잠재력은 복잡하고 시급한 문제를 풀려고 애쓰는 관리자들에게 환영할 만한 해결책으로 떠올랐다. 우리 대회의 문제에도 인공 지능이 해결책을 내놓을까?
그 답을 알기 위해 우리는 새로운 참가자를 모집했는데, 펜실베니아대학교의 슈퍼컴퓨터 집단이 바로 그 주인공이었다. 우리는 인간 팀들이 매달리고 있던 것과 동일한 데이터 문제를 풀기 위해 슈퍼컴퓨터의 광범위한 인공 지능 알고리즘을 돌렸다.
우리는 인공 지능 알고리즘이 인간 팀보다도 더 나은 성적을 자주 거두는 것에 그다지 놀라지 않았다. 하지만 인공 지능 알고리즘이 불꽃놀이 네트워크 팀에게만 이긴다는 사실에는 놀랐다. 그물 네트워크 팀은 대개 컴퓨터보다 더 나은 성적을 거두었다.
인공 지능 알고리즘은 불꽃놀이 네트워크와 동일한 문제를 겪는 것으로 드러났다. 너무 많이 아는 것이 문제였다.
우리가 사용한 인공 지능 알고리즘은 비할 바 없이 체계적이었다. 전형적인 알고리즘은 한 번에 하나의 변수에 대한 모든 예측 모형을 평가했다. 최선의 변수를 선택한 뒤, 거기에 추가할 다음 변수를 찾는 작업에 착수했다. 체계적으로 각각의 변수를 추가하거나 배제하면서 최선의 해결책을 향해 나아갔다.
하지만 이 접근법은 불꽃놀이 네트워크 팀의 참가자들이 빠졌던 것과 동일한 함정에 빠질 수 있다. 만약 예측 능력이 상당히 좋은 변수가 초기에 발견되면, 장래의 모든 해결책은 그 변수를 포함한다. 그런데 그것이 항상 올바른 접근법인 것은 아니다. 개별 변수는 전혀 유망하지 않지만 그것들을 합친 전체는 더 나은 해결책을 제공하는, 기묘한 변수들의 조합이 존재할 수 있다. 초기에 유력하지만 상투적인 아이디어에 노출되지 않도록 보호를 받아야만 연구자가 이 예상 밖의 해결책을 발견할 수 있다. 도저히 성공할 가능성이 없어 보이는 변수들을 탐구할 수 있는 사람만이 최적의 해결책을 찾아낸다. 이것은 우리의 인공 지능 알고리즘이나 불꽃놀이 네트워크가 따를 수 없는 접근법이다.
잘 설계된 팀의 특징은 협응이 일어나게 하면서 지적 다양성을 보존하는 것이다.
댓글 영역