인간과 인공지능이 펼치는 한판 대결, 우리 내일을 바꾼다!

사람들은 컴퓨터 속도가 아주 빨라지면 기계의 능력이 인간의 두뇌능력을 초월할 것이라고 믿는다. 두뇌의 신호처리 속도를 예측하고 컴퓨터 계산속도가 두뇌의 신호처리 속도를 추월하는 특이점(2029년)이 지나면 컴퓨터가 인간의 지능을 능가한다고 주장한 미래학자도 있다. 하지만 계산기의 문제풀이 속도가 아무리 빨라도 그것은 단순한 계산기이지 지능기계는 아니다. 적어도 지능이란 표현을 사용하려면 외부의 입력이 없어도 스스로 필요한 데이터를 학습해서 문제를 해결하는 지적 능력을 갖춰야 한다. 더욱이 인간을 초월하려면 인간의 지적 판단 능력보다 높은 수준의 해답을 스스로 찾아낼 수 있어야 한다. 지능기계에 대한 인간의 열망은 사람의 프로그램이 없이도 기계가 혼자 해답을 찾아내는 능력을 갖는 것이다. 달리 말하면 지능기계가 하는 일은 단순히 문제를 푸는 데에 있지 않고 문제를 푸는 방법을 찾아내는 데에 있다.

인간과 인공지능, 대결의 역사

인공지능(AI, artificial intelligence)은 학문적 영역에 관한 뚜렷한 정의가 없다는 점에서 수수께끼 학문이다. ‘인공’의 정의가 무엇이고 ‘지능’의 정의가 무엇인지 객관적으로 정해져 있지 않다. 즉, 인공지능이란 용어를 컴퓨팅 성능이 어느 정도 수준에 이르렀을 때 붙일 수 있는 지에 대한 근본적인 정의가 없다. 결국 학자들은 인공지능이란 표현을 사용하길 꺼려했고 대신에 신경망 시스템, 퍼지시스템(fuzzy system), 진화적 컴퓨팅이란 표현을 사용했다. 인공지능이란 표현보다 컴퓨팅 지능이란 표현을 선호했다. 컴퓨터 과학자들은 처음엔 체스 게임을 인공지능을 측정하는 기준으로 생각했다. 체스를 인간보다 잘 둔다면 틀림없이 다른 일들도 인간의 처리능력보다 높을 것이라고 믿었다. 하지만 1997년에 미국 IBM사의 딥 블루(Deep Blue)가 세계 체스 챔피언인 게리 카스파로프(Gary Kasparov)를 물리쳤지만 컴퓨터 인공지능이 할 수 있는 일은 아무것도 없었다.

인공지능을 개발하려는 IBM의 노력은 끈질겼다. IBM의 목표는 컴퓨터가 데이터를 학습해서 지식을 인지하는 인지컴퓨팅(cognitive computing) 기술을 획득하는데 있었다. 미국의 인기 TV퀴즈쇼인 ‘제퍼디(Jeopardy)'의 챔피언들과의 대결을 준비했다. 결국 IBM의 왓슨(Watson)은 2011년에 열린 퀴즈 대결에서 챔피언들보다 월등한 점수를 획득하면서 우승을 거뒀다. IBM은 이에 고무되어 지금까지 데이터를 수집하여 분석하고 최선의 대책을 찾아주는 왓슨 식 인공지능을 발전시켜오고 있다. 왓슨은 컴퓨터의 빠른 데이터 처리능력을 극대화한 기법이지만 IBM 스스로도 인공지능이란 표현을 꺼려 인지컴퓨팅이라고 불렀다. 엄밀한 의미에서 왓슨은 스스로 상상하고 문제를 파악하는 두뇌 지능과는 거리가 멀다.

컴퓨터 인공지능 분야를 뒤흔든 사건은 바둑선수 ‘알파고’(AlphaGo)의 등장이다. 구글이 투자한 딥마인드(DeepMind)가 개발한 알파고는 웹사이트에 존재하는 모든 바둑 기보들을 바탕으로 지도학습을 한 후에 알파고끼리 바둑을 두며 인간이 두지 않았던 새로운 바둑의 묘수들을 찾아내는 컴퓨터 알고리즘으로 발전했다. 다음에 어떤 수로 대응할 지를 판단하는 정책망과 선택된 수들이 바둑을 승리로 이끌 확률을 계산하는 가치망으로 무장한 알고리즘이다. 이렇게 개발된 알파고는 이세돌 9단을 4:1로 완파했다. 인간의 감각이나 직관력을 컴퓨터가 뛰어넘지 못할 것이라고 믿었던 바둑 게임마저 알파고에게 힘없이 정복당한 2016년의 이세돌-알파고 바둑대결은 인공지능 역사에 길이 남을 사건이다.

지금까지 성공적인 인공지능 연구들은 모두 학습에 필요한 충분한 데이터가 확보된 경우들이다. 인공지능 개발과정에서 데이터에 의한 지도학습이 중요한 역할을 하기 때문이다. 그러나 학습에 필요한 데이터를 수집하는 비용이 너무 많이 들거나 데이터의 일관성이 없으면 신뢰하기 힘든 결과를 얻게 된다. 또 인공지능의 데이터 해석이 옳은지 여부를 학습과정에서 지도 감독해 주는 감별 절차가 필요하므로 인간의 손을 빌리지 않고는 인공지능이 완성될 수 없었다. 알파고가 바둑에 정통한 알고리즘을 개발할 수 있었던 배경도 역시 기보가 충분히 존재했기 때문이다. 하지만 이세돌을 이긴 후에도 그 실력이 아직 바둑의 한계에 도달하지 못했다고 판단한 딥마인드 측은 알파고끼리의 대국으로 인간의 묘수들을 뛰어넘는 알파고만의 정석들을 수립해 나갔다. 그렇게 완성된 ‘알파고 마스터’는 60명의 최고수 프로들과의 인터넷 바둑대결에서 전승을 거두었다.

알파고 제로의 등장과 그 의미

알파고의 성공에 고무된 딥마인드 연구팀은 인간의 경험이나 지식에서 벗어나 컴퓨터 학습만으로 새로운 바둑 알고리즘을 구축할 수 있는 방법을 강구했다. 바둑 게임의 기본원리만 주입시키고 백지상태에서 스스로 게임을 통해서 경험 데이터를 축적해 가는 방법이다. 인간의 두뇌도 태어난 순간에는 백지상태이지만 서서히 지식과 감각 정보를 축적해 개성이나 사회적 감정 그리고 지혜를 얻게 된다는 개념을 인공지능 알고리즘에 적용했다. 먼저 3일이라는 시간을 20개 구간블록으로 나누고 한 블록의 시간이 흐를 동안 알파고끼리 셀프게임을 반복하여 가장 훌륭한 알파고(제로) 선수를 선정했다. 각 블록에서 선정된 알파고 선수는 별도로 50만 번의 셀프 학습대국을 두면서 신경망 학습인자들을 최적화시켰다. 학습대국은 0.4초 만에 한 수를 두는 초고속 바둑이었다. 이렇게 최적화된 알파고(제로) 선수는 다음 구간블록의 선수가 되어 다시 셀프 게임을 반복하도록 했다. 셀프게임은 5초에 한 수씩 두는 게임이었다. 이렇게 각 블록마다 셀프대국과 셀프학습대국을 반복하면서 알고리즘을 강화시킨 알파고(제로)는 바둑실력이 급속히 향상되었고 36시간 만에 수개월의 학습훈련을 거친 (이세돌과 대결한)알파고의 실력을 능가했다. 다시 40일을 20개 블록으로 나눈 훈련기간에서도 같은 방법으로 알파고(제로)의 알고리즘을 수정해 갔다. 그 결과 백지상태에서 출발한 알파고(제로)가 21일이 경과된 시점엔 당시 최고수였던 알파고(마스터)의 실력마저 능가해 버렸다.

▲인공지능의 새장을 연 '알파고 제로' (출처 : 구글 딥마인드 홈페이지 영상 캡쳐)

딥마인드는 이 결과를 2017년 4월에 네이처에 기고했고 10월에 공개되었다. 개발자들은 인간의 데이터 없이 스스로 생성한 데이터만으로 학습을 이어간 알파고를 ‘인간의 역할이 없다’(zero)는 의미로 ‘알파고 제로’(AlphaGo Zero)라고 명명했다. 논문에 의하면 백지상태에서 출발한 알파고 제로들이 게임을 거듭할수록 바둑돌을 놓은 수법이 인간의 정석들과 비슷해지더니 어느 순간부터 인간이 터득하지 못했던 비법들을 쏟아내며 새로운 정석들을 쌓아갔다고 서술하고 있다. 알파고 제로가 갖는 의미는 매우 크다. 인공지능의 기계학습용 데이터가 미리 준비되지 않아도 인공지능이 스스로 데이터를 생성시켜 스스로 알고리즘을 강화해 갈 수 있다는 사례를 남겼다. 인간의 경험 데이터를 사용하지 않음으로서 인간의 지식이 내포할 수 있는 편견이나 한계를 뛰어 넘을 수 있다는 성과도 거뒀다.

인공지능의 발전이 만들어 갈 우리의 미래

지금까지는 기계학습을 위해선 반드시 충분한 양의 데이터가 존재해야 했고 이를 기초로 알고리즘이 완성될 때가지 인간이 지도학습을 해줘야 했는데 이런 기계학습의 기본 틀이 깨졌다. 알파고 제로는 어떤 시스템이든지 정확한 경계조건들을 부여해 주면 인공지능이 스스로 학습에 필요한 데이터를 생성해 가면서 최적의 알고리즘을 스스로 강화학습으로 발굴할 수 있다는 점을 보여줬다. 해석하고자 하는 시스템의 속성을 파악하고 경계조건들을 제대로 설정해 줄 수만 있다면 인공지능이 자율적으로 문제들을 해결하는 기술수단을 마련할 수 있다는 점을 말해준다.

알파고 제로의 등장은 인류가 충분한 데이터를 보유하지 못한 질병, 에너지, 기후변화 등 산적한 문제들을 해결하는 길이 새롭게 열렸음을 알려주고 있다. 가능성은 무궁무진하다. 예를 들면, 특정 표적에 대한 약물 및 화학 규칙을 디자인하는 목표를 인공 지능에 부여하면 전혀 새로운 화합물을 제안할 수 있다. 연구자들은 이미 이 같은 작업을 수행하고 있다. 인공지능 기법이 연구자들의 개발속도를 크게 높이는 계기를 마련해 줄 수 있다. 마찬가지로, 인공지능에게 단백질 폴딩 문제를 해결하도록 목표를 제시 할 수도 있다. 물론 신경망학습법이 단백질 문제를 해결하기에 적합한지 장담할 순 없지만 약물 단백질이 병원균의 단백질과 결합해서 병원균의 작용을 멈추게 하는 방법을 인공지능 알고리즘에 의존해 보는 시도가 가능하다. 딥마인드측도 알파고 제로 기법이 단백질 연구에 적용될 수 있다고 밝혔다. 인공지능은 신재료 물성을 개발하는 용도로도 매우 유용하다. 상온에서 전기저항이 없는 초전도 특성을 나타내는 원소들의 배합을 신물질의 전자궤도함수 변화를 추적하면서 시도할 수 있는 일이다. 만약 상온 초전도체가 개발된다면 인류의 에너지 문제가 거의 해결되는 기술혁명이 가능하다. 같은 원리로 초내열합금, 초내식합금, 초고자속밀도합금도 개발할 수 있는 길도 찾을 수 있다.

의료현장에서도 큰 변화가 예상된다. 인간의 노화과정에 크게 영향을 미치는 후성유전적 변화를 해소시키는 회춘 약물이나 유전적 치료기술도 인공지능 기술로 한 단계 더 도약할 수 있다. 또 질병 치료과정에서 지금까지는 다른 환자들의 약물효과나 방사선 치료경과 등을 기초로 표준화된 치료법이나 약물을 사용했다면 앞으로는 환자의 유전적 특징과 인체의 약물 반응을 자체적으로 시뮬레이션해서 환자별로 치료효과가 높은 약물이나 치료법을 처방하는 인공지능 맞춤치료기술이 등장할 수 있다.

알파고 제로의 등장은 데이터 과학에 의존하던 인공지능이 알고리즘 과학으로 진화하는 계기가 될 것이다. 인공지능이 스스로 데이터를 생성하고 이를 기초로 알고리즘이 더욱 강화되는 새로운 인공지능 기술이 탄생했다. 앞으로 인공지능 알고리즘의 기술적 진화가 거듭되면서 인류가 해결하지 못했던 문제들이 서서히 해결될 수 있다는 희망을 갖게 한다.

※이 칼럼은 해당 필진의 개인적 소견이며 삼성디스플레이 뉴스룸의 입장이나 전략을 담고 있지 않습니다.