자율학습하는 구글 인공지능 DQN을 개발한 딥마인드

Posted by 아디노
2015. 10. 5. 08:31 Tech

구글(Google)은 4억 파운드의 자금을 투입하여 인공지능을 개발하는 벤처기업 딥마인드(DeepMind)를 인수하였었습니다. 딥마인드는 기계학습 기술과 신경과학을 응용하여 스스로 학습하는 알고리즘 DQN(Deep Q-Network)을 개발한바 있습니다. 인베이더나 벽돌깨기와 같은 게임을 하면서 높은 점수를 받기도 하였습니다.


그러면 구글은 이러한 인공지능 기술을 개발하면서 미래에 어떤 목적에 응용하려고 하는 것일까요?


딥마인드리가 발표한 DQN은 기계학습과 신경과학을 응용하여 만들어진 범용 학습 알고리즘입니다. DQN은 게임 화면의 출력신호를 바탕으로 점수를 최대한 받을 수 있도록 게임을 하는 임무를 받았습니다. 아주 간단한 지시만을 받고 시작했으며 이후 필요한 규칙은 자신이 게임을 수차례 하면서 학습하게 됩니다.


인베이더 게임을 하는 인공지능 딥미인드 DQN


자율학습하는 구글 인공지능 DQN을 개발한 딥마인드


DQN의 학습능력을 알아보기 위해서 49개의 게임을 플레이하였습니다. DQN은 격투부터 자동차 레이싱까지 모든 종류의 게임을 몇시간만에 마스터 하였습니다. 49종류의 게임중에 43개 게임에서 기존 인공지능보다 높은 점수를 기록했습니다. 29개에서는 프로게이머보다 높은 점수를 얻었습니다.


자율학습 구글 인공지능 DQN 딥마인드


위의 인베이더를 처음 시키면 처음에는 바로 적에게 당하고 맙니다. 하지만 3번째 플레이에서 적을 공격하고 격파하는 방법을 배우게 됩니다. 30분 정도 지나면 게임의 핵심을 파악하여 공격과 숨는 타이밍을 잡게 됩니다. 밤새 플레이하게 냅두면 최종적으로는 최고점수까지 도달합니다.


그리고 벽돌깨기(브레이크 아웃 Break ou) 게임을 시킨 동영상도 있습니다. 단지 30분 동안 100게임을 하고나면 튕겨져 나오는 공을 다시 쳐야한다는 것을 알게 되었습니다. 1시간이 지나자 뛰어난 성적은 아니지만 어쨋든 나아졌습니다. 그리고 2시간이 경과하면 게임 대부분을 마스터합니다. 그리고 4시간이 지나면 고수의 기술을 깨닫게 됩니다. 벽을 뚫고 그 너머로 공을 보내는 기술을 하게 됩니다.



딥마인드의 창립자인 하사비스(Hassabis)는 컴퓨터 과학자이며 4세부터 체스를 하여 신동으로 불린 사람입니다. 그는 DQN이 아직 단순한 게임을 해결하고 있지만 향후 주식시장과 같이 많은 데이터를 다루는 분야에도 응용될 수 있으리라 예상하고 있습니다. 



딥마인드의 공식 페이지에는 프로젝트 목적에 대해서 'Solve Intelligence(지능을 알아내기)' 위해서라고 적혀 있습니다. 하사비스는 딥마인드를 '인공 범용 지능(AGI)를 이해하기 위한 프로젝트'라고 설명하고 있습니다. Siri와 Google Now 같이 대화할 수 있는 음성인식과 달리 기계학습과 신경과학을 이용하여 기계가 조금이라도 인간에 가까운 판단을 내리도록 시스템을 만드는 것이 목적입니다.


인공지능 벽돌깨기


지금 대부분의 인공지능은 더 좋은 성능이 나오도록 기계를 프로그래밍하는 것입니다. 그러나 이들의 방법은 AI가 스스로 학습하도록 프로그램밍하는 것입니다. 그러나 이러한 범용 인공지능이 곧 완공되는 것은 아닙니다. 하사비스는 현재 인간의 뇌처럼 동작하는 단일 알고리즘을 개발 중이라고 합니다.