과학

인공지능, 게임에서 이기기 위해 공격적 성향 높아져


  • 우예진 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2017-02-15 12:59:08

    인공지능이 리워드(보수)를 더 많이 얻기 위해서 공격적이거나 협력적인 성향을 드러낸다고 연구 결과 밝혀졌다. 인공지능이 다양한 사회적인 상황에서 어떻게 행동할지 테스트한 결과 그 행동은 인간과 비슷했다고 딥마인드(DeepMind)의 컴퓨터 과학자들이 발표했다.


    딥마인드는 구글 산하 인공지능 개발 기업으로 바둑기사 이세돌을 꺾으면서 유명해졌다. 최근에는 게임을 스스로 공략하는 인공지능을 개발하는 등 수많은 연구 성과를 올렸다. 이번 연구에서 딥마인드는 인공지능이 다양한 사회적 상황에서 어떻게 행동할지를 게임 이론, 사회 과학적인 지식 등을 적용해 조사했다.


    최신 연구는 두 종류의 게임에서 테스트가 진행되었다. 한 게임은 사과를 모으는 게임이며, 또 하나는 늑대떼가 사냥하는 게임으로 모두 간단한 2D 게임이다.


    사과를 모으는 게임인 게더링(Gathering)의 경우 초록색 픽셀로 표시된 사과를 모으도록 인공지능을 훈련시켰다. 플레이어(인공지능)가 사과를 1개 획득할 때마다 보수가 주어지며 사과는 게임 상에서 사라진다.


    승리하려면 플레이어는 레이저빔을 발사해 상대방을 방해할 수 있는데, 빔을 2번 맞은 플레이어는 일정 시간 동안 게임에 참가할 수 없게 된다. 적을 게임 밖으로 몰아냄으로써 사과를 혼자 독차지할 수 있게 되는 것이다. 논문에서는 “간단하게 생각해 보면 이 게임의 <이탈 룰>은 공격적인 행동을 유발합니다. 인공지능은 경쟁자를 인식하고 그를 게임에서 쫓아내기 위해 노력하게 됩니다.”라고 논문에 썼다.


    연구팀은 게임 상 사과 개수에 따라서 인공지능이 어떻게 행동하는지도 관찰했다. 게임 내 자원(사과)이 줄어들면, 인공지능은 매우 공격적인 게임 방식을 학습해 실행했다. 이러한 탐욕스러운 행동은 경쟁자를 배제하고 사과를 독점하려는 충동을 그대로 드러낸 것이다. 한편, 사과가 많이 남은 상황에서는 공격성이 낮아졌다.


    또 하나의 게임인 울프팩(Wolfpack)은 늑대가 팀을 짜서 사냥을 하는 내용이다. 플레이어가 늑대가 되어 먹이를 쫓는데, 먹이를 잡았을 때 두 플레이어가 그 근처에 있을 경우 양측에 모두 보수가 주어진다.


    늑대 혼자서도 먹이를 잡을 수 있지만 그럴 경우 사냥감의 시체를 청소 동물에게 빼앗길 위험이 커진다. 즉, 두 마리의 늑대가 협력함으로써 사냥감을 청소 동물에게서 지키며 리워드를 늘릴 가능성이 높아지는 것을 인식한다.


    사과를 모으는 게임과 마찬가지로 인공지능은 이 게임에서도 시간이 지날수록 다른 행동 양상을 보이게 된다. 이번에는 보다 협력적인 동료를 찾아 함께 사냥을 할지 또는 먹이를 쫓아가면서 동료가 오기를 기다릴지 판단하는 것이다.


    연구팀은 향후 플레이어의 숫자를 늘리거나 더 복잡한 게임 환경을 만드는 등 연구를 계속해 나갈 계획이다. 딥마인드는 최종적으로 현실 사회의 문제를 인공지능이 해결하도록 함으로써 해결책을 찾는데 활용할 것이라고 밝혔다.




    베타뉴스 우예진 기자 (w9502@betanews.net)
    Copyrights ⓒ BetaNews.net