모방의 시대가 올까?

모방의 시대가 올까?

모방의 시대가 올까?
09/09/2020
/ 박평종

[도판1] 넥스트 렘브란트가 그린 그림

예술교육 무용론을 주장하는 이들은 교육이 창의적인 예술작품을 생산하는 데 전혀 도움을 주지 못한다고 말한다. 오히려 교육은 새로운 사고를 펼쳐나가는 데 방해만 될 뿐이라고 강조한다. 이를 한마디로 축약하면 ‘아는 것이 병’이라고 할 수 있다. 그럴 듯한 말이다. 이런 주장은 예술작품의 가치를 ‘독창성’에서 찾는 소위 모더니즘 예술 패러다임의 틀 속에서 나온 것이다. 과거에 없었던 새로운 사고, 새로운 감성을 제안하고자 할 때 지식은 아무짝에도 쓸모없다는 발상이다. 이 ‘독창성’ 패러다임은 여전히 작동하고 있으며 우리 시대 예술작품의 가치를 결정하는 견고한 틀이다. 이런 사고의 틀 속에서는 남과 달라야만, 나아가 ‘특이해야만’ 예술작품으로 인정받을 수 있다.

[도판2] 딥드림이 생산한 이미지

인공지능이 예술작품 생산에 개입하면서 이 ‘독창성’ 패러다임이 언제까지 유효할지 궁금증을 불러일으키는 시기다. 이미 인공지능이 생산한 예술이 시장에서 거래되고 있는 현실을 고려하면 더욱 그렇다. 실상 인공지능은 무수한 데이터, 말하자면 과거의 예술작품을 학습하여 결과물을 산출한다. 예컨대 넥스트 렘브란트는 렘브란트의 그림을 딥러닝으로 ‘학습’하여 새로운 이미지를 만들어낸다. 즉 이 기계 예술가의 그림은 렘브란트의 화법, 요컨대 렘브란트 스타일을 모방한 것이다. 구글의 딥드림 역시 유명 화가들의 화법을 학습하여 주문자의 요구에 부합하는 이미지를 제공한다. 고흐 스타일이나 모네 스타일의 이미지가 그것이다. 미술사가나 평론가들은 이렇게 생산된 ‘작품’은 결코 예술이 될 수 없다는 데 의견을 같이한다. 유명 화가들의 스타일을 모방했기 때문이다. ‘독창성’ 패러다임이 지배하는 시대니 당연한 얘기다.

 그런데 실상 이 ‘독창성의 제국’은 19세기에 와서야 시작됐다. 이전에는 ‘모방’ 패러다임이 예술작품의 가치를 결정했다. 미의 이상형이 있고 그것은 이미 고전주의 시대에 완성돼 있었다. 더 정확히는 그에 대한 ‘규범’이 있었다. 따라서 이후의 예술은 이 ‘결정된’ 이상형을 충실히 모방함으로써 충분했다. 제대로 모방하지 못하는 것이 문제일 뿐이다. 이 패러다임에서는 교육과 학습이 중요했다. 그리고 충실한 모방을 위해서는 반복적인 훈련을 요구했다. 미술 아카데미의 규범이 있고, 그 규범을 따라야만 훌륭한 예술작품으로 인정받을 수 있었다. ‘거장’들의 아뜰리에에서 그 규범을 학습하는 것이 예술가들에게 요구됐던 주요 덕목이었다. 이 패러다임은 19세기에 와서야 해체됐다. 말하자면 ‘독창성’이 ‘모방’을 대체했다. 모방은 예술의 가치를 저해하는 요소로 금기시됐다. 그런데 이제 인공지능이 등장하면서 이 ‘독창성의 제국’에 균열을 낼 조짐이다. 물론 아직 ‘독창성’ 규범을 고수하는 이들은 학습을 통해 모방을 일삼는 이 ‘모방기계’의 생산물에 의미를 두지 않는다.

그러나 이 차이를 근본적으로 규정하는 것이 어디까지 가능할까? 실상 예술가들은 과거 예술가들이 구축해 왔던 무수한 규칙과 질서를 학습한 후 그것을 새롭게 이해하고 또 재구성함으로써 자기만의 규칙을 세워나간다. 그것이 예를 들면 렘브란트의 스타일이나 고흐의 스타일이다. 그런 점에서 모방과 학습은 창의성의 전제 조건일 수 있다. 말하자면 모든 문화적 생산물은 기원이 있고 따라서 파생적이다. 그렇다면 학습량이 많은 기계가 창의적인 작품을 생산할 수 있는 개연성도 커진다.

우리 시대의 독창성 패러다임이 인공지능 예술의 등장으로 무너지고 다시 모방 패러다임으로 대체될 것이라고 섣불리 말할 수는 없다. 하지만 전자가 영속적으로 지속될 것이라고 단정할 수도 없다. 또한 현재의 ‘모방기계’가 진화를 거듭하여 언젠가는 ‘인간예술가’보다 창의적인 작품을 생산하게 될 가능성도 배제할 수 없다. 알파고 이후 프로바둑 기사들은 인공지능이 찾아내는 ‘최선의’ 수에 담긴 창의성을 인정할 뿐만 아니라 그로부터 많은 것을 배우는 형편이니 말이다. 기계가 바둑을 더 잘 둔다고 바둑게임이 사라지지 않은 것처럼 기계가 예술작품을 생산한다 해서 크게 달라질 일은 없을 것 같다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

자연의 경이

자연의 경이

자연의 경이
08/19/2020
/ 박평종

갈라파고스

갈라파고스

알고리즘 기반의 이미지 생산 방식이 빠르게 진화하고 있다. 컴퓨터 프로그램이 ‘스스로’ 이미지 정보를 생산한다는 뜻인데, 이는 거창하게 말하자면 ‘문명사적’ 변화다. 본래 이미지는 자연 속에서 저절로 생성된다. 부러진 나뭇가지가 땅에 떨어져 남긴 흔적이나 동물 발자국 등이 그 예다. 이를 아리스토텔레스는 자연기호라 불렀다. 선사시대 동굴 벽화처럼 사람이 ‘의도’를 갖고 생산한 이미지도 있다. 소위 ‘그림’이라 부르는 기호다. 인류가 생산, 축적해 온 이미지의 대부분이 그것이다. 19세기에 사진이 발명되면서 이미지 생산의 ‘혁명’이 시작됐다. 속도와 양의 측면에서 사진은 그림보다 압도적으로 우월했으나 정작 이미지 생산 과정에 사람이 개입할 수 있는 여지는 대폭 줄어들었다. 기계가 찍기 때문이다. 그런데 컴퓨터 프로그램이 그 자리를 대체하면서 다른 변화가 생겨나고 있다.

프로그램은 사전에 정해놓은 규칙을 뜻한다. TV프로그램이 앞으로 방영될 방송목록들을 미리 알려주듯이 말이다. 프로그램에 없는 내용이 방영되면 규칙 위반이다. 컴퓨터 프로그램의 제약은 훨씬 까다롭다. 프로그램은 컴퓨터를 작동시키는 명령어들의 집합인 까닭에 규칙을 위반하면 오작동 한다. 버그가 그 예고, 바이러스는 오작동을 일으키기 위해 프로그램의 질서를 어지럽히는 수단이다. 말하자면 프로그램은 시키는 대로만 하며, 역으로 시키지 않는 것은 하지 않는다. 이것이 프로그램 이론의 기본 뼈대다. 컴퓨터의 창의성에 관한 논의는 여기에서 출발한다. 즉 프로그램에 따라 정보를 처리하는 컴퓨터가 시키지 않은 새로운 정보를 생산할 수 있을까?

당연히 양 진영으로 나뉜다. 가능성을 믿는 자들의 실험적인 시도가 있다. 예컨대 MIT 미디어랩의 컴퓨터 공학자 칼 심스(Karl Sims)는 1990년대 초반부터 진화 알고리즘(Evolutionary algorithm)을 활용한 예술 창작에 몰두해 왔다. <팬스퍼미아(Panspermia)>(1990), <진화한 가상생명(Evolved virtual creature)>(1994), <갈라파고스(Galapagos)>(1997) 등이 대표적이다. 주제와 논리는 유사하므로 <갈라파고스>를 통해 작품의 요지를 살펴보자.

갈라파고스

팬스퍼미아

다윈의 진화론을 암시하는 제목의 이 작품은 12개의 컴퓨터 모니터로 구성된다. 각 모니터 화면은 유전 알고리즘(Genetic algorithm)에 따라 무작위로 산출된 인공생명체의 이미지를 보여준다. 관람자는 마음에 드는 이미지를 선택할 수 있고 선택받은 개체(인공생명)는 살아남아 가상공간에서 진화해 나간다. 진화는 교배와 번식을 통해 자신의 유전자 정보를 후손에게 물려주면서 진행된다. 반대로 선택받지 못한 개체는 도태된다. 즉 소멸한다. 이 과정에서 관람자와 컴퓨터 프로그램의 역할이 나뉜다. 관람자는 아름다운 개체를 선택함으로써 미적인 정보의 공급자가 된다. 한편 컴퓨터는 그렇게 제공된 정보를 바탕으로 인공유기체의 유전자를 결정하고 성장과 번식 등 진화 과정 전체를 조율한다. 이 때 알고리즘은 이전에 산출됐던 개체가 다시 반복되지 않도록 프로그램 되어 있다. 말하자면 <갈라파고스>를 주도하는 유전 알고리즘은 항상 새로운 개체를 산출한다. 칼 심스가 유전 알고리즘의 창의적 가능성을 주장하는 까닭도 그 때문이다. 요컨대 자연의 생물학적 진화가 ‘본질적으로’ 새롭다면 이를 시뮬레이션 하는 인공 진화도 다르지 않다는 것이다.

그러나 새로움이 늘 예술의 창의성과 직결되지는 않는다. 새로워도 창의적이지 않을 수 있고, 반대로 낡은 것이 창의적일 때가 있다. 문제는 새로움(혹은 낡음)이 그 공간의 규범 속에서 어떻게 수용되느냐에 달려있다. 또 다른 문제를 고려해야 한다. 실상 <갈라파고스>는 끊임없이 새로운 이미지를 산출하고 선택을 통해 ‘진화’하지만 무수한 그 이미지들 사이에는 어떤 시각적 유사성도 없다. 요컨대 스타일이 없다. 예술가의 스타일을 중시하는 현재의 패러다임 속에서 이 새로운 이미지들은 단지 ‘우연’의 산물에 불과할 따름이다. 그럼에도 불구하고 이 실험적 작업의 미래는 열려있다. 엄밀한 규칙들의 집합인 알고리즘이 예측 불가능한 ‘새로움’을 산출할 수 있다는 사실은 프로그램 기반 예술의 가능성을 보여주기 때문이다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

타자기와 카메라

타자기와 카메라

타자기와 카메라
08/05/2020
/ 박평종

타자수로 군복무를 마친 내게 타자기의 의미는 각별하다. 이등병 때 4벌식으로 타자를 배웠는데, 상병 무렵 부대 전체의 타자기가 2벌식으로 바뀌면서 적응에 애를 먹었다. 2벌식과 4벌식의 차이는 받침과 쌍자음, 이중모음의 처리방식에 있다. 자판 배열은 거의 같지만 받침을 처리할 때 4벌식에서는 새끼손가락으로 시프트키를 누른 상태로 자판을 눌러야 한다. 2벌식의 경우 시프트키를 누르면 잠금장치가 작동하여 손가락을 뗀 상태에서 자판을 누를 수 있고 자판을 누르는 순간 잠금은 자동 해제된다. 이 ‘구조적’ 차이가 몇 가지 다른 차이를 만들어 낸다. 첫째, 4벌식의 받침과 쌍자음은 시프트키를 누르는 새끼손가락의 압력에 따라 위치와 모양에 미세한 차이를 낳는다. 그에 비해 2벌식의 글씨 모양은 한결같다. 둘째, 시프트키의 잠금장치가 걸렸다 해제되는 영점 몇 초 정도의 순간이 타자를 아주 잘 치는 특급 타자수들에게는 다음 자판을 누르는 데 방해가 된다. 물론 그 정도로 타자를 빨리 치는 초일류 타자수는 흔치 않지만, 기계보다 빠른 손은 드물게 존재한다.

타자기가 나오기 전까지 글씨는 손으로 ‘그려서’ 써야했다. 그래서 손 글씨에는 글 쓰는 자의 개성, 낭만주의 시대의 표현으로는 ‘영혼’이 담겨있다고 생각했다. 그런 점에서 모든 손 글씨는 잘 쓰든 못 쓰든 캘리그라피, 말하자면 글이자 그림인 기호다. 한편 정형화된 활자를 기계적으로 찍어내는 타자기의 글씨는 개성 없는 타이포그래피, 즉 유형으로 굳어진 기호다. 손 글씨에 문자와 이미지의 특성이 혼재한다면 타자기는 후자를 추방함으로써 순수한 문자시대를 열었다고 할 수 있다. 정보를 생산하는 속도, 즉 정보량도 중요하다. 손 글씨로는 타자수의 글쓰기 속도를 결코 따라잡을 수 없다. 독수리 타법으로 치는 이들은 예외지만…

카메라와 타자기는 여러모로 유사하다. 우선 정보를 생산하는 속도가 그렇다. 카메라로 사진을 ‘찍는’ 속도는 손으로 이미지를 그리는 데 걸리는 시간에 비할 바가 못 된다. 이미지를 생산하는 자의 ‘개성’도 타자기가 그렇듯 카메라에 투사되지 못한다. 카메라는 대상을 ‘기계적으로’ 재현할 뿐이고, 찍는 자의 개성은 극히 제한적으로만 발휘될 수 있다. 물론 찍는 자의 ‘스타일’은 있다. 그래서 한 장의 사진으로 그를 이해할 수는 없다. 어쨌든 사진이 그림을 대체하면서 이미지 생산에 사람의 개성이 스며들 여지는 대폭 줄어들었다. 타자의 보편화로 손 글씨를 보기 힘들어진 것처럼 손 그림도 희귀해졌다.

 

이런 유사성에도 불구하고 카메라와 타자기는 다르다. 전자가 이미지, 후자가 문자를 처리한다는 근본적인 차이 외에도 정보의 기록이라는 차원을 고려해야 한다. 실상 카메라는 사진이 발명되기 훨씬 전부터 ‘어두운 방(Camera obscura)’의 형태로 존재해 왔다. 사진은 이 ‘상자’에 맺힌 빛의 궤적을 감광물질을 통해 고정시킨 이미지다. 따라서 카메라만으로는 이미지를 ‘기록’할 수 없다. 한편 타자기는 자판과 연동된 활판이 먹끈(잉크리본)에 순간적인 압력을 가해 문자를 ‘찍어내는’ 구조다. 금속활자의 인쇄방식을 변형시킨 셈이다. 따라서 애초부터 타자기는 ‘순간인쇄’, 그리고 ‘단일인쇄’를 위해 고안된 기계다. 타자기의 먹끈은 아주 단순한 원리로 작동하나 실상 정보를 ‘무한히’ 기록할 수 있다는 점에서 혁명적이다. 먹끈은 두 개의 원반에 고정돼 있고 자판을 칠 때마다 규칙적으로 한 칸씩 이동하면서 한쪽으로 감긴다. 이렇게 활자를 기록하다가 끈이 모두 풀려 한계치에 이르면 다시 반대쪽으로 감긴다. 그리고 이 양방향 운동은 ‘이론적으로’ 무한히 계속될 수 있다.

카메라에 대한 문헌기록은 11세기 이슬람 학자 알하젠의 책에 등장하지만 이 시기의 장치는 먹끈 없는 타자기와 다를 바 없다. 따라서 이미지 정보를 기록할 수 있는 감광물질이 19세기에 카메라와 ‘결합’하면서 비로소 사진이 발명됐다고 얘기한다. 그러나 감광물질을 바른 필름은 값이 비쌌고 한번 이미지를 기록하면 ‘재활용’이 불가능했다. 말하자면 일회용이었다. 그런데 디지털 카메라가 나오면서 정보를 ‘무한히’ 저장할 수 있게 됐다. 당연히 ‘재활용’도 가능하다. 실상 타자기도 워드 프로세서로 진화하면서 디지털 카메라와 비슷한 ‘혜택’을 입게 됐다. 두 기계가 생산하는 정보는 모두 동일한 형태의 데이터로 저장되기 때문이다. 그리고 그 귀결점은 컴퓨터다. 오늘날의 타자기와 카메라는 ‘거의’ 컴퓨터로 통합되고 있다. 워드프로세서와 디지털 카메라 기능을 장착한 휴대폰은 이름만 ‘전화기’지 실상은 모든 정보를 하나로 통합시켜 처리하는 컴퓨터다. 이런 환경에서 이미 타자기는 사라졌고 카메라도 비슷한 운명에 처해있다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

찍으면 나오고 누르면 열릴 것이다

찍으면 나오고 누르면 열릴 것이다

찍으면 나오고 누르면 열릴 것이다
07/15/2020
/ 박평종

 휴대폰이 보급되기 전까지 전화번호를 기억하는 능력은 참으로 비상했다. 기억력이 좋은 편이 아님에도 자주 쓰는 번호는 잊어버리는 법이 없었다. 심지어 20-30년 전에 자주 걸었던 ‘특별한’ 전화번호들을 아직도 기억한다. 그런데 지금은 대부분의 전화번호를 거의 기억하지 못한다. 개인정보 확인을 위해 내 전화번호는 또렷이 기억하나 다른 번호는 기억의 목록에 없다. 아내의 번호도 모르고, 정기적으로 문안인사 드리는 어머니 번호도 모르며, 일주일에 몇 번씩 통화하는 지인들의 번호도 알지 못한다. 뭐 119 같은 번호야 잊어버릴 일이 없지만.

이유는 간단하다. 대부분의 번호는 휴대폰에 저장되어 있으며, 목록에서 찾지 않더라도 자주 거는 번호는 단축키만 누르면 되기 때문이다. 단축키가 아니어도 목록을 뒤져 터치만 하면 된다. 키가 핵심이다. 키(key)는 무엇일까? 키보드의 자판을 뜻하지만 그것만 가리키지는 않는다. 혹자는 단추, 버튼이라고도 부른다. 키의 역할이 중요하다. 키는 문자 그대로 열쇠를 가리키는데, 말하자면 여기서 저기로, 즉 여기서 보이지 않는 다른 공간으로 들어가기 위한 해결책이다. 간단한 동작 하나로 공간 이동을 가능케 하는 놀라운 힘이 키에 있다. 따지고 보면 공간 이동이라기보다 두 상이한 공간을 연결해 주는 장치라 할 수 있다. 단추가 그렇고 버튼이 그렇다. 고리 형이든 똑딱이 형이든 단추는 옷의 양쪽을 연결해주는 물건이고, 버튼은 본래 전류의 흐름을 연결하거나 차단하는 장치로 스위치와 같은 기능을 한다. TV나 컴퓨터의 on/off 버튼이 그 예다. 누르면 순식간에 새로운 공간이 열리고 다시 누르면 바로 닫힌다.

볼록한 형태의 키는 이제 휴대폰 액정화면의 평평한 키로 진화했다. 모양은 달라도 원리는 같다. 전자를 작동하려면 손가락의 압력, 손목의 근육이 필요하다. 무수히 키를 눌러대는 이들에게 ‘손목터널증후군’이라는 신종 장애가 생겨난 이유다. 평평한 키로 바뀌면서 그런 우려는 사라질 것 같다. 가벼운 터치가 ‘힘든’ 노동을 대체한 덕분이다. 그래도 어쨌든 키의 기능은 불변이다.

 

카메라 셔터도 일종의 키다. 사실 정확히 말하자면 셔터가 아니라 버튼이 키다. 사진을 촬영할 때 셔터를 누른다는 표현은 잘못이다. 셔터는 카메라 내부에서 빛을 차단하고 있다가 촬영 순간 빛이 렌즈를 통해 필름에 도달하도록 설계된 장치일 뿐이고, 이를 작동시키는 도구가 단추, 즉 버튼이다. 셔터는 차단이 목적이나 버튼은 개방을 위해 있다. 19세기에 카메라 대중화의 길을 처음 열었던 코닥의 광고 문구는 “You press the button, We do the rest”였다. 따라서 카메라를 작동시켜 현실세계와 가상세계(이미지)를 연결시켜 주는 장치도 결국 키(버튼)다. 셔터의 버튼을 누르는 순간 이 세계와 저 세계의 접점이 완성되는 것이다. 그런데 키를 누르는 ‘간단한’ 동작이 어떻게 ‘복잡한’ 정보를 대번에 저장할 수 있을까? 사전에 그렇게 설계됐기 때문이다. 말하자면 현실의 모습을 유사 이미지로 포착하게 돕는 광학이론(카메라)과 그 이미지를 감광물질 위에 저장하게 해주는 화학이론(혹은 디지털 기술)의 연합을 통해 프로그램 되어 있는 것이다. 버튼을 누르는 동작은 그 프로그램을 작동시키는 행위일 뿐이다. 그래서 사진을 생산하는 데는 ‘고도의’ 훈련이 필요 없다. 버튼을 누를 수 있는 힘과 의지만 있으면 누구나 가능하니까. 그러나 ‘가치 있는’ 사진을 생산하는 것은 다른 문제다. 키를 눌러야 사진이 찍히지만 그것이 본질은 아니라는 뜻이다.

오늘날 키는 정보 생산을 위한 가장 보편적인 통로가 됐다. 과거에는 눈으로 직접 보면서 쓰거나 그려야 했다. 선적인 행위, 요컨대 연속적인 행위다. 한편 키를 누를 때 우리는 무엇이 화면에 펼쳐질지 알지 못한다. 즉 자신이 생산할 정보를 보지 못한 채 맹목적으로 생산 행위에 가담한다. 그리고 그 행위는 점을 찍듯이 불연속적이다. 찍는 행위는 사실 불확실성을 수반한다. 시험문제를 풀 때 모르면 찍는다고 하지 않던가. 알면 찍을 필요가 없기에. 모르면 찍는 수밖에 없다. 점쟁이의 예측도 실상 찍는 행위다. 요컨대 수많은 경우의 수 중 하나를 무작위로 선택할 때 찍는다고 말한다. 그렇게 보면 사진을 찍는다는 표현은 사진의 특성을 명쾌히 함축하고 있다. 카메라는 무수한 가능성 중 무작위로 하나를 ‘찍어내기’ 때문이다. 그런데 무엇이 나올지 몰라도 버튼을 눌러야 한다. 버튼은 본래 누르기 위해 제작됐으므로. 간단한 터치가 때로 파국을 불러올 수도 있다. 따라서 신중한 ‘터치’가 필요하며, 그것이 어떤 세계를 열어줄지 예측할 수 있어야 한다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

도둑 잡는 도둑

도둑 잡는 도둑

도둑 잡는 도둑
06/17/2020
/ 박평종

AI의 사진 복원

포토샵의 시대가 저물고 있다. 디지털 기술의 보급 이후 사진 편집기의 대명사로 여겨졌던 포토샵은 이제 다른 기술로 대체될 조짐이다. 이 사진 편집기의 출시년도가 1990년이니 벌써 30년 동안 부동의 왕좌를 차지하고 있었던 셈인데, 이제 그 자리를 컴퓨터 알고리즘이 넘보는 상황이다. 포토샵의 권위는 확고부동했다. 아날로그 사진 이후를 포스토 포토그래피라 부르며 디지털 사진과의 차별성을 논할 때도 포토샵은 디지털 사진 자체를 가리킬 정도였으며, 어도비 포토샵이라는 고유명사는 마치 보편명사처럼 사용될 만큼 대중들의 뇌리에 확고히 자리 잡았다. 

포토샵의 ‘능력’은 사진의 보정과 합성이라는 두 측면에서 대단히 우수했다. 노출이 잘 맞지 않은 상태로 찍힌 사진, 명암 차가 커서 디테일이 잘 표현되지 않은 사진을 보정하는 것은 물론이고 색상과 형태도 ‘어느 정도’ 바꿀 수 있어 수정 능력 또한 훌륭했다. 디지털 성형을 통해 딴 사람이 되는 경우도 흔했다. 물론 ‘뽀샵’을 잘 해야 하지만… 서로 다른 두 장 이상의 원판을 합성할 때도 포토샵의 위력은 대단했다. 포토샵이 없었을 때, 말하자면 아날로그 시대에 사진을 합성하려면 ‘고도의’ 기술이 필요했다. 포토몽타주라 불리는 합성사진은 보편적이지 않았을 뿐만 아니라 눈에 띄게 자국이 남아 ‘허접’했다. 그런데 포토샵으로 쉽고 정교하게, 눈치 챌 수 없을 만큼 티 나지 않게 사진을 합성하는 것이 가능해지면서 패러다임도 달라졌다. 과거에는 사진을 ‘기록’이나 ‘현실의 흔적’으로 생각해 왔으나 포토샵은 사진의 개념을 ‘허구’와 ‘가상’으로 바꾸어 놓았다. 일반인들이 제작한 합성사진의 품질은 ‘너무도’ 뛰어나 이제 작가들은 자신이 합성한 ‘작품사진’이 그들의 ‘놀이’와 ‘왜’ 다른지 입증해야 하는 곤혹스러운 처지에 놓이게 됐다. 이것이 포토샵 ‘제국’이 야기한 결과들이다.

 

그런데 이제 상황은 변하고 있다. 예컨대 앤비디아(Nvidia)에서 개발한 사진합성 알고리즘은 기능이나 성능, 속도 등 모든 면에서 포토샵을 압도한다. 귀찮은 ‘노동’도 요구하지 않는다. 실상 포토샵을 활용한 합성사진에는 정도의 차이는 있을지언정 접합의 흔적이 남는다. 그런데 앤비디아의 알고리즘은 전혀 그렇지 않다. 적대적생성신경망(GAN)을 적용한 ‘StyleGAN’은 마치 실제 인물처럼 두 장 이상의 이미지를 합성해 낼 수 있다. 이는 ‘판별자’를 속이는 ‘생성자’가 고도의 ‘유사 이미지(가짜)’를 만들어내도록 최적화되어 있는 GAN알고리즘의 원리 때문이다. 포토샵의 목표가 합성의 흔적을 분간할 수 없을 만큼 정교한 이미지를 만들어내는 데 있다면 그 목표는 이제 이 알고리즘에 와서 달성됐다고 할 수 있을 정도다. 사람의 눈은 그 차이를 알아보지 못한다. 포토샵이 담당해 왔던 보정, 수정기술도 이미 AI 기반의 신기술을 통해 ‘정복’되고 있다. 저해상도 사진을 고해상도로 복원하는 것은 물론이고 각종 ‘노이즈’ 처리도 탁월하게 수행하는 것이다.

*GAN알고리즘에 대해서는 필자의 다른 칼럼 <한없이 진짜에 가까운 가짜>에서 다룬 바 있다.

 

AI의 사진 합성

변화의 내용이 합성의 용이함과 정교함에만 있지는 않다. 그 못지않게 근본적인 변화는 합성의 주체가 인간에서 기계로 바뀐다는 사실이다. ‘포토샵 제국’은 ‘뽀샵질’을 잘하는 사람에게만 접근 가능했다. 한편 알고리즘은 ‘뽀샵질’을 못하는 이에게도 완벽한 합성의 길을 열어줄 것이다. 기계가 알아서 해준다는 뜻이다. 그리고 그것이 합성인지 아닌지, 요컨대 진짜인지 가짜인지 구별할 능력은 사람에게 없다. 그런데 놀랍게도 사람에게는 다른 능력이 있다. 자신이 못하는 것을 기계가 대신하라고 가르치는 능력이 그것이다. 앤비디아에서 최근에 개발한 다른 알고리즘은 사진의 합성 여부를 판별하는데, 정확도는 매우 높다고 알려져 있다. 이런 기술들은 아직 완전하지 않으나 날로 고도화되는 추세다. GAN알고리즘이 생성자와 판별자라는 두 축으로 구성돼 있어 가능한 논리다. 도둑을 알아보는 눈은 경찰보다 도둑이 더 낫지 않을까 싶다. 도둑 잡는 도둑이라고나 할까.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

골짜기일까, 정상일까

골짜기일까, 정상일까

골짜기일까, 정상일까
05/28/2020
/ 박평종

캔디

어린 시절 만화 <캔디 캔디>를 즐겨봤는데, 돌이켜 생각해보면 얼굴의 절반 가까이를 덮어버릴 정도로 큰 눈이 이상하다는 생각은 하지 않았던 것으로 기억한다. 오히려 ‘큰 눈’은 선망의 대상이었던 것 같다. 2019년에 개봉한 영화 <알리타: 배틀 앤젤>에 등장하는 사이보그 알리타도 과도하게 큰 눈을 가졌지만, 그 점이 오히려 관객들에게 호감을 불러일으켰다고 한다. 한편 사람과 비슷하게 생겼어도 왠지 불편하고 때로는 불쾌하며 심지어 두려움을 불러일으키는 경우가 있다. 호러 영화에 등장하는 각종 유사인간 캐릭터나 좀비가 그렇다. 이들은 사람과 닮았음에도 혐오와 공포의 대상이다. 이처럼 사람과 생김새는 유사하나 ‘기이한’ 행동을 하는 존재로부터 받는 특이한 감정을 심리학자들은 ‘불쾌한 골짜기(Uncanny valley)’ 이론으로 설명한다. 물론 모두가 동의하지는 않는다. 본래 로봇공학 분야에서 나온 이 이론의 요지는 다음과 같다. 어떤 존재(예컨대 로봇)가 인간을 닮을수록 호감이 증가하다가 어느 순간부터 급격히 불쾌감으로 바뀌며 다시 원래의 호감을 회복한다는 것이다. 불쾌감은 인간과의 유사함에 대한 기대가 꺾이는 순간, 말하자면 비슷하게 생겼는데 어색한 행동을 보이는 지점에서 발생한다. 왜 그럴까? 불쾌감을 불러일으키는 이유가 중요하다. ‘불쾌감’으로 번역되는 ‘언캐니’의 원인이 핵심이라는 뜻이다.

‘골짜기’ 이론을 제안한 일본의 로봇공학자 모리 마사히로는 프로이드의 언캐니 개념에서 이 발상을 끌어왔다. 프로이드의 언캐니는 독일어 ‘운하임리히(unheimlich)’의 번역어다. 이 단어는 ‘하임리히(heimlich)’와 한 쌍으로 프로이드는 이 단어가 지닌 여러 의미 중 ‘익숙함/낯설음’에 중점을 두고 해석한다. 말하자면 언캐니는 원래 익숙했던 것이 갑자기 익숙하지 않게, 낯설게, 섬뜩하게 인식될 경우 발생한다는 것이다. 프로이드는 이 개념을 한스 호프만의 <모래인간> 해석에서 끌어왔는데, 복잡하고 난해한 해석의 여러 가지들을 쳐내고 ‘골짜기’ 이론과의 관련성만 따지자면, 여기에는 주술적 의미가 깔려있다. 언캐니가 발생하는 여러 원인 중 대표적인 예는 물건(예컨대 인형)이 특정 상황에서 살아있는 생명처럼 인식되는 경우다. 이를 프로이드는 현대인이 ‘이미’ 극복한 애니미즘적 사고가 ‘부활’한 것으로 본다. 말하자면 애니미즘이라는 ‘주술적 사고’는 완전히 극복되지 못한 채 ‘무의식’에 남아있다는 것이다.

불쾌한 골짜기(Uncanny Valley)

본래 인형은 생명이 없는 물건이며, 그것이 ‘하임리히’, 즉 익숙한 관념이다. 그런데 그 ‘죽어있는’ 인형이 어느 순간 생명체처럼 느껴질 때 ‘운하임리히’, 즉 익숙하지 않은 관념을 건드린다. 당초의 익숙한 관념이 동요하면서 낯설음은 기이함으로, 나아가 섬뜩함으로 바뀐다는 것이다. 독일 작가 한스 벨머(Hans Bellmer)의 <인형> 작업에 대한 로잘린드 크라우스의 해석도 그런 맥락에 있다. 좀비가 전형적인 예다. 시체가 살아 움직인다는 허황된 발상에도 불구하고 언캐니는 주술적 관념의 찌꺼기 덕분에 이미 반세기 전 달에 토끼가 없다는 사실을 확인한 현대인의 정서를 여전히 건드리고 있다. 물론 좀비를 믿지는 않지만 말이다. 로봇에게 느끼는 언캐니도 그렇다. ‘골짜기 이론’의 관점에서 보면 로봇이 사람과 비슷할수록 호감은 당연히 증가하는데, 어느 순간 어색한 행동을 보이면 익숙함이 기이함으로 바뀌는 것이다. 몇 년 전 한국을 방문했던 휴머노이드 ‘소피아’도 이 ‘골짜기’ 근처 어딘가에 있다.

최근 논란이 되고 있는 리얼돌(realdoll)도 이 ‘골짜기’ 안에 있다고 보는 시각이 있다. 리얼돌은 그냥 쉽게 섹스로봇이다. 킬러로봇도 개발되고 있는 마당에 섹스로봇이 없을 수 없다. 그런데 리얼돌의 상품성이 크다면, 다시 말해 이 ‘섬뜩한’ 인형을 찾는 사람이 많다면 ‘골짜기’ 이론은 잘못됐거나 리얼돌은 언캐니하지 않거나 둘 중 하나다. 아, 다른 가능성 하나가 더 있다. 언캐니를 ‘즐기는’ 경우다. 그 때 리얼돌은 호감도 그래프의 ‘골짜기’가 아니라 정상에 있다.

한스 벨머, 인형

리얼돌

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)