사진 찍힌 적이 없는 자들의 사진

사진 찍힌 적이 없는 자들의 사진

사진 찍힌 적이 없는 자들의 사진
06/02/2021
/ 박평종

아우구스투스 황제, 다니엘 보샤트

예수, 바스 우테르비크

인공지능 기반 이미지 제작 플랫폼들이 늘고 있다. 그 중 하나가 아트브리더(Artbreeder)로, 사용자가 사진을 업로드하고 원하는 조건을 선택하면 그에 부합하는 ‘맞춤형’ 이미지를 무작위로 제공한다. 여기에 사용된 핵심 기술은 StyleGAN과 BigGAN이다. StyleGAN은 이미지 합성을 통제하기 위해 학습 과정에서 각 레이어마다 해당 이미지의 스타일을 조정할 수 있도록 설계된 생성모델이다. 예컨대 거친 해상도 단계에서는 성별이나 포즈 등을, 중간 해상도 단계에서는 얼굴의 부분적인 특징이나 헤어스타일을, 미세 해상도 단계에서는 눈동자 색깔이나 머리카락 색깔, 그 밖의 미시적 특징을 조절한다. 이미지는 스타일의 조합이라는 전제가 깔려있는 셈이다. StyleGAN 기반 이미지 생성 알고리즘을 활용한 대표적인 플랫폼은 앤비디아가 개발한 “Generated Photos”로 2021년 현재 260만 장 이상의 인물사진을 보유하고 있으며, 계속 늘어나는 추세다. BigGAN은 생성 이미지의 ‘사실성’을 높이기 위해 2019년에 개발된 모델인데, GAN의 성능을 측정하기 위해 고안된 지표 IS(Inception Score)와 FID(Fréchet Inception Distance)에서 가장 높은 점수를 받은 바 있다.

아트브리더는 접근성도 좋고 이미지의 품질과 다양성 측면에서도 뛰어나 활용 가능성이 높다. 이 플랫폼을 예술 창작의 수단으로 활용하는 작가들도 늘고 있다. 캐나다의 다니엘 보샤트(Daniel Voschart)는 <로마 황제 프로젝트(Roman Emperors Project)>에 이 플랫폼을 적극 활용했다. 보샤트는 우선 54명의 로마 황제들에 대한 역사적 자료를 수집하고 그들이 살아생전에 제작됐던 흉상 조각들을 기계학습 데이터(사진)로 변환시켰다. 대략 800점 정도의 이미지가 사용됐다. 살아생전의 흉상이 없는 경우 동전에 묘사된 이미지를 사용하기도 했다. 이 이미지를 아트브리더에 업로드하여 생성된 이미지는 ‘거의’ 사진처럼 보인다. 사진이 없었던 시대에 살았던 고대 로마 황제들의 ‘사진’이 나온 셈인데, 보샤트는 이 파일을 프린트로 제작하여 에디션을 부여한 후 작품으로 내놓았다.

람세스 2세와 네페르타리

자유의 여신상

네델란드의 사진작가 바스 우테르비크(Bas Uterwijk)도 아트브리더를 적극 활용한다. <AI Generated Portraits> 시리즈가 그 예로 이 작업은 두 가지로 나뉜다. 첫째는 <친숙한 얼굴(Familiar Faces)>연작으로 반 고흐, 예수, 나폴레옹, 엘리자베스 여왕(1세) 등의 ‘사진’이다. 둘째는 <대체 불가능한 토큰(None Fungible Tokens)>, 제목이 암시하듯 암호 화폐 방식으로 자동 생성된 ‘가상’의 인물사진이다. 두 작업 모두 아트브리더의 GAN 알고리즘이 활용됐다. 예수의 ‘사진’은 유럽 각 성당에 있는 이콘화가 바탕이고, 16세기의 엘리자베스 여왕은 생전에 제작됐던 다수의 초상화가 학습 데이터로 활용됐다. 심지어는 자유의 여신상 조각을 학습시켜 제작한 ‘여신’의 사진도 작품 목록에 들어있다. 고대 이집트 람세스 2세의 왕비였던 네페르타리의 사진, 카이사르의 사진, 킹 알렉산더의 사진도 있으니 참으로 놀라운 일이다.

디지털 기술의 발전으로 사진이 허구와 가상의 영역을 넘나들던 때도 사진에 대한 ‘보편적 통념’은 여전히 확고했다. 요컨대 사진은 카메라 앞에 실제 존재했던 대상만을 찍는다는 것이다. 사진이 지닌 ‘인증’의 힘은 거기서 나온다. 그런데 이제 사진 발명 이전의 인물, 말하자면 한 번도 사진 찍힌 적이 없었던 인물의 사진이 생산되고 있다. ‘고전적인’ 사진 패러다임에 비추어 보면 이 이미지는 사진이라 할 수 없다. 그냥 사진처럼 보이는 이미지일 따름이다. 그렇다면 이 ‘생성 이미지’를 무어라 불러야 할까? ‘사진 같은 이미지’이기는 하다. 예컨대 보샤트의 <로마 황제 프로젝트>의 공식명칭에는 앞에 ‘Photoreal’이라는 형용사가 붙어있다. 게다가 수많은 GAN의 변형 알고리즘들은 대체로 이 ‘포토리얼리스틱’한 효과를 극대화하기 위해 다양한 기술을 적용한다. 사진에 대한 ‘고전적인’ 개념은 어쩌면 19-20세기의 유산일지도 모르겠다. 실재를 시간과 더불어 통째로 기록할 수 있는 기술이 그 시대에는 ‘경이’로운 일이었겠지만 이제 그 정도는 별로 놀랍지 않다. 어쨌든 중요한 문제는 알고리즘이 생산한 이미지가 사진이냐 아니냐가 아니라 얼마나 사진처럼 보이느냐에 있다. 물론 사진이냐 아니냐는 중요하다. 지금도 여전히 그에 따라 진실이 판가름 나니까. 그런데 그 차원을 벗어나면 그런 규정은 아무 의미가 없다. 사진의 개념이 생각보다 빨리 바뀔지도 모르겠다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)

보고 싶(지 않)은 얼굴

보고 싶(지 않)은 얼굴

보고 싶(지 않)은 얼굴
05/12/2021
/ 박평종

낸시 버슨(Nancy Burson)의 1986년 작 <나이 든 마릴린 먼로(Aged Marylinn Monroe)>, 1962년에 작고한 할리우드 여배우의 ‘늙은’ 얼굴을 합성한 작품이다. 1926년에 태어났으니 36세에 세상을 떠났고 86년이면 환갑의 나이다. 이 ‘늙은’ 얼굴이 얼마나 진짜에 가까운지는 입증할 수 없다. 만약 살아있었더라도 병에 걸리거나 보톡스를 많이 맞거나 했다면 버슨의 작품과는 전혀 다른 얼굴일 수 있다. 그래도 그 이미지는 영락없는 먼로다. 나이 들어 사진 찍히면 보통 흉측하다고들 한다. 그래서 좀처럼 카메라 앞에 서려 하지 않는다. 젊을 때 많이 찍어놓을걸, 하는 생각이 들기도 한다. 그런 점에서 보면 마릴린 먼로는 자기 의지와 상관없이 버슨에게 당한 셈이다. 누구였던가, 프랑스의 어느 여배우는 나이 든 이후 한 번도 카메라 앞에 나타나지 않았다. 대중의 환상 속에 남고 싶었던 것이다. 어쨌든 20세기 대중문화의 아이콘을 잊지 못하는 이들은 ‘나이 든’ 먼로의 얼굴이 보고 싶었을 것이다. 애정이 깊어서인지, 호기심 탓인지 알 수 없으나 이 ‘보고 싶은 얼굴’의 다른 버전도 많이 나와 있다.

컴퓨터의 사진 합성 기술이 조악했던 시절 버슨의 작품은 신선했다. 그런데 이제 이 ‘나이 든 얼굴’의 합성은 너무도 간단한 기술이 됐고, 품질도 좋아졌다. GAN 알고리즘 덕이다. 2017년에 발표된 FA GAN(Face Aging GAN), 이걸 개량한 PFA GAN(Progressive Face Aging GAN) 등은 한 장의 얼굴사진으로부터 나이대별로 노화하는 얼굴 이미지를 합성해 내는 알고리즘이다. 게다가 새로 생성된 이미지는 원래 인물의 정체성(identity)을 유지한다. 방법은 CGAN(Conditional GAN)의 활용에 있다. 본래 GAN은 생성자와 판별자의 대립구도를 통해 원본과 유사한 가짜 데이터를 산출하는 데 특화된 생성모델이다. 이 때 생성자는 데이터를 무작위로 산출하기 때문에 사용자가 원하는 방향의 이미지를 얻어낼 수 없다. 예컨대 마릴린 먼로의 사진에서 나이 든 오드리 햅번이 나올 수도 있다는 뜻이다. 따라서 이미지의 방향을 통제하기 위해 잠재변수에 조건을 부여한다. 여기서 잠재변수는 원본과 유사한 가짜 데이터를 얻기 위해 픽셀 값의 편차를 만들어내는 요소다. 그리고 FA GAN에서 이 조건은 인물의 정체성을 유지하는 것이 목표다.

이 알고리즘의 개발자들은 인물 고유의 정체성을 유지하는 ‘미래의 얼굴’이 대단히 중요한 과업이라고 주장한다. 연령을 초월한 인물 식별에 효과적이기 때문이다. 예컨대 한참 세월이 흐른 뒤에도 실종된 아이를 찾는 데 도움을 줄 수 있고, 한 인물이 미래에 어떤 모습을 하게 될지 예견하는 데도 효과적이라는 것이다. 그 주장처럼 이 알고리즘의 효용가치는 높다. 대부분의 과학기술이 그렇듯이 말이다. 그러나 그런 긍정성과는 별개로 ‘나이 든’ 모습을 미리 본다는 것은 서글픈 일이기도 하다. 굳이 미리 보지 않아도 언젠가는 보게 될 테니까. 가능하면 시간을 유예시키고 싶은 것이 인간의 보편적인 욕망인데 일부러 미래를 앞당겨 보려 하는 짓궂은 짓을 할 필요가 있나 싶기도 하다. 어릴 때는 시간이 빨리 흘러 어른이 되고 싶고, 나이 들면 시간이 더디 흘러 지금에 멈추고 싶어 하는 것이 사람 마음이다. 아이들이 성장하는 모습에서 부모는 기쁨을 느끼지만 반대로 부모의 얼굴에 주름이 깊게 패여 가는 모습에 사람은 마음 아파하지 않던가. 젊은 시절에 찍었던 기념사진을 보면 내게도 저런 모습이 있었나 싶을 때가 있고, 가까운 지인들의 모습에서도 마찬가지다. 별로 보고 싶지 않은 ‘늙은’ 얼굴을 일부러 ‘만들어서’ 볼 이유가 없다는 얘기다. 그래도 그 기술이 유익하게 쓰일 수 있다면 별 수 없지만 말이다.

다른 한편으로 이 ‘미래의’ 얼굴은 ‘전통적인’ 관념에 비추어 볼 때 사진이라 할 수 없다. 그 관념에 따르면 카메라 앞에 ‘존재하는’ 대상을 찍어낸 이미지만이 사진이기 때문이다. 실상 과거는 ‘이미’ 없고, 미래는 ‘아직’ 없다. 늘 ‘지금, 여기’만, 말하자면 현재만 있다. 그래서 사진은 과거도, 미래도 찍지 못한다. 그런데 놀랍게도 모든 사진은 항상 ‘이미’ 없는 과거만 보여준다. 그리고 이제 ‘아직’ 없는 미래를 건드리기 시작했다. 놀라운 일이다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)
머글의 마법이 시작됐다!

머글의 마법이 시작됐다!

머글의 마법이 시작됐다!
04/21/2021
/ 박평종

해리 포터의 마법사들이 구사하는 ‘초자연적인’ 마법과 그들이 ‘머글’이라 부르는 평범한 인간들의 과학기술에는 큰 차이가 있다. 마법이 자연의 질서를 지배하는 물리적 법칙을 뛰어넘는 데 비해 과학은 그 법칙을 존중하고 충실히 따른다. 그런 머글의 눈에 마법은 그저 놀라울 따름이다. 반대로 마법사의 눈에도 머글의 과학기술은 신통방통한 데가 있다. 물론 머글을 경멸하는 ‘죽음을 먹는 자들’은 그 기술을 보잘 것 없는 것으로 치부하지만 말이다. 하지만 과학의 관점에서 보면 오히려 마법사의 세계가 머글의 세계에 비해 열등한 측면이 있다. 휴대폰과 인터넷으로 소통하는 머글과 비교하자면 부엉이를 통해 편지를 전달하는 마법사들의 통신수단은 비록 낭만적이지만 얼마나 불편한가. 또한 비행기를 조종하여 수백 명씩 사람을 실어 나르는 머글의 기술에 비해 빗자루를 타고 날아다니는 마법사들의 교통수단은 얼마나 열악한가. 뭐 그래도 텔레포트로 순간 이동을 하는 마법의 세계는 경이로운 구석이 있지만 말이다.

마법세계가 보여주는 또 다른 놀라움 중의 하나가 살아있는 사진이다. 해리 포터의 엄마는 죽었지만 사진 속에서는 항상 살아 움직이며 해리의 곁을 지킨다. 시리우스 블랙의 아즈카반 탈출 소식을 전하는 ‘예언자 일보’의 사진도 그렇다. 그것이 마법의 신비한 힘이다. 그런데 마법을 모르는 머글이 살아 움직이는 사진을 만들어내기 시작했다. 마이 헤리티지(My Heritage)에서 개발한 딥 노스탤지어(Deep Nostalgia)가 그것이다. 마이 헤리티지는 이스라엘에서 운영하는 인터넷 플랫폼으로 가족의 역사를 찾아 수집, 보존하여 확장시키는 것을 목표로 출발했다. 사진을 비롯하여 DNA 검사 키트까지 동원하여 세계 각지에 흩어져 있는 ‘먼 친척’이나 인척 관계의 혈통을 찾아내겠다는 것이다. 딥 노스탤지어는 마이 헤리티지가 최근 개발한 알고리즘으로 사진에 움직임을 부여하는 서비스를 제공한다. 예컨대 작고한 가족의 기념사진에 생생한 움직임을 부여함으로써 살아생전의 모습을 경험할 수 있는 길을 열어주었다.

여기에 사용된 기술은 복합적이다. 기존의 포토샵 기술과 각종 이미지 처리 앱, 딥러닝 기반의 인공지능 기술을 종합적으로 활용하여 ‘머글의 마법’을 완성했다. 그 기술들을 열거하면 다음과 같다. 우선 퇴색하거나 희미해진 사진을 복원하기 위한 언페이드(Unfade) 스캐너다. 나아가 각종 사진 복원 소프트웨어를 통해 낡고 훼손된 사진이나 흑백사진을 컬러로 복원하는 기술을 추가했다. 다음은 컴퓨터 비전 분야에서 가장 주목받는 생성모델인 GAN의 변형 알고리즘이다. 그 중 하나는 MoCoGAN으로 비디오 합성을 위해 특정한 동작과 이미지를 추출하여 학습시키는 생성 모델이다. 또 다른 핵심 기술로는 여러 장의 사진으로부터 말하는 사람의 연속 이미지를 합성해 내는 Few-Shot Learning 알고리즘이 있다. ‘살아있는 초상’을 생성해 내는 GAN 알고리즘의 일종이다.

딥 노스탤지어는 가족의 기념사진뿐만 아니라 이미 사망한 유명 인사의 생생한 얼굴 표정까지 합성하여 살아 움직이는 사람처럼 표현할 수 있는 ‘첨단 기술’이다. 마법의 세계에서나 상상할 수 있는 ‘죽은 사람’의 ‘살아 있는’ 모습을 볼 수 있게 된 것이다. 물론 이 ‘머글의 마법’은 가짜, 요컨대 시물라크룸이다. 그러나 고인이 된 어머니가 눈앞에서 미소 짓거나 불행히도 먼저 세상을 떠난 연인이 윙크를 보내는 모습을 볼 수 있다는 것은 가슴 뭉클한 경험이 될 것이다. 마법을 모르는 머글이 과학기술을 통해 마법을 실현시켰다고나 할까. 원리를 모르면 마법이고 알면 과학이다. 자력과 중력의 원리를 몰랐던 고대인들에게 자석은 마법이었으나 그 힘의 근원을 알고 있는 현대인에게 쇠붙이가 자석에 달라붙는 현상은 그저 기초 상식일 따름이니까.

다른 한편으로 딥 노스탤지어가 지닌 긍정성에도 불구하고 그 기술의 악용을 우려하는 목소리도 높다. 소위 딥 페이크의 고도화에 따른 각종 오남용과 위험성 때문이다. 당연한 우려다. 그러나 기술은 본래 중립적이고 쓰는 자의 윤리가 문제다. 경이로운 마법을 덤블도어는 선하게 사용하지만 ‘이름을 말해서는 안 되는 자’는 악하게 쓰지 않던가. 말하자면 마법이 위험한 것이 아니라 위험하게 쓰는 자가 위험하다는 뜻이다. 그 ‘위험한 자’ 때문에 마법사들이 마법을 포기하지 않듯이 ‘위험한 머글’ 때문에 머글 전체가 과학기술을 버릴 필요는 없다. 머글에게 과학기술은 마법과 맞닿아 있기 때문이다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)
청출어람 청어람

청출어람 청어람

청출어람 청어람
03/31/2021
/ 박평종

이미지 생성 알고리즘이 빠르게 진화하고 있다. 가장 주목을 끄는 모델은 생성적 적대신경망(Generative Adversarial Network, 이하 GAN)으로 2014년에 처음 발표된 후 놀라운 성장을 거듭해 왔다. GAN의 원리를 적용하여 이미지 생성에 활용한 알고리즘은 매우 많고 분야도 다양한데, 그 중 하나가 TPGAN(Two-Pathway GAN)이다. 이 알고리즘은 측면 사진에서 정면 사진을 정확히 합성해 내는 ‘신기’에 가까운 솜씨를 보여주었다. 이것이 어떻게 가능할까?

대부분의 인공지능이 그렇듯이 이 알고리즘도 사람의 사고 과정을 모방한다. 사람이 측면 얼굴에서 정면 얼굴을 유추해 내는 과정을 응용하는 것이다. 사람은 우선 관찰을 통해 측면 정보를 탐색한다. 당연히 별 소득은 없다. 하지만 불확실한 정보를 추론의 재료로 삼아 얼굴에 대한 사전 지식과 비교한다. 정면 얼굴에 대한 지식은 예컨대 두 눈은 평행상태로 놓여있고 코는 수직으로 얼굴의 중앙에 위치하며, 입은 코의 아래쪽에 자리 잡고 있다는 등이다. 이를 바탕으로 정면 얼굴에 대한 전반적인 구조를 추정하는 것이 가능하다. 다음에는 정면의 디테일을 추정하여 얼굴의 전반적인 형태를 산정한다. 옆에서 본 눈이 둥근 형태인지 길게 늘어진 형태인지, 코가 뾰족한지 뭉툭한지, 코와 입의 간격은 어느 정도인지 등 구체적인 세부를 추정하는 것이다. 물론 사람의 기억은 부정확하여 얼굴의 모든 형태를 정확히 상상을 통해 얻어내기란 쉽지 않다. 그래도 어느 정도 근사치에 도달할 수는 있다. 목격자의 기억에 의존하여 몽타주를 그럴싸하게 그려내는 경우처럼 말이다.

어쨌든 TPGAN도 이런 프로세스를 따른다. 전체경로(Global Pathway)라 불리는 첫 단계에서는 얼굴의 전체 구조를 추정하고, 두 번째 단계인 국부경로(Local Pathway)에서는 얼굴의 부분적인 디테일이 전체 구조에 부합하도록 합성을 진행한다. 이 둘을 통합시켜 최종 결과물을 얻어내는데 여기서 GAN의 기본 구조인 생성자(Generator)와 판별자(Discriminator)의 역할이 중요하다. 생성자는 위의 두 경로에서 추출한 데이터를 통합하여 정면 얼굴의 픽셀값을 계산한다. 판별자는 생성자가 산출한 데이터가 얼마나 실재와 가까운지 비교를 통해 식별을 진행한다. 당연히 초기 단계에서 측면사진과 정면사진은 확연히 다르다. 그런데 이 과정이 ‘무수히’ 반복되면 사정은 달라진다. 예컨대 생성자가 ‘처음에’ 제시한 정면사진은 판별자의 눈에 완전히 다른 사람처럼 보일 것이다. 그래서 “다시 만들어 와”라고 돌려보낸다. 생성자는 종전의 실수를 만회하기 위해 좀 더 그럴듯한 정면사진을 만들어온다. 이 과정이 무수히 반복되면서 생성자가 제안하는 정면사진은 실제 얼굴에 가까운 근사치로 수렴한다. TPGAN의 개발자들은 이 알고리즘이 측면사진으로부터 인물의 동일성(Identity)을 유지하는 정면사진을 생성해 냄으로써 합성을 통해 안면인식의 가능성을 입증했다고 자평했다. 그렇다면 활용범위도 넓다. CCTV는 증명사진처럼 ‘정확히’ 인물의 정면을 포착하는 경우가 드물어 인물 식별에 애를 먹는 경우가 많다. 그런 점에서 TPGAN은 예컨대 범죄용의자의 인물 식별에 효과적일 수 있다.

GAN의 원리를 처음 고안한 이안 굿펠로우는 2014년의 논문에서 생성자와 판별자의 관계를 위조지폐범과 경찰의 관계로 설명했는데, 2016년 신경정보처리시스템학회(NIPS)에서 발표한 GAN에 관한 튜토리얼에서는 학생과 교사의 관계에 가깝다고 언급한 바 있다. 말하자면 학생(생성자)이 제출한 답안(생성 데이터)을 교사(판별자)가 검사하는 과정을 통해 학생의 능력이 향상된다는 것이다. 실상 이 ‘검사 과정’은 지겹게 되풀이되므로 사람에게는 고역일 수밖에 없다. 그런데 기계는 지치지도 않고 자존심 상하는 일도 없으며, 정답이 나올 때까지 같은 행위를 반복할 수 있다. 고생 끝에 낙이 온다 했던가. 판별자로부터 무수히 ‘fail’을 맞아가며 유급을 거듭하다 결국 ‘pass’를 따내고야 마는 생성자의 노력은 사람의 눈에 가상해 보이기도 한다. 뭐 어차피 인간이 시킨 일이긴 하지만. 어쨌든 사람의 사고를 모방했지만 사람의 능력을 넘어서는 이 알고리즘은 한편으로 대견한 측면이 있다. 청출어람 청어람이라고나 할까.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)
향수, 사진, 축음기

향수, 사진, 축음기

향수, 사진, 축음기
03/10/2021
/ 박평종

파트릭 쥐스킨트의 소설 <향수>는 사람의 체취를 ‘영원히’ 간직하고자 하는 ‘망상’에 사로잡혀 살인을 저지르는 한 인물의 일대기를 다룬다. 90년대 초에 출간된 이후 베스트셀러 반열에 올랐고 나중에 영화로도 제작되어 널리 회자된 바 있다. 소설의 부제는 “어느 살인자의 이야기”, 문자 그대로 이 픽션은 인간의 ‘향기’를 보존하기 위해 살인을 저지르는 ‘잔혹한’ 내용을 담고 있다. 주인공은 장 밥티스트 그루누이로, 그루누이(Grenouille)는 프랑스어로 개구리를 뜻한다. 몰골이 흉측해서 사람들로부터 경멸의 대상이 된 가련한 인물이다. 어쨌든 천부적인 후각 덕분에 이 ‘개구리’ 인간은 향수 제조의 달인이 되나 살아있는 사람의 냄새를 저장하는 방법이 없다는 사실에 절망하여 자신만의 비법을 찾아 나선다. 문제는 향수를 만들려면 대상의 ‘정수’를 모조리 뽑아내야 한다는 것, 예컨대 꽃의 향기를 저장하게 되면 꽃은 죽는다. 불가능한 욕망에 사로잡힌 그루누이는 결국 인간의 ‘정수’를 뽑아 향수를 만들고 목숨을 희생시키는 선택을 한다. 그렇게 살아있던 인간의 체취가 ‘천상의’ 향수로 저장된다.

감각정보를 저장하는 문제는 문명사의 오랜 숙원이었다. 시각정보는 이미지, 요컨대 그림으로 저장 가능했으나 왜곡이 발생했다. 정보가 왜곡되면 가치는 반감된다. 사진은 왜곡 없이 시각정보를 저장하는 탁월한 방법으로 1839년에 발명됐다. 청각정보는 1877년 에디슨이 발명한 포노그래프(phonographe)를 통해 저장과 재생이 가능하게 됐다. 이른바 축음기의 탄생이다. 이 두 매체는 19세기가 거두어들인 가장 놀라운 성과들이다. 시각정보와 청각정보는 문자 그대로 ‘왜곡 없이’ 저장될 수 있었다. 말하자면 현실에서 발생하는 정보가 바로 그 시간 자체와 더불어 ‘통째로’ 기록된다는 것이다. 여기에서 ‘입증’의 힘이 발생한다. 나아가 이 저장된 정보는 언제라도 다시 원형 그대로 재생될 수 있다는 점이 중요하다.

후각정보는 어떨까? 물론 향수가 있다. 그러나 향수는 사진이나 축음기와 전혀 다른 차원의 정보저장 수단이다. 두 후자는 개별적인 ‘모든’ 현상들을 정보로 기록할 수 있다. 정보가 발생하는 시간이 담긴다는 뜻이다. 반면 향수의 정보는 극도로 ‘추상적’이다. 향수에 담겨있는 바닐라향, 과일향, 초컬릿향, 가죽향 등에는 모두 그 향기를 추출했던 개별자의 정보가 누락되어 있다. 게다가 이 후각정보는 영속적이지 않다. 향수 뚜껑을 열어두면 향은 사라지기 때문이다. 싱글 몰트 위스키의 기본 향은 스코틀랜드 특유의 피트 향을 깔고 있는데, 거기에도 당연히 특정 시간과 장소의 피트 향은 없다. 단지 피트 향이라는 ‘보편’만이 있을 뿐이다. 오래 두면 당연히 향도 달아난다. <향수>의 그루누이가 절망했던 까닭도 그 때문이 아닐까싶다. 물론 픽션에 불과하지만 그는 ‘특정’ 여인의 향기를 영원히 보존하고 싶었던 것이다.
문자도 향수처럼 정보를 ‘추상적으로’ 보존하는 수단이다. 눈으로 본 것, 귀로 들은 것, 코로 맡은 것 모두 문자화될 수 있으며 영구적 보존이 가능하다. 나아가 그 정보를 받아들인 자가 죽어도 타인에게 전달될 수 있다. 문자는 그런 점에서 획기적인 정보 저장수단이다. 그러나 이 모든 문자 정보는 고도로 추상화된 형태라는 점이 문제다. 만화 <신의 물방울>에서 소믈리에가 미각과 후각으로 얻어낸 정보를 표현한 말들은 그저 멋진 수사일 따름이다. 실상 문자만큼 추상적인 정보도 드물다. 내가 눈으로 본 것을 문자로 제아무리 꼼꼼히 기록하더라도 원래 모습을 온전히 복원할 수 없다. 백문이 불여일견이라 하지 않던가. 그럼에도 문자는 다른 종류의 감각 정보들의 호환에 유리한 수단이다. 말하자면 문자는 시각정보를 비롯하여 청각정보, 후각정보 모두를 ‘비록’ 추상화시킴에도 저장할 수 있다. 반대로 청각정보를 카메라로 저장할 수 없고, 시각정보를 축음기로 저장할 수는 없다. 당연히 향기도 마찬가지다. 후각정보를 온전히 저장하는 기계장치는 아직 없다. 그것이 ‘본래’ 불가능한지, 아니면 아직 방법을 찾지 못해서인지는 알 수 없으나 언젠가는 카메라나 축음기처럼 냄새를 ‘통째로’ 저장하는 기계가 나올 수도 있지 않을까 하는 ‘엉뚱한’ 상상을 해본다. 이런 여러 맥락을 고려해 보면 포토그래피와 포노그래프는 참으로 놀라운 발명품이다.
박평종 (중앙대학교 인문콘텐츠연구소 연구교수)
르네상스형 기계가 가능할까?

르네상스형 기계가 가능할까?

르네상스형 기계가 가능할까?
02/03/2021
/ 박평종

언밸런스, 균형이 맞지 않는다는 뜻이다. 한쪽 발이 길거나 짧으면 절뚝거리고, 젓가락 한쪽이 길거나 짧으면 젓가락질을 제대로 할 수 없다. 고기만 먹거나 채소만 먹으면, 요컨대 균형 잡힌 식단을 유지하지 않으면 건강을 장담할 수 없다. 이처럼 균형의 중요성은 누구나 아는 상식이나 실상 온전한 균형을 유지하기란 쉬운 일이 아니다. 정신의 균형도 중요하다. 어른에게는 예절 바른데 아이에게 예의가 없다면 그 또한 언밸런스다.

학습의 불균형도 문제다. 법전을 달달 외워 법조인이 된 사람들이 ‘비상식적’ 판단을 내리는 이유는 그 때문일 것이다. 언젠가 고교동창 의사 친구가 ‘고등학생처럼’ 말을 하는 걸 보고 한참 웃었던 적이 있는데 같은 이유다. ‘고매한’ 인문주의자들도 사정은 마찬가지다. 플라톤에서 데리다까지 섭렵한 철학자들 중에는 카카오뱅크에 어떻게 가입하는지조차 모르는 사람이 많다. 지식의 분화가 극단화된 현대사회에서 균형 잡힌 학습이 거의 불가능하다는 것은 맞다. 그래도 정도는 필요하다. 오래 전 컬투쇼에 소개됐던 에피소드 중 남자 친구와 헤어진 여인의 일화가 기억에 남아있다. 모든 면에서 나무랄 데 없는 남자친구가 서신으로 진지하게 프로포즈를 했는데 그게 문제였다. 서신의 마지막 대목은 “내 평생의 반려자가 되어주오, 당신의 반남자로부터”였고, 이 ‘반여자’는 ‘반남자’의 무지를 도저히 용서할 수 없어 눈물을 머금고 이별을 선언했다는 얘기다.

AI의 탁월함은 특정 분야를 집중적으로 학습하여 인간의 능력을 뛰어넘었다는 데 있다. 알파고보다 바둑을 더 잘 두는 인간은 없고, 다른 분야에서도 사정은 다르지 않다. 그런데 이 ‘탁월함’은 ‘무능함’의 다른 이름이기도 하다. 알파고는 바둑 말고 할 수 있는 것이 아무 것도 없다. 가까운 미래에 등장하게 될 수많은 AI, 요컨대 현재도 존재하지만 향후 더욱 ‘인간에 가까워질’ 지능형 비서나 자율주행차, AI 판사나 의사 등은 해당 분야에서 인간보다 뛰어날 것이 틀림없다. 그러나 AI 판사는 고열 환자에게 해열제를 처방해야 한다는 상식조차 알지 못할 것이다. 그 점이 큰 문제는 아니나 ‘종합적 판단’이 요구될 때 문제가 될 수 있다. 판사가 법전만 알아서는 안 된다는 말 속에 그 이유가 담겨있다.

그럼에도 이 ‘탁월한’ AI에게 모든 것을 요구할 수는 없다. 일단 자율주행차는 운전만 잘 하면 되고 AI 의사는 검진만 잘 하면 된다. 손흥민에게 야구까지 잘 하라고 할 수는 없는 노릇이니까. 실상 AI에 비해 ‘비교적’ 균형을 유지하는 인간도 모든 면에서 언밸러스다. 난해한 하이데거는 이해하나 미적분은커녕 일차방정식도 풀지 못하는 철학자가 부지기수다. 드라마 스타트업에 나오는 프로그래머 ‘남도산’은 알고리즘 개발의 귀재지만 수익모델에 대한 아이디어를 전혀 내놓지 못한다. 물론 드라마 속 얘기지만 현실도 비슷하다.

지식의 분화가 진행되기 이전 이상적인 인간상은 이른바 르네상스형 인간, 말하자면 다양한 분야의 여러 지식을 고루 갖춘 ‘균형 있는’ 인간이었다. 원근법의 고안자로 알려진 알베르티는 회화와 건축은 물론이고 법학, 수학, 시학 등 다양한 분야의 지식에 정통했을 뿐만 아니라 음악과 운동에도 뛰어났다. 한마디로 다재다능했다. 르네상스형 인간의 전형으로 꼽히는 레오나르도 다 빈치의 박식이 미친 분야는 일일이 열거하기조차 어렵다. 이 ‘통합적’ 지식은 19세기까지도 유효해서 유럽 귀족층의 필수교육 과목은 그 종류도 많았다. 그런데 이후 지식의 분화가 시작되고 전문 분야의 지식이 고도화되면서 사정은 바뀌었다. 박식한 사람은 모든 것을 다 아는 바보가 됐다. 한 우물만 파라는 말은 한 분야의 전문가가 되어야 한다는 뜻이기도 하다. 모든 분야의 전문 지식을 갖추기란 불가능하므로.

AI를 한마디로 인간의 사고과정을 모방한 기계로 정의한다면 어떤 사고를 모방할 것이냐가 문제다. 현재의 모델은 한 우물만 집중해서 파는 기계다. 그런데 르네상스형 인간의 사고를 모델로 삼는다면 어떨까. 물론 기술적으로는 어려울 게다. 허나 기술은 항상 한계를 극복해 왔다. 그렇다면 르네상스형 AI가 언젠가는 나올 수 있지 않을까 싶다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)