미처 말하지 못한 것, 차마 말할 수 없는 것
06/24/2021
/ 박평종

비대면의 일상화로 메타버스에 대한 관심이 높아지면서 소위 ‘가상인간’의 활동 폭도 늘고 있다. LG전자가 AI 기술을 통해 구현한 ‘김래아’나 삼성전자의 ‘샘(Sam)’이 대표적인 예다. 래아는 LG전자의 홍보 모델로 시작하여 인스타그램에 자신의 근황을 알리는 등 SNS 활동을 활발히 펼치면서 주목받은 바 있다. 샘은 삼성전자의 교육 트레이너로 활동하면서 국외에서 눈길을 끌었다. 이 ‘가상인간’의 뿌리는 이른바 ‘지능형 비서’라 불리는 AI다. 애플 시리가 그 예다. 시리는 목소리로만 소통하나 래아나 샘의 경우에는 ‘형상’이 추가됐다. 비록 그 형상은 ‘가상 이미지’로 메타버스에서나 존재하지만 말이다. 후일 로봇기술과 결합하면 신체도 갖게 되므로 이 ‘지능형 비서’는 진짜 인간을 향해 꾸준히 진화하고 있는 셈이다. 좌우간 래아는 SNS 활동을 통해 실제로 인간과 소통하니 메타버스의 세계에서는 인간과 다를 바 없다.

래아의 활동은 아마도 LG전자의 홍보팀에서 ‘관리’를 하지 않을까 싶다. 말하자면 래아 스스로 ‘직접’ 글과 사진을 올리지는 못할 것이라는 뜻이다. 그럼에도 이 AI의 ‘지향점’은 분명하다. 인간의 사고를 모방한다는 것인데 여기에는 데이터가 필수조건이다. 현재를 데이터의 시대라 부르는 이유다. 우리가 얘기한 모든 것이 알고리즘의 학습 데이터가 되어 부메랑으로 되돌아오는 시대다. ‘이루다’의 사례에서 보았듯 카톡에서 별 뜻 없이 일상적으로 주고받았던 문자가 AI의 세계관을 형성하지 않았던가. 이런 구체적 예를 들지 않더라도 스몰 데이터가 쌓여 빅데이터가 되고, 다시 그것이 수퍼 울트라 데이터로 활용되는 경우는 일상에 널려있다. 플로리디(L. Floridi)는 우리가 제타 바이트를 처음 경험한 세대라고 규정하며 데이터가 기하급수적으로 늘어나는 현상을 지적한 바 있다.

데이터, 사람들이 보고 듣고 말하고 쓴 모든 감각적 경험을 숫자 기호로 변환시켜 저장한 정보를 뜻한다. 기록매체가 없던 시대의 데이터는 별것 없었다. 글로 남기거나 그림으로 그려야 했다. 말하자면 손으로 끄적거려야 했다. 그런데 19세기에 탄생한 각종 기록매체와 더불어 데이터의 양이 폭발적으로 늘기 시작했다. 예컨대 키틀러가 기록시스템 1900으로 분류한 축음기, 타자기, 영화는 ‘기계적인’ 방식으로 데이터를 늘려나갔다. 기계가 데이터를 저장하니 지치지 않고 빠른 속도로 정보를 기록할 수 있었다. 맥루한의 소위 ‘구텐베르그 은하계’에서 생산된 데이터와는 양적으로 비교할 수 없을 정도다. 디지털 매체와 컴퓨터, 소포트웨어로 작동하는 다양한 뉴미디어의 시대로 접어들면서 그 양은 훨씬 늘었다. 심지어 SNS에서 오가는 욕지거리도 데이터가 되는 시대다. 그래서 AI의 편향도 생겨나게 됐다.

어쨌든 이 데이터는 AI 프로젝트에서 필수적인 조건으로 작용한다. 기계가 인간의 데이터를 학습해야 하니까. 그런데 데이터란 컴퓨터가 이해할 수 있는 이진법 숫자를 가리킨다. 말하자면 인간이 ‘이미’ 말한(쓴, 그린, 사진으로 찍은) 것을 숫자로 변환시킨 정보를 뜻한다. 요컨대 ‘발화된’ 것만이 데이터다. 마음속에 담아놓고 얘기하지 않은 것은 데이터가 아니다. 머릿속에 구상해 놓고 표현하지 않은 것은 데이터가 될 수 없다. 따라서 당연한 얘기지만 AI는 인간이 말한 것만을 학습한다. AI 프로젝트는 기계가 인간의 사고를 모방할 수 있도록, 그럴 수 있다는 전제 하에서 출발했다. 그렇다면 AI는 인간의 사고 ‘전체’를 모방할 수 있어야 한다. 그런데 사람이 ‘발화’한 것만이 사고의 전부는 아니다. 오히려 인간에겐 말한 것보다 말하지 못한 것이 더 많다. 생각하는 모든 것을 말할 수 있다면 얼마나 좋겠나. 미처 말하지 못한 것도 있고, 차마 말할 수 없는 것도 있는 법이다. 당연히 해서는 안 될 말도 있으며, 거짓으로 한 말도 있다. 그러고 보면 실제 말한 것보다 말하지 않은 것이 훨씬 많은 셈이다. 이 ‘말하지 않은 것’ 모두가 인간의 ‘사고’에 포함된다. 결국 ‘사고’는 ‘말’보다 커서 빙산의 아랫부분과도 같다.

플로베르의 <감정교육>에서 프레데릭은 그토록 사랑했던 아르누 부인에게 사랑한다는 얘기를 ‘결국’ 하지 못한 채 영원한 이별을 선언한다. 차마 말할 수 없었던 것이다. 요컨대 말하기는 쉽지만 말을 삼키기란 어렵다. 하여 그 ‘묵언’에는 대단히 복잡한 생각들이 깔려있다. 이 경우 플로베르의 소설 ‘데이터’를 학습한 AI가 그 ‘말하지 못한’ 생각을 어떻게 이해할 수 있을까. 말하지 못한 생각은 데이터가 아니기에. ‘지능형 비서’를 비롯하여 인플루언서로 활동하는 래아에게 이 ‘데이터가 되지 못한 사고’는 풀지 못할 숙제로 남게 되지 않을까 싶다.

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)