그 때는 맞고 지금은 틀리다
01/08/2020
/ 박평종

1. 그 때는 맞고 지금은 틀리다

“하드 1기가? 와! 평생을 써도 다 못쓰겠다.” 영화 <건축학개론>의 주인공이 당시 초고성능 컴퓨터 팬티움을 갖고 있던 선배를 부러워하며 건넨 대사다. 1기가면 1,000메가가 넘는다. A4 한 장 정도의 문서가 약 10-20kb, 10장 분량이 기껏해야 50kb-100kb 정도, 1메가는 1,000kb니 1기가면 엄청난 양이다. 책 한권을 1메가로 계산했을 때 책 1,000권을 저장할 수 있다면 정말 평생을 써도 다 쓸 수 없는 양이다. 대충 계산해도 매년 1메가 분량의 텍스트를 1,000년간 생산해야 그 ‘하드’를 채울 수 있을 테니 영화 속 주인공의 대사는 ‘당시로서는’ 과장이 아니다. 영화 전반을 잔잔하게 적셔주는 음악 <기억의 습작>이 1994년에 나왔으니 대략 25년 전인데, 당시 지금의 USB 역할을 했던 플로피 디스크의 용량은 1,4메가였다. 그리고 그 얇은 플라스틱 조각 속에 측정하기 어려울 만큼의 많은 텍스트를 저장할 수 있었다.

이 ‘천문학적’ 하드 1기가, 그러나, 지금은 있으나 마나다. 요즘 컴퓨터의 하드는 1테라, 즉 1,000기가로도 부족하다. 천배가 넘는 용량임에도 그렇게 된 까닭은 무엇일까? 이 기간 동안 정보 생산량이 비약적으로 늘어난 것일까? 한편으로는 그렇고 다른 한편으로는 그렇지 않다. 우선 디지털 기술은 문자 그대로 ‘모든’ 현상을 데이터로 저장할 수 있다. 문자는 물론이거니와 소리, 이미지, 영상 등 인간이 생산하는 모든 기호를 동일한 형태의 숫자 정보로 변환시켜 ‘기록’한다. 키틀러의 통찰을 정리하자면 과거 축음기는 소리 정보를, 카메라는 시각 정보를, 타자기는 문자 정보를 저장하는 매체였고 그 기록매체들 간에는 호환성이 없었다. 따라서 매체의 특수성은 대단히 중요했다. 하지만 이제 이 모든 기록 매체들은 디지털 기술을 통해 하나로 통합됐다. 컴퓨터에 저장된 정보(소리, 이미지, 영상)들 사이에 물리적인 차이는 없다. 물론 그 정보들의 수용 방식은 인간의 감각기관이 지닌 차별성 탓에 다르지만 말이다. 어쨌든 그렇게 해서 인간이 생산하는 모든 기호는 데이터화될 수 있다. 말하자면 ‘그 때’는 정보가 아니었던 자연기호가 ‘지금’은 정보로 변신하여 데이터화된다. 실상 우리 컴퓨터의 ‘하드’에는 잡담을 비롯하여 온갖 불필요한 정보, 나아가 ‘쓰레기’ 같은 데이터가 몇 기가씩 있다. 평생 써도 못쓸 그 1기가가 ‘쓰레기’ 보관에 사용되고 있는 셈이다.

 

2. 그 때는 틀리고 지금은 맞다

하지만 잡담에도 정보가 있다. 불필요한 정보도 나중에 가치를 부여받을 수 있다. 실상 정보란 우리가 모르는 무엇을 알려줄 때 가치 있다. 이미 알고 있는 정보란 아무 짝에도 쓸모가 없다. 하여 지금 그 가치를 알고 있는 정보는 역으로 별 가치가 없다. 수십 년 전 별 뜻 없이 찍었던 기념사진이 후일 얼마나 소중한 이미지가 되는가. 결국 그 때는 정보가 아니었던 것이 지금은 가치 있는 정보일 수 있다. 따라서 정보 저장소의 용량은 클수록 좋다.

문서는 숫자처럼 ‘불연속적’ 기호로 구성되기 때문에 디지털 데이터로의 변환이 쉽다. 반면 이미지는 ‘연속적인’ 기호라 디지털 데이터로 변환하기 까다롭다. 컴퓨터에게 쉬운 것이 인간에게는 어렵고, 반대로 인간에게 쉬운 것이 컴퓨터에게는 어렵다는 이른바 모라벡의 역설이 여기서도 적용될 수 있다. 하여 이미지를 디지털 데이터로 저장하기 위해 컴퓨터는 ‘고생’을 좀 해야 한다. 용량이 늘어날 수밖에 없는 이유다. 그리고 이미지 데이터의 용량이 클수록, 즉 해상도가 높을수록 정보량도 많아진다. 반대로 불연속적인 텍스트의 경우 데이터 용량이 늘더라도 정보량이 많아지지는 않는다. 글자를 식별할 정도의 용량에서 정보량은 멈추는 것이다. 디지털 카메라가 등장하던 초기 300만 화소짜리 카메라를 보고 놀랐던 적이 있다. 허나 지금은 휴대폰에 1억 화소 카메라가 장착돼 나온다. 하여 고작 2mb의 <순수이성비판> 파일과 유명 맛집 블로거가 찍은 200mb의 파스타 사진을 데이터의 크기로 비교하는 것은 난센스다.

컴퓨터가 상용화되기 전까지 인류는 전체 역사 기간 동안 12엑사바이트(10¹⁸바이트)의 데이터를 축적했다고 한다. 참고로 데이터의 단위는 기가-테라-페타-엑사-제타 바이트로 이어지며, 각 단계별 차이는 약1,000배씩이다. 2010년대에 접어들면서 인류는 처음 제타바이트를 경험했고 이 양은 매년 3-4배씩 늘어나는 추세다. 빅 데이터라는 말로도 크기를 표현하기 부족할 만큼 초울트로빅이다. 데이터가 천문학적으로 늘어났다면 그 데이터가 담고 있는 정보도 그만큼 늘어났을까? 관건은 거기서 얼마나 ‘가치 있는’ 정보를 찾아내느냐에 있다. 단지 데이터 크기로만 정보의 가치를 가늠할 수는 없기 때문이다. 결국 우리가 데이터에서 가치 있는 정보를 찾아낼 때만 ‘그 때’는 틀리고 ‘지금’은 맞다. ‘그 때’는 애완견이었지만 ‘지금’은 반려동물인 것처럼 말이다.

 

박평종 (중앙대학교 인문콘텐츠연구소 연구교수)