한글 표시 기능이 제대로 설치된 우분투에서 가끔 압축을 풀어보면, MS윈도에서 압축을 풀 때는 제대로 보였던 한글 제목이 외계어로 바뀌어 풀립니다.

또 친구에게 받은 음악 자료 제목이나 꼬리표(tag) 내용을 우분투에서 열어볼 때 영 알아볼 수 없게 깨지는 경우도 있습니다. 아래 그림처림 말입니다

이런 문제는 전산상 한글 표시방법 기준이 혼란스러웠기 때문에 생긴 문제 입니다. 잠깐 20년도 채 안된 한국 현대사의 극히 일부를 훑어 보지요.

밴시에서 한글 노래 제목이 깨져보이는 현상.



EUC-KR의 시대를 열려고 했었지.

대한민국은 1990년대초에 1994년경에 완성형 한글처리 방식을 업계의 오랜 밥그릇 싸움끝에 표준으로 채택했습니다. 이때 완성형의 표준안으로 EUC-KR이란 것을 채택했는데, 문제는 이 표준안으로 표현할 수 있는 한글 낱자수가 고작 2300여자에 불과했다는 점입니다.

한글은 첫소리(초성), 가운뎃소리(중성), 끝소리(종성)를 조합해 수 만자를 표현할 수 있는데 이를 무시하고 '가', '각', '간' 등 낱자 2350자를 지정해 놓고 컴퓨터 상에서는 이것만 써도 일단은 충분하다고 본 것이지요.

한글을 표현하는 데는 사실 낱자를 정해놓고 쓰는 완성형보다는 첫소리, 가운뎃 소리, 끝소리를 각각 지정해주고, 이를 조합해 글을 쓰는 방식인 조합형이 더 유리합니다. 예를 들면, 조합형은 첫소리 'ㄱ'에 가운뎃 소리 'ㅏ', 끝소리 'ㄱ'을 더해 '각'을 표시하는 방식입니다.

완성형은 영어같은 유럽어 표시에나 적합합니다.

완성형 한글 채택은 한글을 유럽어권 방식으로 표현한다는 결정과 크게 다르지 않습니다만, 외국에서 개발된 무른모의 한글화가 쉽다는 이유 등으로 완성형을 택했지요,

여기서 한 가지는 언급해야 할 것 같습니다. 완성형에 앞서 사용하던 조합형에도 문제가 있기는 했습니다. 각 업체별로 각자가 달리 조합형을 만들었기 때문에 서로 호환성이 없던 문제가 있습니다. 조합 구현방식이 난립했던 것이지요. 그렇다 하더라도 한글을 제대로 표현할 수 있는 방식을 포기한 점은 쓴 맛이 남기는 합니다.

그리고, 누구나 쉽게 예상할 수 있었듯이,  2350자의 한글 낱자를 지원하는 EUC-KR은 실생활에서 사용되는 일부 낱자를 제대로 표현하지 못하는 문제를 일으켰습니다. 이 와중에 한 외국 기업이 해법을 내놓았습니다.


CP949의 시대가 영원할 줄 알었더니...

마이크로소프트사는 윈도95를 1995년 11월 출시하면서 '확장 완성형 한글' 또는 cp949를 들고 나왔습니다.

확장 완성형 원리는 간단하죠. EUC-KR로 표현 못하는 낱자 중에 일상생활에서 쓰이는 8000여자를 MS사가 임의로 선택해 더해넣은 것입니다. 즉 cp949는 EUC-KR 2300여자 더하기 8000여자를 보여줄 수 있는 확장된 완성형 한글처리방식인 셈입니다.

결과적으로 MS사의 이런 선택은 완성형이 불편하다는 불만을 잠재우는데는 성공적이었으나, 국가의 표준을 한 외국 기업이 마음대로 개조해버린 꼴이 됐습니다. 

더 중요한 문제는 CP949는 MS사의 소유기술일 뿐, 표준기술이 아니란 점에 있습니다.  PC중심에서 스마트폰/패드가 정보기기의 중심으로 진화하면서 결국 '비표준'이라는 꼬리표 때문에 폭탄이 터지고 말았습니다.

생활에서 자주 쓰는 기기의 변화와 맞물려 CP949를 사용하지 않는 사용자환경(OS)-즉 MS윈도가 아닌 OS에서 CP949로된 한글 문서를 열면 문자가 모두 깨지는 문제를 경험한 사용자가 과거보다 대폭 늘어난 상태입니다.

게다가 확장 완성형은 인터넷의 대중화 시점에 널리 사용된 윈도95부터 채택됐기 때문에 폭탄의 크기가 작지 않습니다. 인터넷을 통한 자료 공유가 활발해진 가운데, CP949에 바탕을 둔 한글 자료나 무른모가 정보의 바다에 상당량 투척됐기 때문입니다.


지금은 유니코드의 시대랄까?

지금은 유니코드의 시대라고 할 수 있습니다. 여러 유명한 회사가 협력해 만들어낸 유니코드에는 한글 뿐만 아니라 전세계 거의 모든 언어가 담겨 있어서, 다중언어 환경 구현이 쉽다는 장점이 있습니다. 특히 유니코드 중에서는 UTF-8 방식은 현재 대세입니다.

그러나 문제는 앞서 거론했듯이 그간 CP949나 EUC-KR로 찍어놓은 자료들을 유니코드 천하에서는 제대로 쓸 수 없게 됐다는 겁니다.

대세에 순응하는 방법은 CP949자료를 UTF-8방식으로 바꿔주는 것입니다. 그런데 이런 대세에 순응하기 위해- 단순히 한글을 제대로 보기 위해- 사용자가 허비하는 시간을 생각해봅시다.

(대세 순응이 절대 선이라고 이런 글 쓰는 건 아닙니다. "모두가 대세에 순응해야 한다"가 제 입장은 아닙니다. 대세는 대세일 뿐 소수로 살고 싶으면 소수로 살아도 좋아요. 저같은 우분투 사용자처럼. :)


기술력 문제보다는 사고 방향의 문제아니겠나?

한글 호환성에 문제가 생긴 배경 중 하나는 한국이 '컴퓨터가 세상을 바꿀 것'과 '인터넷은 국경을 넘는 정보 유통의 장이 될 것'이라는 전망과 사실을 수동적을 받아들였기 때문입니다.

한국은 기술력은 있는 국가입니다만, 그 기술력을 어떻게 펼칠 것인가 방향을 제시하는 철학이 부족하지 않았나 싶습니다.

남이 가져다 준 대세보다 스스로 대세를 이끌어 낼 진정한 사이버 강국의 철학이 있었더라면 수 많은 한글 사용자들의 의사보다, 사실상 외국기업들에 의해 좌지우지된 한글코드 호환성 문제때문에 시간낭비하는 일은 없거나 줄어들었을 것입니다.


신고

+ Recent posts

티스토리 툴바