디자인/디자인이야기

공공서비스디자인, 접근성의 문턱을 없애자(1) 가짜 텍스트문서를 진짜 텍스트 문서로

SERVICE DESIGN 2023. 3. 29. 07:13
https://www.pexels.com/ko-kr/photo/4291/

 

정부는 행정기관 및 공공기관에 올려지는 첨부파일은 텍스트를 찾을 수 있도록 제공하라고 지시하고 있다. 이것은 정보 접근성을 높이는 적절하고도 좋은 지침이다. 그런데 안 지키는 기관들이 상당히 많다.

연구보고서, 정책자료, 가이드라인, 매뉴얼 등 공개하는 자료 중 일부는 글자가 보이긴 하지만 이미지로 저장되어서 텍스트로 인식되지 않는 파일이다. 이런 파일은 검색도 안되고 재활용도 못하고 읽는 기능 등을 활용할 수 없다. 이 문제는 일반 시민뿐 아니라 연구원, 정책 입안자 및 이러한 자료에 의존하는 사람들에게 영향을 미친다. 사람도 정보를 찾기 어렵지만 검색엔진도 이 자료들을 찾고 색인화하지 못한다. AI 시대에는 데이터가 자산이다. 하지만 이렇게 이미지로 만들어지는 가짜 텍스트 데이터는 자산이 아니다. AI가 효율적으로 학습할 수 있는 많은 텍스트 데이터가 필요한데 이미지로 만들어진 파일은 검색엔진이 읽지 못하는 등 자료 활용성이 월등히 떨어지기 때문이다.

이것은 전수조사를 해서라도 반드시 찾아내 고쳐야 한다. 어떤 기관이 얼마나 읽히지 않는 파일을 제공하는지는 검색로봇으로 쉽게 파악할 수 있을 것이다. 이것을 기준으로 기관 웹서비스의 접근성 점수를 공개하고 고칠 수 있도록 해야 한다. 이것은 정부의 의지가 필요한 부분이다. 어떤 강제성 없이 관행대로 둔다면 공공영역에는 이미지 형태로 공개되는 PDF 파일이 많아질 것이고 이로 인해 국민들은 공공데이터에서 원하는 내용을 찾기 힘들어지고 시간을 낭비하게 되어 상대적으로 우리나라의 정보 경쟁력은 떨어질 것이다.

공공의 웹 사이트가 사용자 친화적이고 모든 사람이 접근할 수 있도록 하기 위해서는 접근성 표준 준수가 필수적이다. 정부는 이러한 지침을 보다 강력히 시행하고 모든 기관이 이를 준수할 수 있도록 조치를 취해야 한다.
정부는 데이터가 온전한 기능을 할 수 있도록 데이터의 생산과 유통 과정을 관리해야 한다. 특히 정부가 직접 콘텐츠를 생산하거나 유통에 관여하는 영역에서는 말할 것 없다.

AI 시대가 도래한 이상, 국가 간 더 나은 품질과 많은 양을 확보하기 위한 데이터 자산 경쟁은 이제 R&D나 국방력 경쟁보다 그 중요도가 떨어지지 않는다. 우리는 세계에서 유일하게 한글 데이터 자산을 가진 나라다. 정부는 이를 인식하고 한글 데이터를 디지털 세상에서 발전의 주동력으로 활용할 기반을 속히 마련해야 한다. 적어도 한글 데이터에 있어서만큼은 다른 나라가 뭘 대신해 줄 수도 없고, 그래서도 안 되는 것 아닌가.



-------------------------------------------------------------------------------
* 참고 : [행정, 공공기관 웹사이트 구축운영 가이드] 중 발췌

ㅇ 첨부파일은 다양한 환경의 이용자가 해당 정보에 접근할 수 있도록 2종 이상의 파일 형태로 제공
- 첨부파일은 검색 편의 및 접근성을 높이기 위해 이미지 형태의 제공을 자제하고 문서(파일)에서 텍스트(글자) 찾기가 가능하도록 제공

* 그림 1 : 행정, 공공기관 웹사이트 구축운영 가이드 중 해당 부분 (2021.3. 행정안전부. 43페이지)

 
* 그림2 : 문서 파일과 이미지 문서 파일의 비교

* 그림 3 : 박태웅 한빛미디어 이사회 의장 말씀 중 chatGPT 시대를 맞아 정부가 해야 할 일
               '기계가 읽을 수 있는 형태로 데이터 개방'. 

출처 : [김어준의 다스뵈이다] 252회. 2023.3.3.  https://youtu.be/jB_2RZEqQ5w?t=3922