정부는 행정기관 및 공공기관에 올려지는 첨부파일은 텍스트를 찾을 수 있도록 제공하라고 지시하고 있다. 이것은 정보 접근성을 높이는 적절하고도 좋은 지침이다. 그런데 안 지키는 기관들이 상당히 많다. 연구보고서, 정책자료, 가이드라인, 매뉴얼 등 공개하는 자료 중 일부는 글자가 보이긴 하지만 이미지로 저장되어서 텍스트로 인식되지 않는 파일이다. 이런 파일은 검색도 안되고 재활용도 못하고 읽는 기능 등을 활용할 수 없다. 이 문제는 일반 시민뿐 아니라 연구원, 정책 입안자 및 이러한 자료에 의존하는 사람들에게 영향을 미친다. 사람도 정보를 찾기 어렵지만 검색엔진도 이 자료들을 찾고 색인화하지 못한다. AI 시대에는 데이터가 자산이다. 하지만 이렇게 이미지로 만들어지는 가짜 텍스트 데이터는 자산이 아니다. A..