AI 개발 이야기만 나오면 꼭 따라붙는 말이 있죠. “데이터는 많은데, 써도 되는 게 없다.”
정부가 이 문제를 정면으로 건드렸습니다. 앞으로는 국가나 지방자치단체가 보유한 공공저작물을 출처 표기 없이도 AI 학습용 데이터로 자유롭게 활용할 수 있게 됩니다.
저작권 침해 우려, 복잡한 이용 조건 때문에 현장에서 잘 쓰이지 못했던 공공 데이터가 이제는 AI 산업의 핵심 자원으로 본격 개방되는 셈입니다.

왜 지금 공공저작물 규제를 풀었을까
문화체육관광부와 과학기술정보통신부는 제4차 과학기술관계장관회의에서 공공누리 이용 허락표시 기준 개정안과 공공저작물 AI 학습 활용 확대 방안을 동시에 발표했습니다.
배경은 단순합니다. 공공저작물은 많지만, “출처를 반드시 표기해야 한다”, “상업적 이용이 안 된다” 같은 조건 때문에 AI 학습에는 사실상 쓰기 어려웠다는 겁니다.
AI는 수만~수백만 건의 데이터를 처리하는데, 출처를 일일이 확인·표기하는 구조 자체가 맞지 않았습니다.
핵심 변화 ① ‘제0유형’ 신설
이번 개편에서 가장 파격적인 변화는 ‘제0유형’의 도입입니다.
제0유형이 적용된 공공저작물은 출처 표기 의무가 없습니다. 상업적 이용도 가능하고, 내용 변경이나 가공 역시 제한이 없습니다.
정부 설명을 그대로 옮기자면, AI 학습 과정에서 기업들이 느끼던 출처 관리 부담을 원천적으로 제거한 조치라는 겁니다.
핵심 변화 ② ‘AI 유형’ 추가
또 하나 중요한 변화는 새롭게 도입된 ‘AI 유형’입니다.
기존 공공누리 제1~4유형에는 상업적 이용 금지, 변경 금지 같은 조건이 붙어 있는 경우가 많았습니다.
하지만 이 저작물에 AI 유형 표시가 함께 붙으면, 해당 조건이 있더라도 AI 학습 목적에 한해서는 자유롭게 활용할 수 있게 됩니다.
그동안 저작권 문제로 묶여 있던 방대한 공공 데이터가 AI 학습 자원으로 한꺼번에 풀리는 구조입니다.
한시적 허용에서 ‘전 국민 개방’으로
사실 이런 시도는 처음이 아닙니다. 정부는 지난해 9월, 규제 샌드박스를 통해 일부 기업에만 공공저작물 활용을 한시적으로 허용한 바 있습니다.
당시에는 ‘국가대표 AI 정예팀’을 대상으로 공공저작물 약 1,100만 건이 개방됐는데, 이번 조치는 이 권한을 전 국민으로 확대한 것입니다.
법·기술 기반도 함께 손본다
정부는 제도 완화에 그치지 않고 중장기적으로 법과 기술 기반도 정비할 계획입니다.
저작권법을 개정해 공공저작물의 공공누리 표시를 의무화하고, AI가 바로 학습할 수 있도록 머신 리더블(Machine Readable) 형태로 데이터를 가공해 개방한다는 방침입니다.
현재도 공유마당에는 학습용 데이터 766만 건, AI 허브에는 900여 종의 데이터가 공개돼 있는데, 활용 폭은 더 넓어질 전망입니다.
이번 조치가 의미하는 것
이번 개편은 단순한 규제 완화라기보다, “공공 데이터는 모두의 자산”이라는 원칙을 AI 시대에 맞게 다시 선언한 조치에 가깝습니다.
특히 중소기업이나 스타트업, 연구자 입장에서는 데이터 접근 장벽이 크게 낮아졌다는 점에서 체감 효과가 상당할 것으로 보입니다.
'AI' 카테고리의 다른 글
| 네이버·유튜브의 벽이 흔들린다… 검색의 중심이 AI로 이동하는 이유 (0) | 2026.01.29 |
|---|---|
| 앱스토어에 버젓이 올라온 ‘누디파이’ 앱들… AI 성 착취, 어디까지 왔나 (1) | 2026.01.29 |
| 오픈AI ‘프리즘’ 공개… 연구툴 시장, 이제 긴장할 수밖에 없는 이유 (1) | 2026.01.28 |
| 구글 AI 저가 요금제 전 세계 확대… 한국 이용자는 무엇이 달라질까? (0) | 2026.01.28 |
| 감사원 모의 해킹 결과 충격…공공 전산망, 개인정보 ‘무방비’ (0) | 2026.01.28 |