상세 컨텐츠

본문 제목

방송영상으로 키우는 인공지능? 과기정통부의 대형 AI 데이터 구축 사업 전격 해부!

방송미디어

by ICT찐찐찐 2025. 6. 6. 06:38

본문

요즘 인공지능(AI)이 사진을 그리고, 영상을 만들고, 뉴스도 요약하죠. 그런데, 이 모든 기술의 바탕은 ‘학습용 데이터’라는 사실, 알고 계셨나요?

📌 바로 그 데이터!
이제는 국내 방송영상 콘텐츠가 AI 학습을 위한 소중한 데이터로 다시 태어납니다.

2025년 6월 5일, 과학기술정보통신부(과기정통부)가 ‘방송영상 인공지능 학습용 데이터 구축사업’을 공모하면서 국내 AI 산업이 새로운 전환점을 맞이하게 되었는데요.
이번 포스팅에서는 이 사업이 왜 중요한지, 어떤 기업이 참여할 수 있는지, 일반인에게 어떤 의미가 있는지까지 전문가 시선으로 친절히 풀어드릴게요.

AI 학습용 데이터 구축비용, 정부 지원금 사업 공모 2025, 
AI 데이터 가공 단가
방송사+AI 기업이 만난 이유는?

 


✅ 왜 방송영상이 AI 학습에 중요한가요?

우리가 매일 접하는 방송은 뉴스, 드라마, 예능처럼 실생활과 밀접한 콘텐츠로 가득합니다. 이 안에는 한국인의 언어 습관, 감정 표현, 자연스러운 행동, 일상 문화까지 다양한 정보가 녹아 있어요.

📊 “AI는 배우는 만큼 똑똑해진다”

특히 한국형 AI 모델을 제대로 키우기 위해서는 한국인의 영상 데이터가 필요합니다.

하지만 지금까지 AI 영상 생성 모델은 대부분 서구권 데이터에 편향돼 있어, 한국적인 감성과 배경을 반영하기 어려웠어요. 그래서 이번 사업이 더욱 주목받는 거죠.

 

인공지능 학습용 데이터, 방송영상 AI 사업, 한국형 AI 모델, AI 데이터 구축 공모
과기정통부의 대형 AI 데이터 구축 사업 전격 해부!


🧩 사업 개요 요약

이번 ‘방송영상 AI 학습용 데이터 구축사업’은 2025년 6월 5일부터 7월 4일까지 약 한 달간 공모가 진행되며, 총 193억 2천만 원 규모의 예산이 투입되는 대형 프로젝트입니다. 과기정통부는 이번 사업을 통해 총 4개의 과제를 선정할 예정이며, 선정된 각 컨소시엄에는 과제당 최대 약 48억 3천만 원까지 지원됩니다.

 

사업 수행의 주관기관은 방송법 제2조에 해당하는 국내 방송사로 한정되며, 이 방송사를 중심으로 AI 기술 기업, 데이터 정제·가공 전문기업, 연구기관 등이 참여하는 형태의 ‘컨소시엄 구성’이 필수 요건입니다.

 

과제 수행 내용은 매우 구체적입니다. 참여기관은 방송사가 보유한 방송영상 원본 1만 시간 이상을 확보하고, 이 가운데 5천 시간 이상을 AI 학습에 최적화된 데이터로 가공해야 합니다. 이 과정에는 클리핑, 라벨링, 메타데이터화 등 정교한 데이터 처리 작업이 포함됩니다.

 

전체 사업 기간은 2025년 8월 초 협약 체결 시점부터 12월 31일까지로, 약 5개월 간 진행됩니다. 짧지만 집중도 높은 프로젝트로, 국내 방송영상 콘텐츠를 기반으로 한 한국형 AI 생태계 조성의 기폭제가 될 것으로 기대됩니다.


 

항목 내용
📅 공모 기간 2025년 6월 5일 ~ 7월 4일
💰 총 사업 예산 193.2억 원 (4개 과제, 과제당 48.3억 원 내외)
🏢 주관기관 방송사 (방송법 제2조 해당)
🤝 참여기관 AI 기업, 데이터 가공사, 연구기관 등 컨소시엄 필수
📌 과제 내용 방송영상 1만 시간 확보 → 5천 시간 이상 AI 학습용 데이터로 가공
📍 사업 기간 협약일 ~ 2025년 12월 31일
 

 


📁 데이터는 어떻게 구축되나요?

AI 학습 데이터 구축은 단순한 수집이 아닙니다. 아래와 같은 절차를 거쳐야 해요.

AI 학습 데이터 구축, 방송사 AI 협력, 데이터 라벨링 프로젝트
AI 데이터 품질검증, WBL 프로젝트
AI 학습용 데이터 구축 프로세스, 사진출처: 전파진흥협회 누리집

  1. AI 임무 설정: 어떤 AI 모델을 만들지 목적 수립
  2. 방송 원본 수집: 저작권/초상권 문제없는 1만 시간 영상 확보
  3. 데이터 정제: 중복 제거, 비식별화, 클리핑
  4. 가공 데이터 구축: 이미지, 텍스트, 3D 등 다양한 라벨링으로 5천 시간 이상
  5. AI 품질검증: 모델 학습 후 결과 비교, 검증 보고서 제출
  6. 성과 확산: AI 허브 등 플랫폼에 일부 데이터 공개 (10% 이상 의무)

🎯 라벨링 예시: 영상 속 인물 설명, 촬영기법 정보, 배경 분석, 세그멘테이션 등


💸 사업비와 지원 방식은?

이 사업은 정부지원금 + 민간부담금으로 구성됩니다.

기업유형 정부지원금 민간부담금(현금+현물)
중소기업 최대 75% 25% 이상
중견기업 최대 70% 30% 이상
대기업 최대 50% 50% 이상
비영리기관 최대 100% 0% 이상
- 중소기업: 「중소기업기본법」제2조제1항 및 3항과 같은 법 시행령 제3조(중소기업범위)에 따른 기업
- 중견기업:「중견기업 성장촉진 및 경쟁력 강화에 관한 특별법」 제2조 1호의 기업
- 대기업: 중소기업기본법」 제2조에 따른 중소기업 및 「중견기업 성장촉진 및 경쟁력 강화에 관한 특별법」 제2조제1호에 따른 중견기업이 아닌 기업
 

💡참고: 현물은 인건비나 장비 사용료로만 인정됩니다. 사무실 임대료나 차량비는 불가!


🧪 AI 산업에 어떤 영향이 있을까?

  • 한국형 AI 모델 학습을 위한 양질의 영상데이터 확보
  • AI 콘텐츠 자동생성, 편집, 검색 등 방송 제작 효율성 향상
  • 데이터 유통 생태계 조성: 거래 협의체 운영, 시범거래 진행
  • ✔ **WBL 프로젝트(초거대 LLM 개발)**와의 연계 가능

게다가 일부 데이터는 AI 허브에 공개돼 연구기관과 교육현장에서도 적극 활용될 예정이에요. 이건 AI 업계 입장에선 정말 큰 기회입니다.


📌 일반인의 시선에서, 이것도 중요합니다!

  • 📍 내가 보는 방송이 미래 AI 기술을 키운다!
  • 📍 방송사가 수십 년 쌓아온 콘텐츠가 AI 시대에 다시 주목받는다
  • 📍 정부 주도 + 민간 협력 방식이라 AI 일자리 창출도 기대돼요

💡 마무리하며 – “AI의 시대, 데이터가 곧 자산입니다.”

이제 인공지능의 ‘두뇌’는 데이터가 좌우합니다.
한국형 AI가 글로벌 시장에서 경쟁력을 가지려면, ‘한국의 데이터’로 똑똑하게 키워야 합니다.

이번 과기정통부의 방송영상 AI 학습용 데이터 구축사업은 그 시작점이자, 방송·미디어와 AI가 만나는 가장 흥미로운 접점입니다.
AI와 콘텐츠 산업의 미래가 궁금한 분들이라면 꼭 주목해 보시길 바랍니다!

 

다만, 짧은 일정과 높은 진입장벽, 복잡한 법적·기술적 요건, 그리고 적잖은 비용 부담이라는 현실적 한계도 존재합니다.
지원기관은 이를 충분히 인지하고, 실행역량과 리스크 대응 계획을 철저히 준비한 후에 참여 여부를 판단하는 것이 바람직합니다.

 

사업개요, 지원사업 주요내용, 세부사업 요구내용 등 더욱더 상세한 내용은 첨부물을 참고하시기 바랍니다.

 

(붙임2) 2025년 방송영상 AI 학습용 데이터 구축 사업 공모안내서.pdf
0.84MB

 

반응형

관련글 더보기