인공지능

[인공지능] 한국지능정보사회진흥원, '인공지능(AI) 데이터 품질관리 가이드라인 v3.5' 발간

오션지키미 2025. 5. 28. 09:38
반응형

- 다중양식(멀티모달) 데이터, 합성데이터 등 고품질의 인공지능 데이터를 위한
품질관리 레임워크 및 기준 제시 -

한국지능정보사회진흥원(이하 진흥원)과학기술정보통신부(이하 과기정통부) 와 함께 인공지능(AI) 데이터 품질관리 가이드라인 v3.5(이하 가이드라인)발간했다.

[AI 데이터 품질관리 가이드라인 v3.5는 3권으로 구성되어 있다(왼쪽부터 1권, 2권, 3권)]

진흥원은 2021년 인공지능 학습용 데이터 품질관리 가이드라인 v1.0 발간한 이후 매년 인공지능 기술 발전에 따라 고도화해 왔으며 2024년 공개된 가이드라인 v3.16만건 이상의 다운로드를 기록하는 등 공공 및 민간에서 기준서로서 활발히 활용되고 있다.

 

가이드라인 v3.5 2024초거대AI 확산 생태계 조성사업의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영해 고도화하였다.

 

이는 3권으로 구성되어 있으며, 1은 인공지능 데이터 품질관리 프레임워크 2데이터 구축 방법론 오류 대응 전략 실무사례 3 생성형 인공지능 데이터 특화 품질관리 방법을 각각 제시하고 있다.

[품질관리 프레임워크는 AI 데이터의 구축 공정에 따른 프로세스, 산출물, 조직, 품질관리 활동을 제시한다]

특히 이번 가이드라인은 언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터*, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론별도 제시함으로써 빠르게 변화하는 인공지능 기술 동향에 유연하게 대응할 수 있도록 확장성 확보 도모하였다.

* 다중양식(멀티모달) 데이터 : 텍스트, 음성, 동영상 등 두 가지 이상의 모달리티(Modality)함께 활용하여 학습하는 데 필요한 데이터

 

< AI 데이터 품질관리 가이드라인 v3.5 구성 >

구 분 내용
1권 AI 데이터 품질관리 가이드 v3.5 - 인공지능(AI) 데이터 품질관리 프레임워크 및 품질관리 지표 선정 절차
2권 AI 데이터 구축 가이드 v3.5 - 산업별·유형별 인공지능 데이터 구축방법 및 실무사례 제시
3권 생성형AI 데이터 품질관리 가이드 v2.0 - LLM, LMM, 합성데이터 등 생성형 인공지능(AI)을 위한 품질관리 지표 제시

본 가이드라인은 AI허브*(www.aihub.or.kr) 및 진흥원 누리집을 통해 누구나 내려받아 활용할 수 있으며, 권별로도 별도 제공하여 현장 실무자 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성하였다.

* 과기정통부와 NIA가 운영하는 국내 최대 인공지능 학습용 데이터 제공 플랫폼

 

또한, 데이터 구성잘된 사례 vs 부족한 사례비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리실질적인 도움을 줄 것으로 기대된다.

 

진흥원 원장은 "인공지능 기술의 핵심은 데이터 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다라며, "진흥원은 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다고 밝혔다.

 

○ AI 데이터 품질관리 가이드라인 v3.5 표지 및 내용 (다운로드)

https://aihub.or.kr/aihubnews/qlityguidance/view.do?pageIndex=1&nttSn=10404&currMenu=135&topMenu=103&searchCondition=&searchKeyword=

 

AI-Hub

* 본 가이드라인은 25.5.23일부로 내용 일부 수정 후 재업로드 한 버전임. 2024년 초거대AI 확산 생태계 조성사업(이하 '데이터 구축사업')의 수행내용을 기반으로 제작된 ‘AI 데이터 품질관리 가이

aihub.or.kr

가이드라인 구성은 총 3권 입니다.
1권. AI 데이터 품질관리 가이드 v3.5 
2권. AI 데이터 구축 가이드 v3.5
3권. 생성형AI 데이터 품질관리 가이드 v2.0

1권은 데이터 구축사업 내 품질관리 거버넌스 및 프레임워크, 품질검증 지표에 대해 기술되어있으며,
2권은 데이터 구축사업 사례를 중심으로 AI 데이터 구축 방법 및 절차를 공유하는 데 목적이 있습니다.
3권은 1권의 품질관리 프레임워크를 기반으로 챗GPT 등으로 대두되는 생성형AI 분야 데이터(LLM, LMM, 합성)의 특징을 발췌하여 작성하였습니다.

 

가이드라인관련 문의는 '한국지능정보사회진흥원 인공지능데이터본부 품질유닛'으로 연락주시기 바랍니다.
감사합니다.

※ 문의 연락처 : (mail) aidq@nia.or.kr (call) 053-230-4220

 

728x90
반응형