본문 바로가기

NEWS

[2022.09.13]튜니브리지API를 활용한 성공적인 과제 수행중!

 

현재 한국지능정보사회진흥원(NIA)에서 추진하고 있는 “2022년도 인공지능 학습용 데이터 구축지원사업”에 지난 7월에 튜닙이 최종 선정되어 14번 한국어 블렌더봇 데이터와 15번 한국어 일반 상식 문자 데이터 구축 과제를 수행중입니다. 

 

과제 수행중 구축중인 데이터에서 사회적으로 이슈화 되고 있는 개인정보부적절한 발언(비윤리적인 표현)들에 대해 데이터 획득/가공시에 사람이 직접 하나씩 검수하는 과정을 거치고 있습니다. 하지만 수작업으로 이루어 지다 보니 많은 시간이 소요되며 놓치는 경우가 발생합니다. 특히, 윤리성 판별에는 더욱 많은 시간과 노력이 필요한 부분입니다. 

 이런 부분을 해결하기 위해 튜닙에서 자체 개발한 자연어 처리 API 튜니브리지"를 통해 1차 검출하여 검수자들에게 가이드 라인을 제시하고 있습니다. 

 과제의 품질목표 달성을 위해 한국정보통신기술협회(TTA)의 품질검증 및 품질지표/정량목표 달성에 중요한 프로세스로 활용되고 있습니다. 

 현재 튜니브리지"는 11종의 한국어/영어 자연어처리 API들을 제공하고 있으며 NIA과제에서는 De-identification(개인정보 비식별화), Safety Check(윤리성 판별) API를 사용하고 있습니다.

  개인정보 비식별화 항목은(이름, 주소, 전화번호, 주민등록번호 등 14개 개인정보 항목) 윤리성 판별 항목은(모욕, 욕설, 폭력/위협, 범죄 조장 등 11가지 항목)을 분류하여 처리하고 있습니다. 

 추가로 이번에 “NIA 5대 브랜드 사업”에 14번 한국어 블렌더봇 데이터 과제가 선정 되었습니다. 

 과제 수행기간동안 일정, 품질관리 등 더욱 신경써서 챙겨야 할게 많지만 그만큼 NIA에서 본과제를 핵심과제로 생각하고 있다는 의미입니다. 

 이번 “튜니브리지”의  NIA과제에서의 활용이 본 과제의 성공적인 마무리와 “튜니브리지" 활성화의  마중물 역활을 할수있도록 노력하겠습니다.


관련기사

1. [튜닙, AI로 대화 윤리성 판별하는 자연어처리 API '튜니브리지' 공개]

http://www.cctvnews.co.kr/news/articleView.html?idxno=233166

2. [튜닙, 과기정통부 ‘2022 인공지능 학습용 데이터 구축사업’ 선정]

http://www.it-b.co.kr/news/articleView.html?idxno=60845

 * 데모사이트를 방문하여 튜니브리지에 대해 더 알아보세요 :) 

 

TUNiBridge Demos

 

demo.tunibridge.ai