본문 바로가기

NEWS

자연어처리(NLP) 기반 AI 스타트업 튜닙 혐오 발언 데이터셋 연구 논문 EMNLP 승인

튜닙·숭실대, 혐오 탐지 데이터셋의 새 패러다임 제시로 EMNLP 2023 Findings에 게재

 

안녕하세요 튜닙입니다!

오늘은 튜닙의 자랑을 해보려 해요 😊

바로 튜닙과 숭실대 공동연구팀이 작성한 논문이 EMNLP에서 승인되었어요👏

생성형AI 스타트업에서 EMNLP에 연구 논문이 승인되다
이데일리기사 튜닙X숭실대 혐오발언 데이터셋 연구 논문 EMNLP 승인

 

✔️ 튜닙의 혐오발언 데이터셋 연구 논문 EMNLP 승인받다

튜닙의 박규병 대표와 김수환 연구원이 참여한 논문

“K-HATERS: A Hate Speech Detection Corpus in Korean

with Target-Specific and Fine-Grained Offensiveness Ratings” 는

자연어처리 분야 최고 저명 학술대회 EMNLP 2023 Findings에 게재됩니다 🥳

 

논문에서 연구팀은 혐오 발언 탐지를 위해 단계별로 공격성 점수를 측정했고

이를 통해, 명시적인 형태의 혐오발언 뿐만 아니라

암시적인 형태의 혐오 발언까지 탐지될 수 있도록 라벨링 가이드라인을 구축할 수 있었고

나아가 이를 바탕으로 한국어 라벨링 데이터셋 K-헤이터스(K-HATERS)를 완성했어요 🙌

 

✔️ 현존하는 혐오 탐지 한국어 데이터셋 중 가장 큰 규모라고?!

약 20만건으로 이뤄진 데이터셋 규모는

현존하는 혐오 탐지 한국어 데이터셋 중 가장 크다고 하니

혐오 발언 탐지에 새로운 패러다임을 안겨줄 수도 있겠죠? 🤔

해당 데이터셋은 오는 12월 논문 출판 이후

본격적으로 오픈데이터셋 홈페이지를 통해 공개될 예정이니 많은 관심 부탁드려요 💗

(출처: “튜닙·숭실대, 혐오 발언 데이터셋 연구 EMNLP 논문 승인”, 네이버 뉴스, 2023년 10월 24일)

 

기사의 전문을 읽고 싶으시다면 아래의 링크를 클릭해 주세요!

📍[이데일리] 튜닙·숭실대, 혐오 발언 데이터셋 연구 EMNLP 논문 승인

https://n.news.naver.com/mnews/article/018/0005603102?sid=105

📍[아이티데일리] 튜닙-숭실대 공동 연구팀, EMNLP 2023 파인딩스에 논문 게재

http://www.itdaily.kr/news/articleView.html?idxno=217558