TECH
[2022.01.10] 2가지 새 데이터셋 공개
주식회사 튜닙
2022. 1. 10. 19:57
2가지 새 데이터셋을 공개하게 되어 소개해 드립니다.
작년에 있었던 인공지능 그랜드 챌린지 중 두 개의 과제에 튜닙이 참여했었는데요, 이 대회는 여느 대회와 다르게 별도의 학습 데이터를 제공하지 않아, 참여팀들이 각자 학습 데이터를 만들어야 했습니다. 저희도 나름 공을 들여 학습 데이터와 validation 데이터를 만들었었습니다. 이제 대회가 끝나 이 데이터를 좀 더 보완하여 커뮤니티에 공개하기로 결정했습니다.
하나는 자연어로 된 수학문제에 대해 풀이법을 파이썬 코드로 생성하는 과제를 위한 데이터구요, (https://github.com/tunib-ai/KMWP) 다른 하나는 대화를 보고 그 클래스(위협 여부, 위협은 4개의 세부 클래스)를 예측하기 위한 데이터입니다. (https://github.com/tunib-ai/DKTC)
GitHub - tunib-ai/DKTC: Dataset of Korean Threatening Conversations
Dataset of Korean Threatening Conversations. Contribute to tunib-ai/DKTC development by creating an account on GitHub.
github.com
GitHub - tunib-ai/KMWP: Korean Math Word Problems
Korean Math Word Problems. Contribute to tunib-ai/KMWP development by creating an account on GitHub.
github.com
관심 있는 분들은 한번 살펴보시면 좋겠습니다.