2가지 새 데이터셋을 공개하게 되어 소개해 드립니다.
작년에 있었던 인공지능 그랜드 챌린지 중 두 개의 과제에 튜닙이 참여했었는데요, 이 대회는 여느 대회와 다르게 별도의 학습 데이터를 제공하지 않아, 참여팀들이 각자 학습 데이터를 만들어야 했습니다. 저희도 나름 공을 들여 학습 데이터와 validation 데이터를 만들었었습니다. 이제 대회가 끝나 이 데이터를 좀 더 보완하여 커뮤니티에 공개하기로 결정했습니다.
하나는 자연어로 된 수학문제에 대해 풀이법을 파이썬 코드로 생성하는 과제를 위한 데이터구요, (https://github.com/tunib-ai/KMWP) 다른 하나는 대화를 보고 그 클래스(위협 여부, 위협은 4개의 세부 클래스)를 예측하기 위한 데이터입니다. (https://github.com/tunib-ai/DKTC)
관심 있는 분들은 한번 살펴보시면 좋겠습니다.
'TECH' 카테고리의 다른 글
[2022.09.14]진화하는 악성 댓글, AI가 걸러준다! (0) | 2022.09.14 |
---|---|
[2022.08.30] 불편한 이야기는 그만..! (0) | 2022.08.30 |
[2021.12.21] OSLO 공개! (0) | 2021.12.21 |
[2021.10.28] Large-scale language modeling tutorials with PyTorch (0) | 2021.11.04 |
[2021.09.18] TUNiB-Electra 공개 (0) | 2021.11.04 |