User Guide for KOTE: Korean Online Comments Emotions Dataset
Abstract 데이터를 긍정 혹은 부정으로 분류하는 감성 분석은 텍스트의 감정적인 측면을 인식하기 위해 주로 사용되어 왔다. 그러나 감정적 의미에 철저한 검토는 부족하였다. 최근에는, 단순 valence(심리학 용어, “공감” 비슷한 뜻)에 더해 labeled 된 corpora는 이러한 한계를 넘을 수 있도록 제작된다. 그러나, 대부분의 한국어 감정 corpora는 예시의 숫자가 적고, 제한된 범위의 감정만 cover한다. 연구팀에서는 KOTE 데이터셋을 소개한다. KOTE에는 5만 개의 한국어 온라인 댓글(25만 개의 case)를 포함하며, 각 댓글은 43개의 label 또는 감정 없음으로 labeling 되어있으며, 크라우드소싱으로 진행되었다. 43개의 감정 taxonomy는 word embeddi..
2022.05.26