전체 글
-
[논문리뷰보다는 해석에 가까운] AngryBERT: Joint Learning Target andEmotion for Hate Speech DetectionDeep Learning 2021. 6. 25. 20:05
https://arxiv.org/pdf/2103.11800.pdf Mar-2021 발행 기존 진행된 연구의 한계 지도학습을 사용하여 이미 Annotate된 dataset에 과하게 의존 → 불균형 dataset: 혐오표현 학습을 위한 training sample이 너무 적음 → 현재 사용되고 있는 data augmentation 방법은 성능 향상에 미치는 정도가 미미함 해당 문제를 개선하기 위해 본 논문에서는 1차 task로 hate speech detection을 하되 2차 task로 감정 분류와 타겟 인식을 함께 수행하는 Angry BERT 모델을 제시 Multi-task learning: 여러 관련된 task에서 유용한 정보들을 활용함으로써 task의 일반화 성능을 높이는 기계학습 방법 AngryBE..
-
[TOXIC SPEECH DETECTION] PLAN + REFERENCEProject/Toxic speech detection 2021. 6. 17. 16:19
Toxic, offensive, hate and sexual speech detection under specific context. 06.17 Attention + Transformer 모델 복습, 혐오발언 검출 경향 파악 06.18 ~ 06.25 Build dataset (→ 07.01 까지 늘어지는 중..) - 어떤 발언이 toxic, offensive, hate, sexcual speech인가에 대한 명확한 정의 필요 - 여러가지 dataset을 조합하여 필요한 정보들을 최대한 많이 추출하는 것 필요 → 데이터가 부족할 경우, 추가로 어떻게 수집할 것인지, 추가로 수집한 데이터는 어떻게 labeling 할 것인지 - Dataset 여러가지 버전으로 구성하기 06.26 ~ 07.03 Modeling..