2021년 읽은 논문들

less than 1 minute read

2020년 읽은 논문 정리.

ColBERT: Using BERT Sentence Embedding for Humor Detection, Annamoradnejad et al. (2020)
- 날짜 : 2021-01-20
- 카테고리 : NLP
- 내용 : 유머 감지를 위한 데이터셋 구축 및 BERT 임베딩에 추가적인 MLP 구조를 더해 모델 구축
What Have We Achieved on Text Summarization?, Huang et al. (2020)
- 날짜 : 2021-01-25
- 카테고리 : NLP, Summarization
- 내용 : 추출/추상 요약 대표적인 모델 8개를 이용하여 요약 평가 지표 분석. Multidimensional Quality Metric(MQM)이라는 개념을 도입, CNN/DM 데이터셋 중 150개의 평가 데이터에 대해 전문가가 평가한 오류 들을 토대로 평가.
Reference and Document Aware Semantic Evaluation Methods for Korean Language Summarization, Lee et al. (2020)
- 날짜 : 2021-01-25
- 카테고리 : NLP, Summarization
- 내용 : 전통적인 요약 모델 평가 지표인 ROUGE는 교착어라는 한국어의 특성을 반영하는 데는 한계가 있다는 지적. 대안으로 Sentence BERT를 기반으로 하는 RDASS라는 평가 지표를 도입하고자 한다. 한글 데이터에는 전문가의 평가와 더 잘 부합한다고 주장하나, 실제 훈련 과정에서 손실 함수를 최소화하면 자연스레 RDASS가 감소하도록 정의되어 있어 객관적인 평가지표인지는 의문.

생성형 ai를 위한 컴퓨터 비전