어휘의미망을 이용한 주제 분류 및 감성 표현 영역 추출 모델
- Abstract
- 기존의 감성 분석은 하나의 문장 혹은 문서를 단일 감성으로 분류하지만, 한 문장안에 두 가지 이상의 감성이 존재할 수 있다. 본 논문은 이를 해결하기 위해 어절 단위로 감성 표현 영역을 구분하는 모델을 제안한다. 제안 모델은 주제별 사전으로 예측한 문장의 주제를 모델의 자질로 사용한다. 주제별 사전은 학습 단계 초기에 구축되며, 학습 모듈이 학습 말뭉치에서 주제별 단어를 수집하고 어휘의미망의 상하관계를 이용해 주제별 단어를 확장한다. 제안 모델의 구조는 형태소 분석된 문장을 입력으로 사용하는 UBERT 모델에 주제 분류와 감성 표현 영역을 예측하는 레이어를 추가한 것이다. 평가 방식은 어절 단위 F1-Score를 사용한다. 상술한 문장 주제를 자질로 사용한 제안 모델은 F1-Score이 58.19%까지 나왔으며, baseline보다 0.97% 포인트 향상했다.
The majority of the previous sentiment analysis studies classified a single sentence or document into only a single sentiment. However, more than one sentiment can exist in one sentence. In this paper, we propose a method that extracts sentimental expression for word units. The structure of the proposed model is a UBERT model that uses morphologically analyzed sentences as input and adds layers to predict topic classification and sentimental expression. The proposed model uses topic feature of a sentence predicted by topic dictionary. The topic dictionary is built at the beginning of machine learning. The learning module collects topic words from a training corpus and expands them using the lexical semantic network. The evaluation is performed with the word unit F1-Score. The proposed model achieves an F1-Score of 58.19%, an improvement of 0.97% point over the baseline.
- Author(s)
- A Model for Topic Classification and Extraction of Sentimental Expression using a Lexical Semantic Network
- Issued Date
- 2023
박지은
이주상
신준철
옥철영
- Type
- Article
- Keyword
- 감성 표현 영역 추출; 감성 분석; 어휘의미망; BERT; UWordMap; extraction of sentimental expression; sentiment analysis; lexical semantic network
- DOI
- 10.5626/JOK.2023.50.8.700
- URI
- https://oak.ulsan.ac.kr/handle/2021.oak/16041
- Publisher
- 정보과학회논문지
- Language
- 한국어
- ISSN
- 2383-630X
- Citation Volume
- 50
- Citation Number
- 8
- Citation Start Page
- 700
- Citation End Page
- 711
-
Appears in Collections:
- Engineering > IT Convergence
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.