KLI

한국어 어휘 의미망을 활용한 CRF 모델 기반 개체명 인식

Metadata Downloads
Alternative Title
CRF based Named Entity Recognition Using a Korean Lexical Semantic Network
Abstract
개체명 인식은 주어진 문장 내의 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 딥러닝 네트워크 혹은 언어 모델을 이용한 개체명 인식 연구들이 높은 성능을 보였지만 이러한 모델은 고성능의 컴퓨팅 파워가 요구되며 학습 모델의 속도가 느려 아직은 실용성이 낮다는 문제가 있다. 본 논문에서는 실용성을 목적으로 처리 속도와 정확률을 모두 고려하여 기계학습 방식의 CRF를 기반으로 하여 의미 자질과 구문적 자질을 추가한 개체명 인식 시스템을 제안한다. 한국어 어휘 의미망(UWordMap)을 활용하여 사람의 지식을 기반으로 하여 의미 자질인 상위어, 최상위어 정보와 구문적 자질인 의존관계와 격조사 정보를 학습 자질로 추가하고 평가하였다. 실험 결과, F1 score 기준 90.54% 포인트의 성능과 초당 약 1,461 문장을 처리하였다.
Author(s)
박서연옥철영
Issued Date
2021
Type
Article
Keyword
개체명 인식기계학습조건부 랜덤 필드한국어 어휘 의미망
DOI
10.5626/JOK.2021.48.5.556
URI
https://oak.ulsan.ac.kr/handle/2021.oak/9146
https://ulsan-primo.hosted.exlibrisgroup.com/primo-explore/fulldisplay?docid=TN_cdi_nrf_kci_oai_kci_go_kr_ARTI_9784569&context=PC&vid=ULSAN&lang=ko_KR&search_scope=default_scope&adaptor=primo_central_multiple_fe&tab=default_tab&query=any,contains,%ED%95%9C%EA%B5%AD%EC%96%B4%20%EC%96%B4%ED%9C%98%20%EC%9D%98%EB%AF%B8%EB%A7%9D%EC%9D%84%20%ED%99%9C%EC%9A%A9%ED%95%9C%20CRF%20%EB%AA%A8%EB%8D%B8%20%EA%B8%B0%EB%B0%98%20%EA%B0%9C%EC%B2%B4%EB%AA%85%20%EC%9D%B8%EC%8B%9D&offset=0&pcAvailability=true
Publisher
정보과학회논문지
Location
대한민국
Language
한국어
ISSN
2383-630X
Citation Volume
48
Citation Number
5
Citation Start Page
556
Citation End Page
567
Appears in Collections:
Engineering > IT Convergence
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.