KLI

HMM을 이용한 음성 자동분절에 관한 연구

Metadata Downloads
Alternative Title
A Study on Automatic Speech Segmentation Using HMM(Hidden Markov Model)
Abstract
음성 인식기로 사용되고 있는 HMM을 확장된 분류의 음소를 기본 단위로 하여 연속 음성 문장의 음성 분절에 이용하였다. 음소의 분류를 자음, 모음, 묵음, 유음 그리고 비음의 5가지 음소와 정지 자음, 비정지 자음, 모음, 묵음, 유음, 그리고 비음의 6가지 음소로 구성된 두 분류로 나누었다.

HMM의 교육과정에서 사용된 씨앗 문장의 데이터 베이스(DB)는 수작업으로 분절된 30개의 연속 음성 문장이다. 교육된 HMM을 이용하여 분절을 시도하고, 분절된 문장을 데이터 베이스 확장에 사용하였다. 이 과정을 확장된 문장의 수가 120개가 될 때까지 반복하였다. 연속 음성의 분절은 화자 독립인 경우에 대하여 시도하였으며, 두 가지의 분류에 대하여 분절 결과를 비교하였다. 제안된 분류에 대하여는 각 상태의 혼합 계수(mixture coefficient)의 개수 변화에 따라 분절 결과를 비교하였고, 교육된 HMM을 이용하여 자동 분절된 음소의 경계 구간과 수작업으로 분절한 음소의 경계 구간을 비교, 분석하였다.
We proposed a hidden Markov model(HMM), which is used as a speech recognizer, for the segmentation of the continuous speech. The one is composed of vowel(V), consonant(C), silence(S), liquid(L) and nasal(N) and the other is composed of stop consonant(SC), non-stop consonant(NC), silence(S), liquid(L) and nasal(N).

The trained HMM is used for the automatic phoneme segmentation and the segmented sentences are added into the DB. This process is iterated until the umber of sentences of independent speaker is 120. The results of the two segmented groups are compared. The boundaries of the phonemes, which are segmented by the trained HMM, are compared with those of the phonemes which are segmented by hand. The seed-sentences used in the training of the HMM are the 30 continuously spoken sentences, which are segmented by hand.
We proposed a hidden Markov model(HMM), which is used as a speech recognizer, for the segmentation of the continuous speech. The one is composed of vowel(V), consonant(C), silence(S), liquid(L) and nasal(N) and the other is composed of stop consonant(SC), non-stop consonant(NC), silence(S), liquid(L) and nasal(N).

The trained HMM is used for the automatic phoneme segmentation and the segmented sentences are added into the DB. This process is iterated until the umber of sentences of independent speaker is 120. The results of the two segmented groups are compared. The boundaries of the phonemes, which are segmented by the trained HMM, are compared with those of the phonemes which are segmented by hand. The seed-sentences used in the training of the HMM are the 30 continuously spoken sentences, which are segmented by hand.
Author(s)
김석수안종구
Issued Date
1997
Type
Research Laboratory
URI
https://oak.ulsan.ac.kr/handle/2021.oak/4102
http://ulsan.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002025366
Alternative Author(s)
Kim,Seok SooAn,Chong Koo
Publisher
공학연구논문집
Language
kor
Rights
울산대학교 저작물은 저작권에 의해 보호받습니다.
Citation Volume
28
Citation Number
1
Citation Start Page
47
Citation End Page
59
Appears in Collections:
Research Laboratory > Engineering Research
공개 및 라이선스
  • 공개 구분공개
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.