(American) English Forced Alignment

강제음성정렬장치 일명 Forced Alignment를 처리하기 위해 HTK를 통해 만들었으며, Python, Flask와 Bootstrap 등을 이용해서 만든 Front page입니다.

대체로 문장 단위로 녹음된 wav 파일과 영어로 받아 적은 txt 파일이 있으면, 소리 파일에서 단어 및 단어를 구성하는 자모음의 구간을 자동으로 포착해서 Praat의 TextGrid 형태로 반환해 줍니다. 100% 완벽하게 align되지는 않지만, manual correction을 통해 음성학 및 음운론 연구에 이용할 수 있습니다.

특징: 웹기반 시스템 중에 (아마) 유일하게 여러 파일들을 동시에 batch 처리할 수 있는 시스템입니다.

파일 업로드

성능을 최적화하기 위해서 한두문장으로 된 짧은 wave 파일과 동일한 파일명의 영어로 된 텍스트 파일을 업로드해 주기 바랍니다. wave 파일과 텍스파일을 한꺼번에 선택하여 upload할 수 있습니다.

업로드

Forced alignment(강제음성정열) 사용 방법

현재 개발 중입니다. 동일명의 wav 파일과 text 파일(예: test.wav, test.txt)을 올리지 않으면 system error가 발생할 수 있습니다.

wav 파일과 txt 파일의 예로 다음의 파일들을 다운받아 사용해 보시기 바랍니다.

wav 파일과 txt 파일의 짝이 맞게 탐색기에서 한꺼번에 upload시키기

많은 파일을 한꺼번에 upload할 수는 있지만, 한 번 upload시킬 때 파일의 전체 크기가 32MB가 넘지 않도록 하기 바랍니다.


What is a forced alignment system?

Automatic forced-alignment tools map wave forms to orthographic word or phone sequences. The web-based Korean forced alignment system can be used to force align wave files to romanized word and phone sequences, as shown in the example above.


Address


Sujung-Kwan 820, 34 da gil 2, Bomun-ro, Sungbuk-gu, Seoul, 02844, South Korean
서울특별시 성북구 보문로 34다길2 성신여자대학교 수정관 B-820 (02844)

Email


tyoon@sungshin.ac.kr