2018年2月4日 星期日

HTK Tools (5): 單音素建模 - Phones 對齊

上一個章節完成靜音模型調適,在那之前,都是將 Phones 和 Phones 做對齊,然而現在要把文字和 Phones 做對齊,本文章紀錄 (Realigning) 部分的作法。

字典調整


現在使用的發音字典 (如 beep-1.0), 裡面有太多發音,但沒有這個章節需要的 silence ,雖然字典中已經有一些對靜音的描述,但為了避免混淆,要再發音字典 (如 beep-1.0) 中,加入一個 silence 的發音,請在任一行或相關的行數上,新增一行:

silence   sil
(這裡有使用空 3 個 tab)

使用指令對齊


字典加入 silence ,是因為靜音也必須當成是一個 phone ,完成後,就可以使用指令來製作一個 aligned.mlf 檔案:

HVite -A -D -T 1 -l '*' -o SWT -b silence -C config -a -H hmm7\proto -H hmm7\hmmdefs -i aligned.mlf -m -t 250.0 -y lab -I words.mlf -S train.scp beep-1.0 monophones1
(請注意,上方的 "*" 如果是在 Windows ,就不需要加入單引號,如果是 Linux ,請加上單音號。)

重複參數重估


完重對齊後產生的 aligned.mlf 檔案,還要再拿來做 HERest 兩次,請再建立 hmm8 和 hmm9 目錄,然後輸入指令:

HMM8
HERest -A -D -T 1 -C config -I aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm7\proto -H hmm7\hmmdefs -M hmm8 monophones1

HMM9
HERest -A -D -T 1 -C config -I aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm8\proto -H hmm8\hmmdefs -M hmm9 monophones1


Reference:
http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial/monophones/step-8
http://www.voxforge.org/uploads/CI/iz/CIizk1bg-1datnxqXy9tyQ/wlist
http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial/monophones/step-8





2 則留言:

  1. 使用指令对齐时,生成的aligned.mlf同words.mlf相比少了几个label檔案,不知道怎么回事?不知道博主是否遇到这样的问题,望指教

    回覆刪除
  2. 可能要再上一篇 HTK Tools(3) 的 "Label 檔案處理" 這個小節看看有沒有做錯,因為那個步驟有點麻煩

    回覆刪除

© ERIC RILEY , 自由無須告知轉貼
Background Japanese Sayagata by Olga Libby