PSOLA

出典: フリー百科事典『ウィキペディア(Wikipedia)』

出典: フリー百科事典『ウィキペディア(Wikipedia)』

PSOLA (Pitch Synchronous Overlap and Add; ピッチ同期重畳加算 あるいは ピッチ同期波形重畳法[1]) とは、音声信号の 訳注: スペクトルをある程度保ったまま ピッチや持続時間(テンポ)を変更可能な、音声処理(特に音声合成)のためのデジタル信号処理手法である。

PSOLAは、音声波形を 訳注: 波形周期(ピッチ)と同期した分析窓で、[2]互いにオーバーラップした短い断片(訳注: 基本周期の2倍程度[2])に分割して処理する。信号のピッチを下げるには断片を互いに遠ざけ、ピッチを上げるには互いに近付けて断片を再配置する。(訳注: なお、この操作は信号の持続時間の変化を伴うので、[2] 次の補正を行う) 信号の持続時間を長くするには 引き続き同じ断片を複数回繰り返し、短くするには いずれかの断片を間引きする。訳注: 一連の操作の後、 各断片を重畳加算法 (英語: overlap-add) で結合する。

PSOLAは音声信号の韻律 (英語: prosody) の変更に使用できる。

関連項目[編集]

参考文献[編集]

  • Eric Moulines; Francis Charpentier (December 1990), “Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones”, Speech Communication 9: 453–467, doi:10.1016/0167-6393(90)90021-Z 
  • Eric Moulines; Jean Laroche (February 1995), “Non-parametric techniques for pitch-scale and time-scale modification of speech”, Speech Communication 16 (2), doi:10.1016/0167-6393(94)00054-E 
  1. ^ 板橋秀一 (2005), 音声工学, 森北出版, p. 169, ISBN 9784627828117 
  2. ^ a b c R. Kortekaas; A. Kohlrausch (1997), “Psychoacoustical Evaluation of the Pitch-Synchronous Overlap-and-Add Speech-Waveform Manipulation Technique Using Single-Formant Stimuli”, Journal of the Acoustical Society of America (JASA) 101 (4): 2202–2213, http://alexandria.tue.nl/repository/freearticles/622042.pdf