YASURAOKA NAOKI, ITOYAMA KATSUTOSHI, YOSHIOKA TAKUYA, TAKAHASHI TORU, KOMATANI KAZUNORI, OGATA TETSUYA, OKUNO HIROSHI G
研究報告音楽情報科学(MUS), 2010(20) 1-8, Jul 21, 2010
フレーズ置換とは,多重奏音響信号から特定パート演奏をユーザー指定の別楽譜による演奏に差し替えるものである.これは,1) 元々のフレーズ演奏成分を除去する音源分離の課題と,2)元演奏の音色や演奏表情を新しい演奏上で再現する演奏合成の課題からなる.我々は調波非調波Gaussian Mixture Model (GMM) による置換対象演奏モデルとNonnegative Matrix Factorizationによる伴奏モデルを用いて音源分離を行い,同時に調波非調波GMMから得た基本周波数,倍音強度などの音響特徴を新しい演奏楽譜のMIDI音源音響信号に転写することで元演奏の音響特性を持つ新しい演奏を合成する.本フレーズ置換法に対し1) 元の演奏が正しく除去されるか,2) 新しい演奏は元演奏の特徴を保持しているか,の2点を客観評価し,提案法の有効性を示す.This paper presents a music manipulating system that enables a user to replace an instrument performance phrase in polyphonic audio mixture. Two technical problems must be solved to realize this system: 1)separating the melody part from accompaniment, and 2)synthesizing a new instrument performance that has timbre and expression of the original one. Our method first performs the separation using statistical model integrating harmonic and inharmonic Gaussian mixture and nonnegative-matrix-factorization. Then our method synthesizes a new instrument performance by adding the acoustic characteristics given by Gaussian mixture parameters to a MIDI synthesizer-generated sound. Two evaluations confirm the effectiveness of the proposed method.