演題:性別・年代及び会話形式による発話速度の違い
Subject:Variations in Speech Rate Depending on Gender, Age and Conversation Form
話題提供者::人間科学学術院 講師 梁辰
概要:
高齢者によく見られる老人性難聴には高い音が聞き取りにくい特徴を持つ一方,女性の声が高い。その結果,日常会話において高齢者にとって男声より女声が聞き取りにくいと説明されてきた。しかし,日常会話における女声の平均的な高さが老人性難聴の聞き取りにくい高さとはほぼ重ならない。したがって,日常会話における高齢者にとって男声より女声が聞き取りにくいことには,単純に発話者の性差による声の高さの違いではなく,発話速度(以下,話速)の違いが関連すると考えられる。
そこで本研究では2022年3月に国立国語研究所によって公開された「日本語日常会話コーパス」(Corpus of Everyday Japanese Conversation, CEJC)[1]に収録された会話の録音を用いて話速の計測を行った。
テレビニュースや講演音声を対象とした研究では発話された拍数を発話時間で割り,1秒に話された拍数で話速が計測されてきた。しかし,日常会話の音声では変化に富んでおり,従来の方法のままで話速を計測すると支障が生じていた。まず,日常会話には言い淀みや母音の伸ばしによって余剰な拍が発話中に現れる。これらを拍数に含めるか否かによって,算出される話速に違いが生じる。次に,日常会話には笑いなどによって発話中に間が入る。これらの間を発話時間に含めるか否かによって,算出される話速にも違いが生じる。最後に日常会話には「え」・「ね」や「あれ」・「うそ」など1発話に1拍か2拍しか含めない短い発話もあれば,20拍まで含める長い発話もある。その間の話速の違いが大きく,特に10拍以下の発話では発話の長さによる話速の変動が激しい。上記の3点を踏まえ,本研究では独自の基準を定め,言い淀みや母音の伸ばしを含める拍数,笑いなどの間を含める発話時間,さらに11拍以上の長い発話のみを対象として,話速の計測を行った。その結果,日本語の日常会話の平均的な話速が8.49拍/秒であった。8.01拍/秒と言われる講演音声に比べてやや速く[2],8.5~9拍/秒といわれるテレビニュースに比べてやや遅い結果となった[3]。
平均的な話速だけでなく,本研究ではさらに発話者の性別・年代,及び雑談での発話なのか,相談での発話なのかそれとも会議での発話なのかという発話形式が話速にもたらす影響を対応なしの3要因分散分析で検討した。その結果,発話者の性別要因の主効果が有意であった。しかし,研究前の仮説とは逆に,女性に比べて男性の話速が速い結果が示された。また,発話形式要因の主効果も有意であった。会議に比べて雑談での話速が有意に速かった。その一方,高齢者の話がゆっくりしているという日常的なイメージと異なり,発話者の年代要因の主効果が有意ではなかった。
ただし,図1と図2が示すように,その後の多重比較の結果,雑談では20代の若年者と60代以上の高齢者との間における話速の有意差が認められた。
まとめて,本研究では日本語日常会話の話速を計測した結果,女性に比べて男性の方が話速は有意に速いこと,会議に比べて雑談での話速は有意に速いことが明らかになった。また,高齢者と若年者の間の話速の違いは雑談にのみ有意に現れることが示された。ただし,本研究によって明らかにされたのはあくまでも測定上の話速であり,物理量であることに留意する必要がある。つまり,測定上の話速は,必ずしも聴感上の速さという心理量と線形に対応していない可能性がある。ここで想起されるのが,周波数の高い音の系列は低い系列の音よりも速く感じられるという聴覚現象である[4]。これがもし音声にも当てはまるならば,声の低い若年男性よりも声の高い若年女性の方が,聴感上の話速が速く感じられる可能性も考えられよう。今後,測定上の話速と聴感上の速さとを分けて発話者の属性による違いを考察し,両者の対応関係について検討することを計画している。
引用文献:
[1]小磯花絵, 天谷晴香, 石本祐一, 居關友里子, 臼田泰如, 柏野和佳子, 川端良子, 田中弥生, 伝 康晴, 西川賢哉, 渡邊友香, “『日本語日常会話コーパス』設計・構築・特徴”,国語研究所「日常会話コーパス」プロジェクト報告書 6 (2022).
[2]K. Maekawa, “Corpus of spontaneous Japanese: Its design and evaluation,” Proc. of The ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition, pp. 7-12 (2003).
[3]今井 篤, “高齢者のための音響処理技術,” 映像情報メディア学会誌, 65 (12), 1701-1704 (2011).
[4]K. Kurakata, “Effects of intensity and frequency on the perception of the time interval of tone burst sequence,” J. Acoust. Soc. Jpn. (E), 17(6), 327-329 (1996).