
2.实验方法
2.1 听辨刺激材料
录音材料(表1)为5个长度相同的(部分实验句来自或改编自刘艳[19],已获得授权)简单句,句中不含有体现情感的词语。本文所使用的录音由一名36岁从事播音主持行业的女性发音,该发音人来自北方方言区且接受过专业的发音训练。录音在安静的房间内进行,使用软件Adobe Audition,采样频率为22050Hz。发音人分别用中性、高兴、恐惧、愤怒、悲伤、惊讶六种情感朗读每个句子,发音人在做好充分准备后进行录音。本次录音共录制了30个句子,最终使用29个句子(由于一个表达愤怒的句子录音不完整,故将其删除)作为感知实验的自然语音。
实验共包含三种语音刺激,第一种语音刺激是自然语音,这一类型的语音保留了所有的声学线索。第二种刺激对自然语音进行了低通滤波,因此只保留了自然语音的基频信息。滤波使用Praat软件进行操作,采用了Scherer[9]的方法,以每个句子的最高频率为滤波的截止频率,平滑(Smoothing)频率设定为100Hz[15]。第三种刺激是在第二种语音的基础上,进行平均时长和平均音强的归一化处理,在计算出所有句子的平均时长和平均音强后,在Praat软件中将每个句子的时长和音强分别修改为所有句子的平均时长值和平均音强值。
共有17名普通话母语者(9男8女)参加听辨实验,所有被试均来自北方方言区,没有语言、听力、神经性损伤,被试年龄分布在27—36岁,平均年龄为29.5岁。
2.2 实验过程
本文共包含三个辨认实验模块,上文提到的每一种刺激类型都作为一个单独的模块给被试呈现,即自然语音、低通滤波语音和滤波并进行音长和音强归一化后的语音。
在每个实验模块中,每一个刺激都重复播放4次,共得到29×4×17=1972个试次,所有播放的测试项以随机次序呈现。在每一个听辨试次中,屏幕中心首先呈现注视点500ms,之后播放实验刺激,要求被试听完刺激音后对所听到的语音迅速并尽量准确地进行按键判断(数字1—6分别表示不同情感)。滤波后音频的情感判断和滤波且归一化后语音的情感判断的实验顺序在被试间有较好的均衡,几乎一半人先做滤波后语音的情感辨认实验,一半人先做滤波且归一化后语音的情感辨认实验。由于自然语音情感判断任务难度较低且容易对后续实验造成影响,因此所有被试均在最后完成该模块的实验。在正式实验之前,被试需要进行练习以熟悉实验任务。实验使用E-prime软件自动记录每位被试的正确率和反应时,得到数据后使用SPSS软件进行统计分析。
表1 实验句