词汇判断范式 [Gating范式:探讨听觉词汇加工的途径]

摘 要 传统的反应时任务只能为听觉词汇加工提供定量数据,而不能提供定性信息,Gating范式的优势在于可以提供以上两种信息,使研究者能够全面、细致地了解听觉词汇加工的即时过程。

而且它的适用群体广泛,可被用于研究不同年龄段的发展。

文章较详细地介绍了Gating范式的基本特点及其在汉语研究中的应用,期待它被更多的研究者所认识和使用。

关键词 Gating范式听觉词汇加工,汉语研究。

分类号 B842      1 引言      在语言理解的研究中,听觉词汇加工与视觉词汇加工同样重要。

近二十多年来已经发展出多个重要的理论模型,如著名的Cohort模型[1],TRACE模型[2]等。

听觉语言具有连续性、方向性等特点,考察它的即时(on—line)加工过程同样需要能反映这一过程的即时任务。

常用的反应时任务包括音素辨别、词汇判断、同音判断、音素或单词监控、错误发音觉察(mispronunciation detection)、言语掩蔽(speech shadowing)等。

多数传统任务只能提供反应时间的数据,这仅仅是定量的信息,研究者需要进行巧妙的实验设计,然后根据反应时对听觉词汇加工过程进行推论。

而Gating作为另一种常用的研究范式,与反应时任务相比的明显优势在于它既能提供定量的信息、又能提供定性的信息[3],可以帮助研究者更直接地了解,在某个时间点被试进行分析的信息种类和特点,以及在连续时间点上加工随语音输入多少而发生的变化,并由此深入、细致地探讨听觉词汇加工的全过程。

1980年,Gating范式首先由Grosjean提出[4]。

这种任务的基本方法是向被试呈现从音首(onset)开始逐渐加长的单词语音片段(如图1所示),要求被试在听到每个语音片段后,写出所听到的单词,同时对每次报告的确定性做等级评定。

使用Gating范式的研究发现了词频效应、词长效应、语境效应等其它反应时实验得到的效应,证实了这种研究范式的可靠性。

此后,更多的研究者加入了对Gating范式的研究和讨论中,并使用这种范式进行听觉词汇加工研究,以及将其用于跨通道启动实验中词汇听觉识别点的确定。

2 Gating范式的基本特点      2.1 呈现方式反应方式   利用Gating技术进行研究的突出特点是可以将单词语音分成长短不同的语音片段,由短至长地呈现被试

根据被试是否听到一个单词所有的语音片段及是否连续听到那些片段,刺激呈现方式可以分为连续呈现、个别呈现和分组呈现三种。

Grosjean使用的是连续呈现方式(successive presentation format)[4],这也是Gating范式的标准呈现方式,即让被试听到同一单词连续加长的语音片段

例如,如果片段以40毫秒增加,第一个片段就是单词最开始的40毫秒,第二个片段单词最开始的80毫秒,依此类推,直至整个单词完全被呈现;之后再以同样形式呈现下一个单词

在这种方式中,由于被试会连续听到同一个单词逐渐加长的片段,其反应可能受到一定影响。

于是研究者尝试另一种呈现方式――个别(individual)呈现,个别呈现指不同组的被试听同一单词的不同长度的语音片段

例如,一组被试听所有单词的50毫秒长的语音片段,另一组被试听100毫秒的语音片段

这样,被试不会听到同一单词的重复刺激输入,也没有听到越来越长的单词片段,且听到的语音片段总数比在连续方式中听到的少。

但是,同样的实验在个别呈现方式下会比连续呈现方式需要更多的被试;而且需要进行被试间的比较,实验结果可能受到被试个体差异的影响。

有研究排除了连续呈现与个别呈现方式对实验存在不同效应的可能性。

Cotton和Grosjean比较了这两种方式被试反应[5],发现连续呈现方式除了在短语境条件下稍微提高了被试的确定性等级,在其它方面没有影响被试的成绩。

Salasoo和Pisoni也发现呈现方式对于在语境中识别单词的早晚没有效应[6],连续呈现方式下正确识别一个单词的平均语音长度是161毫秒,而个别呈现方式下是166毫秒。

这两个研究都表明,以上两种呈现方式对Gating任务的一般反应模式没有影响。

但这只能证明,从结果上看,两种呈现方式之间没有差异;而它们各自的局限性依然存在,也仍然可能对正常的实验结果造成干扰。

分组(duration—blocked)呈现结合了连续、个别呈现的特点,但与连续呈现方式更接近。

二者的最大区别在于,分组呈现时,被试听到的语音片段是根据刺激的长度(duration)来分组,而不是根据单词分组[7],即每个语音组包含所有单词的同一长度的语音片段,按语音片段从短到长的顺序呈现各组刺激,每组内刺激的顺序各异。

例如,首先呈现所有单词的50毫秒长的语音片段,然后改变单词顺序呈现所有100毫秒长的语音片段,依此类推。

这样,同一个单词的各个语音片段不是连续出现,但被试仍然可以对每个单词的所有语音片段反应,既排除了连续刺激对被试可能产生的影响,也能够排除被试间个体差异的效应。

Walley及其同事比较了连续呈现和分组呈现方式的结果,发现连续呈现识别有抑制效应[7]。

被试在连续呈现方式下比分组呈现方式产生更少的候选词,或者更可能重复过去的反应,需要更多的语音输入来识别(isolate)目标词;而且还需要更多的输入来保持正确的、有高确信度的识别反应,特别是当目标词来自大的词群(cohort)、需要从很多可能的词中进行辨别的时候。

这些结果表明,Gating范式的连续呈现方式听觉词汇识别能力产生比较保守的估计。

从纯粹设计的观点来看,连续和分组呈现都比个别呈现方式更简单、经济,因为需要的被试比较少[5,7];而且分组呈现方式可以比连续呈现方式更好地模拟实时(real—time)言语过程,如在句子中听到不同单词的零碎片段,而不是反复听同一个单词的开始部分,因此在某些情况下,它可能比Gating范式标准的连续呈现方式研究者有更大的用处[7]。

Gating任务有两种反应方式,最常用的是书面报告,也有口头报告。

书面报告要求被试在听到单词语音片段之后,在答案纸上写出听到的单词,并在量表上圈出确定性等级;口头报告则要求被试说出所听到的单词,并给出确定性等级,被试反应被录音记录。

这两种反应方式都不要求被试的快速反应,但在一定时间限制内,如果被试不做反应,则该项目被定为零反应

有研究表明,反应方式因素没有显著效应,且与其它因素无交互作用[7],表明书面报告和口头报告的反应方式不会影响实验结果。

2.2 提供的数据   利用Gating范式得到的数据很丰富,定量的数据包括语音识别点和确定性等级两类,定性的数据包括各种错误反应和正确反应形式。

单词语音识别点通常用“IP (Isolation Point)”来进行估计,指被试正确识别目标词语音、并且不再改变答案时的那一点[3,4],它既可以用语音片段的长度值来表示,也可以用语音片段的长度在整个单词长度中所占的百分比来表示。

例如,研究发现英语单词的IP与词长有关,音节多的单词IP较长,单音节词的平均识别点为289毫秒,双音节词为306毫秒,三音节词为406毫秒[4]。

Grosjean还从IP观察到语境效应:在没有语境时,识别单词平均需要整个单词语音中83%的语音长度,在短语境中需要60%的语音长度,而长语境中只需37%的语音长度[4]。

如果被试在一个词的所有语音片段呈现完毕之后还没有识别该词,通常将IP定为整个单词语音长度,或者整个单词的长度加一个语音片段的长度(如,40或50毫秒)。

与IP对应的一个指标是CIP(Confidence ratings at IP),指被试在IP时的确定性等级。

如果被试在所有语音片段之后仍未识别目标语音,通常将CIP定为最小等级1。

实际上,IP并不是严格意义上的词汇识别点,而应为“辨别点”,RP(Recognition Point)才是真正的“识别点”。

因为在IP,被试刚刚能辨别(isolate)出某个语音,只是初步将所听到的声音片段判断为某个字词的读音,但并不十分确定自己的答案是否正确,所以这时CIP会比较低。

只有当被试继续判断语音信息,达到某个较高的确定性等级时,单词才被识别(recognized),这时应该得到较高的CIP[4]。

研究者将RP定义为:被试识别目标词语音,且达到80%或更高的确定性等级时的平均语音片段长度[3]。

也有研究者使用类似的概念――TAP(Total Acceptance Points)――来表示RP,TAP指在某长度的语音片段上,被试识别了目标词,并首次给出高水平的确定性等级(如,7点量表中的“6或7”),且不再改变答案或给出更低的确定性等级。

如果被试没有保持正确的识别答案,或没有给高水平(6或7)的确定性等级,TAP为整个目标词的语音长度加一个语音片段的长度(如,40或50毫秒)[7]。

可见,研究者对RP的定义和意见并不完全一致[8],因此通常利用Gating范式听觉词汇研究仍然主要以IP为指标,在这一点对词汇识别的各种特点进行分析讨论。

除了以上的定量数据,定性的数据是Gating范式特有优势的体现。

研究者可以通过各种反应形式分析词汇识别的细致过程。

例如,Grosjean对错误反应进行分析[4],发现了三种歧义效应:①“部分词”歧义("word from word" garden path),指把目标词的一部分认为是另外一个词,如,将captain错误判断为cap,将stretcher认为是stretch;②词频歧义(word—frequency garden path),指把目标词认为是另外一个语音相似的高频词,如,将bog认为是ball;③语义歧义(the semantic garden path),指把目标词认为是另外一个符合句子语义的词,如,在句子He walked into a bog中,把目标词bog认为是bar。

从这些效应不难看出多种因素影响着听觉词汇识别过程。

正确反应在某种情况下也可以被分析。

汉语存在大量的单音节同音字词,因此若在无语境条件下研究汉语单字词的听觉识别,当被试反应形式是书写报告时,就可以得到多种正确反应形式(与目标字同音的字都正确)。

研究者对这些正确反应的字进行频率分析,发现存在频率效应:对同一个目标语音来说,所有被试的答案中高频字比低频字多[9]。

2.3 是否属于即时任务?适用于哪些群体?   由于Gating范式中通常的反应方式(无论书面报告还是口头报告)并不要求被试的快速反应,也不以被试反应时间作为分析指标,能否将这种任务用于即时(on—line)过程的研究受到了人们的质疑。

那些类似于事后(off—line)分析的数据能否反映听觉词汇加工的即时特点?Tyler等人的研究[3]回答了这个问题。

他们改变Gating的传统反应方式,将书写反应改为快速命名听到的语音片段是什么单词,并记录反应时。

同时,在这种快速命名和传统的书写反应方式下,考察不同类型的语境对听觉词汇识别的影响。

研究者认为,快速反应方式应该与其它反应时任务一样,对即时过程敏感。

结果发现快速命名得到反应时数据与其它即时任务得到的反应时数据是可比的,说明Gating任务的这种反应变式的确与其它即时任务一样可以探测即时加工过程。

同时,句法和语义制约的影响在书写反应形式和快速反应形式下是相同的,都是强句法制约比弱语义制约的效应小,表明Gating的普通反应形式也对听觉词汇识别的实时加工过程敏感。

因此Gating范式可以作为听觉词汇加工的研究手段。

正因为Gating任务的反应方式不象一般的即时任务那样要求快速反应,所以被认为适合进行儿童研究,甚至也适用于其他特殊群体,例如有语言落后或阅读问题的儿童,患有唐氏综合症(Down′s Syndrome)的青少年以及老年性痴呆或失语症(Alzheimer′s dementia or aphasia)的病人[7]。

那么,Gating是否适合在不同年龄群体之间的比较?Walley等人对幼儿园儿童、一年级儿童和成人三组被试进行了考察[7]。

结果发现,Gating范式不同的呈现方式对成人和儿童的影响是类似的,年龄与呈现方式没有交互作用,连续呈现比分组呈现对儿童和成人识别能力的估计都更加保守。

因此研究者认为Gating范式的这两种呈现方式都可以用于进行听觉词汇识别的发展研究,比较各年龄段的加工特点。

3 Gating范式在汉语研究中的应用      虽然Gating已经成为英语听觉词汇加工研究中常用的范式之一,但它在汉语研究中的应用还非常少,早期主要来自Li及其同事的一系列研究。

他们考察了汉语口语句子理解的暂时结构,发现部分句子信息对汉语句子理解有重要作用,汉语听众参照语言里完整的、合语法的模型来整合不完整的、不合语法的句子片段

研究者认为这种加工特点反映了汉语的特点,即构词法、语法和句法制约都体现在句子组成部分之间的关系上[10]。

在考察语境效应在汉语及汉-英双语者的同音词加工中的作用时,他们发现句子语境在同音词解歧过程早期起作用,表明同音词识别语音词汇和语境信息早期相互作用的结果[11]。

另外,他们还考察了汉-英双语者对口语编码转换词(code—switched words)的识别,发现识别编码转换词需要依靠语音、结构和语境信息的相互作用,也表明汉-英双语者在识别编码转换词时,与英文单语者所需要的信息量相同,研究者用口语平行激活和相互作用加工对结果进行了解释[12]。

武宁宁和舒华近期的研究尝试分析Gating技术提供的多种数据,对汉语普通话单音节词的基本加工特点进行初步探讨,旨在将该技术引入汉语听觉词汇加工的研究中。

通过对听觉语音识别点(IP)、不同时间点的多种错误率(总错误率,声母、韵母、声调错误率)、以及错误类型(声调、声母、韵母)的分析,研究发现,听觉语言的方向性对听觉词汇加工有重要影响,且对音段信息和超音段信息都有作用。

另外,也观察到声调信息的识别特点,如,声调可以独立于音段信息而被识别、声调本身的音高特点也影响语音识别点的早晚、即时影响声调识别的因素不一定局限于声调的区别性特征等。

此外,Gating技术还被用于为歧义词意义激活研究设定精确的时间探测点[13,14]。

在一些跨通道启动的研究中,研究者往往在听觉启动词(歧义词)的语音结尾点(offset)呈现视觉目标词,并在这时讨论语境在词汇识别早期的作用。

而实际上,听觉词汇识别通常在整个语音呈现完毕之前就已经完成,所以在歧义词的语音结尾点并不能探测识别早期的加工情况。

因此,在进行这类研究之前,需要用Gating技术来确定歧义词的语音识别点,这样才能更准确地探讨语境的早期作用。

综上所述,Gating范式可以提供丰富的信息,使研究者能够全面、细致地了解听觉词汇加工的即时过程。

而且它广泛适用于正常和有障碍的群体,也可以进行不同年龄段的发展研究。

另外还能为跨通道启动实验提供精确的探测点。

尽管曾有研究者提出其呈现方式的问题以及质疑其能否反映即时加工,通过多年的完善、讨论和广泛应用,Gating范式仍被证明不失为听觉词汇加工研究的一个很好的途径。

因此,希望它的优势也能更多地在汉语加工研究中被发挥。

参 考 文 献    1 Marslen—Wilson W, Welsh A. Processing interactions and lexical access during word recognition in continuous speech. Cognitive Psychology, 1978, 10: 29~63    2 McClelland J L, Elman J L. The TRACE model of speech perception. Cognitive Psychology, 1986, 18: 1~86    3 Tyler L K, Wessels J. Is gating an on—line task? Evidence from naming latency data. Perception and Psychophysics, 1985, 38(3): 217~222    4 Grosjean F. Spoken word recognition processes and the gating paradigm. Perception and Psychophysics, 1980, 28(4): 267~283    5 Cotton S, Grosjean F. The gating paradigm: A comparison of successive and individual presentation formats. Perception and Psychophysics, 1984, 35(1): 41~48    6 Salasoo A, Pisoni D. Interaction of knowledge sources in spoken word identification. Journal of Memory and Language, 1985, 24: 210~231    7 Walley A C, Michela V L, Wood D R. The gating paradigm: Effects of presentation format on spoken word recognition by children and adults. Perception and Psychophysics, 1995, 57(3): 343~351    8 Grosjean F. Gating. Language and Cognitive Processes, 1996, 11(6): 597~604    9 武宁宁, 舒华, 刘燕妮. 汉语听觉词汇加工:来自Gating实验的证据. 第九届全国心理学学术会议, 广州: 2001   10 Li P. The temporal structure of spoken sentence comprehension in Chinese. Perception and Psychophysics, 1996, 58: 571~586   11 Li P, Yip M C. Context effects and the processing of spoken homophones. Reading and Writing: An Interdisciplinary Journal, 1998,10: 223~243   12 Li P. Spoken word recognition of code—switched words by Chinese—English bilinguals. Journal of Memory and Language, 1996, 35: 757~774   13 Li P, Shu H, Yip M, et al. Lexical ambiguity in sentence processing: Evidence from Chinese. In: M Nakayama eds. Crosslinguistic Sentence Processing. Stanford, CA: Center for the Study of Language and Information Publications, in press.   14 武宁宁, 舒华. 句子语境中汉语词类歧义词的意义激活. 心理学报, 2002, 34(5): 454~461      GATING PARADIGM: AN APPROACH FOR INVESTIGATION OF   SPOKEN WORD RECOGNITION   Wu Ningning, Shu Hua   (School of Psychology, Beijing Normal University, Beijing 100875)   Abstract   In studies of spoken word recognition, traditional reaction time (RT) tasks only give us quantitative information rather than qualitative information. The advantage of gating paradigm over RT tasks is that it provides both kinds of above information, which benefits researchers on observing an overall on—line process of spoken word recognition in detail. Furthermore, gating is also used in developmental studies and it is fit for special groups, such as children with reading problem, adults with aphasia, etc. This paper introduced the essential facets of gating paradigm and its limited application in Chinese studies, in order to make it more realized and used by Chinese psychologists.   Key words gating paradigm, spoken word recognition, Chinese study.

1 次访问