心理所研究揭示中文不需要采用詞間空格的認(rèn)知根源
英語(yǔ)中每個(gè)詞之間都有空格,但中文沒(méi)有空格將詞隔開(kāi),屬于不同詞的漢字相鄰呈現(xiàn)(如圖1所示)。絕大部分的英文閱讀模型認(rèn)為利用空格將詞分開(kāi)在閱讀中起到了至關(guān)重要的作用。這引發(fā)了一些重要的問(wèn)題:為什么英語(yǔ)使用空格,而中文不使用?哪種方式更好?中文是否有必要在詞之間加入空格,或者英語(yǔ)是否應(yīng)該學(xué)習(xí)中文而取消空格?中國(guó)科學(xué)院心理研究所李興珊研究組針對(duì)上述問(wèn)題開(kāi)展了一項(xiàng)研究。
圖1不同書寫系統(tǒng)標(biāo)記詞邊界的方式
該研究提出了一個(gè)假設(shè),認(rèn)為書寫系統(tǒng)對(duì)詞邊界標(biāo)記方式的選擇不是隨意的,而是為了達(dá)到高效閱讀,在權(quán)衡詞切分需要付出的認(rèn)知努力和閱讀時(shí)的視覺(jué)加工效率后,選擇了更經(jīng)濟(jì)的方式。為檢驗(yàn)該假設(shè),研究團(tuán)隊(duì)基于大規(guī)模語(yǔ)料庫(kù),運(yùn)用信息論方法量化了27種語(yǔ)言中空格為確定詞邊界提供的信息量。結(jié)果表明,不同書寫系統(tǒng)對(duì)詞邊界標(biāo)記方式的選擇與空格提供的詞邊界信息量有關(guān):在采用空格的書寫系統(tǒng)如英語(yǔ)中,空格提供的信息量更大(2.90比特);而在不采用空格的書寫系統(tǒng)如中文中,插入的空格提供的信息量更?。?.10比特,如圖2所示)。空格提供的信息量反映了閱讀無(wú)空格文本時(shí)付出的認(rèn)知努力。對(duì)于空格信息量較大的字母書寫系統(tǒng)如英語(yǔ),文本去掉空格后,讀者需要付出更多認(rèn)知努力進(jìn)行詞切分,容易出現(xiàn)詞切分錯(cuò)誤;但對(duì)于中文,如果在文本中插入空格,空格提供的信息量較小,讀者不需要付出太多認(rèn)知努力進(jìn)行詞切分。因此,英語(yǔ)傾向于使用空格以減少詞切分的認(rèn)知負(fù)擔(dān),而中文則選擇不使用空格。兩者都選擇了更經(jīng)濟(jì)的詞邊界標(biāo)記方式。
圖2二十七種語(yǔ)言中詞間空格為確定詞邊界提供的信息量
空格信息量差異的根本原因是不同書寫系統(tǒng)的詞長(zhǎng)分布不同。中文是表意文字系統(tǒng),每個(gè)漢字代表一個(gè)音節(jié)或語(yǔ)素,因此每個(gè)漢字提供的信息量超過(guò)其他書寫系統(tǒng)中的字母。中文漢字提供的平均信息量為9.84比特,而英語(yǔ)字母提供的平均信息量為4.32比特。基于該特點(diǎn),大多數(shù)中文詞可以用一到兩個(gè)漢字表示(平均詞長(zhǎng)為1.40個(gè)漢字,標(biāo)準(zhǔn)差為0.57),而英語(yǔ)單詞往往由多個(gè)字母組成(平均詞長(zhǎng)為3.78個(gè)字母,標(biāo)準(zhǔn)差為2.04)。因此,中文詞邊界位置的不確定性較小,即使插入詞間空格,其為確定詞邊界提供的額外信息有限;而英語(yǔ)詞邊界位置不確定性較大,詞間空格可以為確定詞邊界提供更多的信息量。
需要注意的是,中文若加入空格雖然提供的信息量較少,但仍提供了1.10比特的信息量。那中文為什么不用空格呢?這可能是在權(quán)衡了詞切分付出的認(rèn)知努力和視覺(jué)加工效率兩個(gè)方面因素后,中文選擇了更經(jīng)濟(jì)的詞邊界標(biāo)記方式。在閱讀時(shí),一個(gè)注視點(diǎn)的視覺(jué)感知范圍有限,空格的插入會(huì)導(dǎo)致讀者在一個(gè)注視點(diǎn)上感知的字符變少,從而降低視覺(jué)感知效率。對(duì)中文而言,插入空格為詞切分帶來(lái)的效益不足以抵消它在視覺(jué)感知方面導(dǎo)致的代價(jià),因此中文不采用空格是更經(jīng)濟(jì)的。相對(duì)地,英語(yǔ)等字母書寫系統(tǒng)中空格提供的信息量較大,空格為詞切分帶來(lái)的效益遠(yuǎn)大于它在視覺(jué)感知方面導(dǎo)致的代價(jià)。由此可見(jiàn),雖然有的書寫系統(tǒng)采用空格標(biāo)記詞邊界,而另外一些書寫系統(tǒng)不明確標(biāo)記詞邊界,但都是為了實(shí)現(xiàn)閱讀的經(jīng)濟(jì)性而做出的選擇。
與該研究的假設(shè)一致,以往研究表明,改變?cè)~邊界的標(biāo)記方式對(duì)不同語(yǔ)言讀者的閱讀效率產(chǎn)生了不同影響。這些研究發(fā)現(xiàn),在空格信息量較大的書寫系統(tǒng)(如英語(yǔ))中去掉空格,閱讀速率大幅下降約50%;而在空格信息量較小的書寫系統(tǒng)(如中文),即使插入空格,閱讀速率也不會(huì)顯著提升(如圖3所示)。
圖3有詞間空格與無(wú)詞間空格的閱讀速率
從字母書寫系統(tǒng)的演化歷史來(lái)看,人們逐漸改革書寫系統(tǒng),以實(shí)現(xiàn)最經(jīng)濟(jì)的詞邊界標(biāo)記。歷史上,字母書寫系統(tǒng)并非始終使用空格標(biāo)記詞邊界。由于轉(zhuǎn)錄的口語(yǔ)中沒(méi)有詞邊界信息且書寫材料昂貴,早期書寫文本中沒(méi)有空格。讀者為了理解文本意義不得不出聲閱讀,導(dǎo)致閱讀效率較低。這一時(shí)期的書寫系統(tǒng)僅由少數(shù)抄寫員或傳教士使用。直到文藝復(fù)興時(shí)期,隨著大眾閱讀需求增加,這些書寫系統(tǒng)才逐漸加入詞間空格,提高了識(shí)字率和閱讀效率。由此可見(jiàn),字母語(yǔ)言中加入詞間空格這一書寫系統(tǒng)的變革逐漸適應(yīng)了人類的認(rèn)知需求,更符合經(jīng)濟(jì)性原則。
這一發(fā)現(xiàn)不僅有助于人們更好地理解跨語(yǔ)言普遍性與特異性的閱讀認(rèn)知機(jī)制,還可以為不同語(yǔ)言文本的排版和設(shè)計(jì)提供科學(xué)依據(jù)。
文章已在線發(fā)表于Annals of the New York Academy of Sciences。心理所助理研究員黃林潔瓊為第一作者,心理所李興珊研究員為通訊作者。該研究得到了國(guó)家自然科學(xué)基金面上項(xiàng)目(32371156)、中國(guó)博士后科學(xué)基金(2022M723362)、中國(guó)科學(xué)院心理研究所項(xiàng)目(E2CX6625CX)的支持。
論文信息:
Huang, L., Reichle, E. D., & Li, X. (2024/07/02).?Comparative Analyses of the Information Content of Letters, Characters, and Inter-Word Spaces Across Writing Systems.?Annals of the New York Academy of Sciences.?https://doi.org/10.1111/nyas.15178
相關(guān)論文:
Li, X., Huang, L., Yao, P., & Hy?n?, J. (2022). Universal and specific reading mechanisms across different writing systems.?Nature Reviews Psychology,?1(3), 133-144.? https://doi.org/10.1038/s44159-022-00022-6
附件下載: