- 相關(guān)推薦
字頻視角的古文字“四書”分布發(fā)展研究
字頻視角的古文字“四書”分布發(fā)展研究
劉志基(華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心,上海200062)
[摘要]就整個(gè)文字系統(tǒng)的歷時(shí)演變來(lái)說(shuō),四書中呈直線變化且變化程度較為顯著的是象形和形聲,前者歷時(shí)減量,后者歷時(shí)增量,最終互換了在總字形數(shù)和總字頻中的主體位置,其字頻統(tǒng)計(jì)遠(yuǎn)低于字形統(tǒng)計(jì)的增減幅度,更加真實(shí)地顯示了文字結(jié)構(gòu)的發(fā)展速度。會(huì)意自西周金文較甲骨文有較大增長(zhǎng)后即在字形系統(tǒng)中占據(jù)相對(duì)穩(wěn)定的比重,同樣體現(xiàn)了正常發(fā)展軌跡。只有指事的比重發(fā)展缺乏規(guī)律,表現(xiàn)了結(jié)構(gòu)發(fā)展的某種復(fù)雜性.
[關(guān)鍵詞]字頻;古文字;四書[中圖分類號(hào)]H122[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1001-5442(2009)04-0054-10
字形表達(dá)文字本義的構(gòu)成方式,一直是文字學(xué)研究的基本問(wèn)題。自許慎首創(chuàng)“六書”體系以來(lái),歷代學(xué)者多有相關(guān)論說(shuō)。大體來(lái)說(shuō),古代學(xué)者多恪守“六書”總體框架,發(fā)展也就是在這個(gè)總框架的基礎(chǔ)上加以細(xì)化、完善而已。而現(xiàn)代學(xué)者每每試圖顛覆“六書”這個(gè)基礎(chǔ),總體來(lái)說(shuō),目前學(xué)界對(duì)結(jié)構(gòu)理論框架的新探討還沒(méi)有形成一個(gè)得到普遍贊同的定論,而許慎首創(chuàng)的“六書”理論雖然每每受到古今學(xué)者批評(píng),但明清學(xué)者在其基礎(chǔ)上形成的“四體二用”之說(shuō)迄今仍然得到較多的認(rèn)同。①值得注意的是,近年來(lái),人們開(kāi)始把漢字結(jié)構(gòu)研究落實(shí)到某一具體斷代的漢字中,注重各結(jié)構(gòu)類型字形的數(shù)量統(tǒng)計(jì),進(jìn)而揭示其總體結(jié)構(gòu)狀況。在這種研究中,先秦時(shí)段的出土古文字因其時(shí)代較早而得到了更多關(guān)注(具體述評(píng)詳見(jiàn)后文)。這無(wú)疑是一種更加務(wù)實(shí)的研究,基于這種研究的積累,漢字結(jié)構(gòu)理論框架的科學(xué)構(gòu)建或許可以獲得比較堅(jiān)實(shí)的基礎(chǔ)。然而,此類既有研究顯然還有進(jìn)一步的發(fā)展空間.
作為結(jié)構(gòu)研究對(duì)象的字形,可以有兩種存在形式,一種是靜態(tài)儲(chǔ)存性的,如字典所收的字目,其特征是所有字形一律只有一次露臉的機(jī)會(huì);一種是動(dòng)態(tài)使用性的,如文章、書籍用字,其特征為字形是按其出現(xiàn)次數(shù)重復(fù)計(jì)算的。既有相關(guān)古文字結(jié)構(gòu)的研究都是以前者為對(duì)象的(以下簡(jiǎn)稱為“字形角度研究”),而以后者為對(duì)象的探索(以下簡(jiǎn)稱為“字頻角度研究”②)迄今尚未有問(wèn)津者。毫無(wú)疑問(wèn),字形的上述兩種存在形式是有差別的:前者是經(jīng)人工整理才得以呈現(xiàn)的狀態(tài),后者則保留著文字原始的存在狀態(tài)。所以,至少對(duì)于揭示文字系統(tǒng)原生的結(jié)構(gòu)狀態(tài)而言,字頻角度的研究能夠呈現(xiàn)更加真實(shí)的信息。鑒此,本文將從字頻的角度,通過(guò)殷商、西周、戰(zhàn)國(guó)三個(gè)時(shí)段漢字的“四書”分布狀況的調(diào)查統(tǒng)計(jì)及相互比較,來(lái)描述先秦漢字結(jié)構(gòu)的發(fā)展,進(jìn)而嘗試揭示其中內(nèi)在規(guī)律.
在進(jìn)入正題的討論之前,有必要就如下幾個(gè)問(wèn)題作簡(jiǎn)要說(shuō)明:首先,僅僅調(diào)查分析“四書”,理由固然可見(jiàn)前文相關(guān)研究的評(píng)述。但在另一方面,作此種選擇,并不意味著我們認(rèn)為“四書”可以完全概括漢字結(jié)構(gòu)類型。事實(shí)上,無(wú)法納入“四書”框架的結(jié)構(gòu)類型已多被人們揭示,本文將視線的直接落點(diǎn)鎖定于“四書”,只是為了將研究限定在目前更具可行性的有限范圍內(nèi)。至于古文字其他結(jié)構(gòu)問(wèn)題的探討,并不視為本文的任務(wù).
其次,字頻視角的“四書”研究是需要一定條件的,這種大致上可以概括為技術(shù)的和學(xué)術(shù)的兩個(gè)方面。就技術(shù)而言,相關(guān)古文字材料必須得到數(shù)字化的處理,否則,以人工計(jì)數(shù)為基礎(chǔ)來(lái)完成字頻研究,僅僅存在理論上的可行性。就學(xué)術(shù)而言,則是被統(tǒng)計(jì)文本的用字正確和統(tǒng)一,能夠反映最新研究水平。客觀來(lái)說(shuō)由于字頻研究需要以巨大字量的文本為對(duì)象,而古文字材料一方面至今尚未得到電腦通用字符集的支持進(jìn)而導(dǎo)致數(shù)字化處理的諸多盲區(qū),另一方面又在考釋研究方面存在不少分歧甚至盲點(diǎn),要滿足這兩方面的條件絕非易事,憑借個(gè)人力量去完成相關(guān)工作更無(wú)可能。這也就是字頻角度結(jié)構(gòu)研究迄今尚為空白的重要原因所在。本世紀(jì)以來(lái),筆者先后主持了多個(gè)以古文字?jǐn)?shù)字化為內(nèi)容的研究課題,經(jīng)課題組近10年的不懈努力,才營(yíng)造了可以支持字頻研究的基礎(chǔ)平臺(tái)。作為該基礎(chǔ)平臺(tái)組成部分及本文數(shù)據(jù)來(lái)源的各古文字?jǐn)?shù)據(jù)庫(kù)均經(jīng)過(guò)如下幾個(gè)方面的加工處理:依據(jù)最新資料公布完成材料匯集;根據(jù)考釋研究的最新進(jìn)展完成釋文校訂;對(duì)釋文用字進(jìn)行符合數(shù)字化處理要求的統(tǒng)一整理,并對(duì)集外字逐個(gè)造字形成字體支持,進(jìn)而將經(jīng)過(guò)整理的釋文輸入數(shù)據(jù)庫(kù),實(shí)現(xiàn)其全文檢索功能;逐字進(jìn)行“四書”的標(biāo)注。因此本文的研究,得益于課題組團(tuán)隊(duì)的集體努力的支持,特此說(shuō)明.
第三,具體字形的“四書”判定是本文討論的基礎(chǔ),而“四書”類型判定的標(biāo)準(zhǔn)學(xué)界尚未取得完全一致,故有必要擇其容易形成分歧的若干問(wèn)題簡(jiǎn)單說(shuō)明如下:1,關(guān)于“象形”,本文依從象形均為獨(dú)體的觀點(diǎn),所謂“合體象形”,如段注所言“箕”者,本文視為形聲;“眉”者,其中之“目”視為依附性構(gòu)件,與眉的形象組成一個(gè)不可分割之獨(dú)體。2,關(guān)于“指事”,只認(rèn)定有抽象指示符號(hào)者,或單純由抽象指示符號(hào)組成,或由象形符號(hào)與抽象指示符號(hào)合成,抽象指示符號(hào)可以表示種種抽象意義,也可以標(biāo)志區(qū)別性,且兩種指事字均視為獨(dú)體。“乏”、“屰”之類借助象形符號(hào)變化表示本義者則視為象形。3,關(guān)于“會(huì)意”與“形聲”:前者為兩個(gè)或兩個(gè)以上單純表義或表形字符組合者;后者為兩個(gè)或兩個(gè)以上組合字符中有標(biāo)音功能者.
第四,字頻的研究,難免涉及海量的材料及驗(yàn)證數(shù)據(jù),由此而引發(fā)如下兩個(gè)問(wèn)題:其一,相對(duì)其他材料,古文字材料有著較多考釋未定或未有考釋者,故大范圍地引用材料,便也加大了引證失誤的幾率。我們的應(yīng)對(duì)方略是,在全面吸收學(xué)界最新研究成果的基礎(chǔ)上認(rèn)真審核材料,對(duì)尚無(wú)確釋的材料加以排除。事實(shí)上,在整個(gè)研究過(guò)程中,這項(xiàng)工作要占工作總量的絕大部分比重。即便如此也不能確保避免所有問(wèn)題,但對(duì)于系統(tǒng)材料提供的巨量數(shù)據(jù)而言,個(gè)別問(wèn)題不至于影響大局。其二,以傳統(tǒng)論文形式的紙張載體,一般是難以勝任承載驗(yàn)證研究結(jié)果的海量數(shù)據(jù)的,本文的應(yīng)對(duì)方略是,論文本身一般只給出最核心的材料數(shù)據(jù),而將相關(guān)驗(yàn)證材料掛在網(wǎng)上,作為本文的網(wǎng)絡(luò)附錄,供讀者查驗(yàn)。后文凡標(biāo)明“網(wǎng)絡(luò)附錄”者,均屬此類。①
一、殷商甲骨文“四書”分布及其初步分析
鑒于可行性要求,我們首先根據(jù)統(tǒng)計(jì)學(xué)的抽樣原則,限定了材料范圍,確定《小屯南地甲骨》[1](下文簡(jiǎn)稱《屯南》)和《花園莊東地甲骨》[2](下文簡(jiǎn)稱《花東》)卜辭為字頻統(tǒng)計(jì)的資料.
抽樣首先是為了限制材料的量,以便在目前條件下確保材料學(xué)術(shù)和技術(shù)加工的完成。當(dāng)然,這種數(shù)量限制是被控制在實(shí)現(xiàn)字頻研究目標(biāo)的可允許范圍內(nèi)的。根據(jù)統(tǒng)計(jì)學(xué)原理,在一個(gè)總體為250的例子中,“只要樣本量不是太小——通常為10或20就夠了,統(tǒng)計(jì)學(xué)理論表明這個(gè)分布近似于正態(tài)分布!盵3][p9]這也就是說(shuō),這兩種材料的58544的總字量,可以滿足100萬(wàn)以上字量文本的抽樣要求,而這個(gè)數(shù)字,已大大超過(guò)迄今所見(jiàn)已經(jīng)公布的卜辭材料中的字量。①其次,因?yàn)樾枰婕安煌瑫r(shí)段文字相關(guān)數(shù)據(jù)的比較,而甲骨文總字?jǐn)?shù)相對(duì)偏大,抽樣也是比較的對(duì)應(yīng)性所要求的.
當(dāng)然,由于材料存在殘泐模糊、屬于習(xí)刻,以及釋讀尚存在盲點(diǎn)的原因,我們并不能將所確定范圍內(nèi)所有文字毫無(wú)遺漏地進(jìn)行結(jié)構(gòu)分析。在確定的可作結(jié)構(gòu)分析字為范圍進(jìn)行統(tǒng)計(jì),得到如下數(shù)據(jù):被分析用字總數(shù)為43897,其中象形380個(gè)字形,總頻次31527;指事54個(gè)字形,字頻數(shù)合計(jì)5385;會(huì)意319個(gè)字形,字頻合計(jì)4516;形聲120字形,字頻合計(jì)2469。(甲骨文四書分布的字形及其出現(xiàn)頻次、各頻次具體出處詳見(jiàn)網(wǎng)絡(luò)附錄《小屯、花東用字結(jié)構(gòu)分析》)以上數(shù)據(jù)按字頻統(tǒng)計(jì),象形占總字頻數(shù)的71.82%,指事占總字頻數(shù)的12.27%,會(huì)意10.29%,形聲占總字頻數(shù)的5.62%.
字頻視角的“四書”分布觀察,雖然是一種全新的研究途徑,但其真正的認(rèn)識(shí)價(jià)值,卻是在與字形統(tǒng)計(jì)的同類研究結(jié)果相比較中才能得以實(shí)現(xiàn)的,而后一種統(tǒng)計(jì)并不乏既有研究.
2006年鄭振峰遵循王寧“漢字構(gòu)形學(xué)”理論,將甲骨文的構(gòu)形模式分為10種,[4][p41-44]這10種構(gòu)形模式實(shí)際可與“四書”對(duì)應(yīng),對(duì)應(yīng)后可以得到鄭書中關(guān)于甲骨文結(jié)構(gòu)的“四書”數(shù)據(jù):象形字為271個(gè),占字形總數(shù)27.51%,指事字46個(gè),占字形總數(shù)4.67%,會(huì)意字311個(gè),占字形總數(shù)31.57%,形聲字357個(gè),占字形總數(shù)36.17%。[5][p166]2007年陳婷珠以《新編甲骨文字形總表》為基礎(chǔ),增補(bǔ)《花園莊東地甲骨》等新材料,并注重吸取學(xué)界考釋研究最新成果,確定“甲骨文能進(jìn)行表詞結(jié)構(gòu)分析的單字字形總數(shù)共2134個(gè),占甲骨文單字的字形總數(shù)的35.84%。其中,象形字字形數(shù)為821個(gè),占甲骨文字能進(jìn)行表詞分析的部分的38.47%;指事字字形數(shù)為108個(gè),占5.06%;會(huì)意字字形數(shù)為875個(gè),占41%;形聲字字形數(shù)為330個(gè),占15.46%!盵5][p171]當(dāng)然,前文完成的甲骨文“四書”分布的頻率統(tǒng)計(jì),也同時(shí)完成了不重復(fù)字形層面的這種統(tǒng)計(jì),而其相關(guān)數(shù)據(jù)為:象形380字,占總字形數(shù)43.53%;指示54字,占總字形數(shù)6.19%;會(huì)意319字,占總字形數(shù)36.54%;形聲120字,占總字形數(shù)13.75%.
縱觀以上三種統(tǒng)計(jì)結(jié)果,不難發(fā)現(xiàn)本文的調(diào)查數(shù)據(jù)與陳書的統(tǒng)計(jì)結(jié)果比較接近,而與鄭書的統(tǒng)計(jì)結(jié)果距離稍大,這或許與鄭書的統(tǒng)計(jì)主要依據(jù)《甲骨文字典》這一相對(duì)陳舊的材料有關(guān)。而這種差距,如果相對(duì)字頻角度的“四書”分布統(tǒng)計(jì)結(jié)果來(lái)看,似乎也可忽略不計(jì)了.
從比較的對(duì)應(yīng)性考慮,我們就以同一種材料的兩種數(shù)據(jù)加以對(duì)比,而它們的差異之大頗為出人意表:象形和指事的比重有較大幅度的上升——前者從43.53%上升到71.82%,后者從6.19%上升到12.27%;而會(huì)意和形聲則有較大幅度的下降——前者從36.54%下降到10.29%,后者從13.75%下降到5.62%.
上述數(shù)據(jù)的變化,除了更加準(zhǔn)確地呈現(xiàn)了甲骨文各“書”文字投入使用后的真實(shí)比重外,還折射了一個(gè)極具認(rèn)識(shí)價(jià)值的漢字發(fā)展史信息:象形、指事字在甲骨文獻(xiàn)的動(dòng)態(tài)統(tǒng)計(jì)中的比重上升,意味著這兩種結(jié)構(gòu)的獨(dú)體字在甲骨文的常用字集中比其他兩書的合體字占據(jù)更高的比重,而文字單位之所以取得相對(duì)常用的地位是因?yàn)樗呛驼Z(yǔ)言中相對(duì)基本、常用的單位相對(duì)應(yīng)的。一個(gè)文字系統(tǒng)中較早產(chǎn)生的文字單位總是和語(yǔ)言中相對(duì)基本、常用的單位相對(duì)應(yīng)的,所以象形、指事字也就被證明為甲
【字頻視角的古文字“四書”分布發(fā)展研究】相關(guān)文章:
分布式水文模型的發(fā)展、現(xiàn)狀及前景12-01
《細(xì)菌和真菌的分布》教案03-09
《降水和降水的分布》教案02-25
轉(zhuǎn)化視角·生命的意義04-08
研究生個(gè)人發(fā)展計(jì)劃(通用8篇)09-09
鄉(xiāng)村體育發(fā)展問(wèn)題研究報(bào)告(通用10篇)10-26
山西小雜糧競(jìng)爭(zhēng)優(yōu)勢(shì)與產(chǎn)業(yè)發(fā)展研究論文11-25
傳統(tǒng)武術(shù)在高校發(fā)展的現(xiàn)狀及其對(duì)策研究論文11-28
國(guó)內(nèi)激光加工專利分布調(diào)研報(bào)告06-26
黃石市礦業(yè)遺跡分布及其類型04-12