建設「歌仔冊語料庫」大家做陣來

 (稿6 -Soc) 2010.0927

一、大家來眠夢

歌仔冊正式進入教育體系:台師大歷史課教〈臺灣民主歌〉,中山大學中文所以〈新歌林投姊〉為研習課題,新竹教育大學以通過五十本歌仔冊選讀,為畢業條件;〈中部地震勸世歌〉列入建中「國語」教材,台東鹿野國小國語部編課本有〈戶蠅蚊仔大戰歌〉、〈百果大戰新歌〉等課。

─自幼稚園至大學,皆能以台語接受教育,一如香港廣東話之地位。

蔡英文在正式場合以台語發言,新竹縣長邱鏡淳以客語召開主管會議,台北市長郝龍斌以台語做市政報告,國軍部隊以台語出操唱軍歌,鴻海集團以台語開幹部會議。台語電視台正式成立,24小時以台語放送。

布袋戲、歌仔戲、皮猴戲、台語劇之創作能以台語文直接編寫,不必先以華語文記錄,再任由演員自行口譯台語;電視、電影字幕直接打上台文,無論電子工程師、厝交()仔、股票交易員、銀行員、百貨櫃台小姐、3C賣場、7eleven、超市,各行各業皆能以台文標示商品,以台語交易。

二、建設台語文

世界上無一國不擁有本身之語言文字,所以語言文字是立國之充分條件!。台灣百年來經歷兩次國語運動,一是改造台灣人為日本國民,所以推行日語;一是翻轉台灣人為中國人,所以必須消滅台語;國籍輪替,造成台灣有兩種外來國語文。台灣人本身有台灣國語,無台灣國文!

語言文字是台灣文化及文學之主體,是住民生活之總成,但台灣國語隨老人凋零而朝不保夕,台灣國文有過大規模實驗,但識者極少!

1.知識分子實驗

1920年代起,台灣人留日及留中知識分子,分別主張接納「殖民地語文」為台灣語文;1930起,黃石輝、郭秋生、李獻章、賴和等,提倡鄉土文學,主張以台灣話文「描寫台灣事物」引爆第一波鄉土文學論戰;時移境遷,八十年後之今日,論爭止息,大勢已定;然則局勢已至全然無法挽回之地步?不然!

基層社會早在1820年代,或更早,就發展出數種文字形式,以台灣百姓觀點,直接用庶民語言,如實紀錄當時社會百態,政經實情,積累一大批文化寶藏,其價值難以估計;善加利用,足以改變局勢!

歷代先民如何建立台語字?目前情況如何?散諸四方之台語字資料如何重拾匯整,公諸大眾,具體作法為何?身為台灣人如何促成建設台語文大業?只要大家支持,建設台語文之大工程,就可能進行,就是「小可事志」,而且短時間內就會大功告成!下文逐一說明:

2.庶民百姓實驗

相對於知識分子只說不做,民間百姓則是不管三七二十一,做了再說!早在16世紀就有以泉州話、潮州話紀錄之《荔鏡記》戲文(66,484字),其後1826(清道光六年) 歌仔冊問世,開啟一個新時代,庶民百姓之文化,得以口語形式,藉漢字紀錄流傳。

3.台語文字發展史簡介

台語早在1820年代或更早即開始發展專屬文字或標音字母,至今將近200年歷史。影響深遠者有三種:漢字,假名,羅馬字。假名雖有豐富文獻,但極難學,故隨日本敗降而式微,至今僅少數專家通曉。

羅馬字源自1832Walter Henry Medhurst(麥都思)出版第一本以英文式羅馬字標記之《福建方言字典》,之後經傳教士不斷改良,至1873年杜嘉德以全羅馬字出版《廈英大辭典》時,羅馬字已臻於完善。因羅馬字是音素字母,可充分、完全、精確紀錄台語,及如實顯示其次方言特色;任何音節,即使是感嘆詞、擬聲詞等皆能明白表記,絕無歧義!其功能遠非注音符號或漢字所可比擬,可以說是紀錄台語最理想之文字,可惜至今尚不能普及。

歌仔冊據現存文本,早於《福建方言字典》六年,1826年歌仔冊〈新傳台灣娘仔歌〉、〈新傳桃花過渡歌〉就已出版,歌名前冠「新傳」,可見早於1826年即有歌仔冊流傳,只是未能留傳至今而已。早期木刻版歌仔冊以台灣為書名,或以台灣敘事為主者為數不少,如上述兩本可見最早資料,更有〈新刊台灣陳辦歌〉、〈新刊台灣十八呵奇樣歌〉、〈新刊莫往台灣,女人三十六款歌〉、〈新刊台灣十二月想思歌〉等,可見歌仔冊一出世,即帶有台灣血統;與台灣淵源極深。前述歌仔冊全部或部分有可能是台灣創作,因當時台灣印刷有困難,乃寄託閩南出版。

歌仔冊紀錄台語雖不及羅馬字精確,但因以漢字紀錄,顯然較契合台灣人傳統用字習慣,又因其以庶民百姓為對象,當然具有社會性,所以廣為流通,歷時近200年,累積極其豐富、多元語料,其深度、廣度遠非常人所可想像!

三、歌仔冊特性及價值

現代台灣人普遍識字,所謂「識字」就是「識漢字」;而歌仔冊絕大多數以漢字書寫,極適合台灣現實文字環境。所異者,一般人慣習之漢字是「華語字」;歌仔冊之漢字是「台語字」,「華語字」不盡然是「口語字」;但台語字則必然是以口語為主,「循音得義」,念出來就知意思,即使部分「讀書字」也必須以漢文發音;歌仔冊自發於民間,文人譏其粗鄙無文,然則文人就更高明?

事實上文人不過熟讀「聖賢書」而已,關於如何以文字記錄口語,根本是外行!詳閱文本即可察覺:歌仔冊經長久發展,自有一套規範,實用性極佳,其用字遠勝廣東話文!

少年人以為歌仔冊難讀,其癥結在文字,其實不然;台灣人長者,平均識字不多,但念歌仔冊通暢無阻,少年人識字雖多,念起歌仔冊每每寸步難行,由此可證歌仔冊障礙主要在於語言,文字問題不大。

歌仔冊以漢字記述「台語字」,可徵資料有近200年,歷三個政權,約有3000文本,近千萬字,知名作家近百,不知名作家數百以上,內容涵蓋百姓生存所及之一切,舉凡文學、戲劇、音樂、天象、工藝、民俗、宗教、語言、歷史、時事、故事、傳說、地名、年中行事、各行各業、賭博、乃至樹木花草、鳥獸虫魚…等等,無所不包。是台灣現存之所有文字資料中,唯一以「語言形式」紀錄之『台灣文化百科全書庫』。

所以建設台語文,關鍵在歌仔冊!歌仔冊表記法雖不及羅馬字精確,但以台灣目前社會形勢,卻是台語書寫文字之唯一首選,捨此無他!

歌仔冊易學好用,粗通漢字者,若肯讀50本歌仔冊,就不難掌握台語用字基本法則,而羅馬字三個月即可通曉,只要充分利用龐大之「歌仔冊語料庫」,配合部分音標文字,如羅馬字,就足以成為正式之台語文字。

一旦語料庫建設完成,上述教育權,參政權,傳播權,經濟權皆可確保,因為「有語可言」,「有字可寫」,台語文將有充分條件與華語文競爭、合作,不致處於絕對劣勢,進一步奠定文學、文化主體性。

但必須放棄「雅俗對立」觀念,語言因語用而有雅俗,而文字本無雅俗之分,有約束,有社會性,自然會產生規範;就是正字!勿以中文觀念看台語字,不免驚見笑,請人人寫「白字」─白話字,大家鬥陣乎人笑!

四、歌仔冊庫藏

可惜多年來歌仔冊散佚四方,台灣公私庫藏得見者,僅有「台灣分館」、「中央研究院傅斯年圖書館」、「王順隆文庫」、「台大楊雲萍文庫」四處而已。其中公布電子文字檔案者有兩處:中研院860本,王順隆527本,扣除重複,得以利用者得千本上下;至於原本影印或掃描檔有:「台灣分館」之〈台灣俗曲集〉清刊木刻本23種,32();可供影印?台大圖書館有張秀蓉自英國攜回之微捲,「牛津Alexander Wylie文庫」清刊木刻19種,26(),可借閱?

「台大楊雲萍文庫」公布400本掃描檔案,分三等:典藏級Tiff檔(300 dpi)、電子商務級JPEG檔(300 dpi)與公共資訊級JPEG檔(72 dpi)各一份。典藏級不公開,電子商務級供販售,僅最後一種供自由取閱;另新文豐出版俗文學叢刊,影印「史語所」歌仔冊文本131本,四處合計,即使不扣重複,亦僅五百外本;上述資料不算少,但與歌仔冊總數比,亦不多。

五、為台灣文化點一葩光明燈

因深深體認歌仔冊對台語文之重要,所以個人早在1980年前後,陸續從台灣各地開始收集,其後利用作生理之便,在歐美各地探聽私人收藏家,「贖回」失散海內外各地多年之歌仔冊一大批,以此建立一個私人文庫;一頭整理,一頭研究。杜建坊台灣厝歌仔冊庫藏如何?以下略作說明:

台灣厝自藏不見於中研院及王順隆書目者有1199(含台語、客語,不計潮州話);中研院打字本計860本,王順隆打字527本,扣除兩者,打字部分,自藏本可補1852本。詳下略表:

杜建坊與王順隆、中研院藏書要略比較

    

 

杜藏

王順隆

中研院

總目

2700(不計潮州話)

1275(可能)

394種,552

打字目

2700(預計)

527

860

打字字數

202,6941(●、)

236,6353(●、)

清刊木刻本(含道光本)

道光版:1927年起,26本,其他清刊木刻本10本,計36本。

台圖2332()牛津1926()-7(重複)7()=3551(),其他3種誤引。

上海版

84(1894-1922)

31

19種。31

廈門版

278

173

42種,約160

手抄本

63(1911-)

廈門手抄14

按:台灣厝庫藏完全是真本,少數影印本不計入。

筆者人微力薄,2700本研究出版之日遙遙無期,為建設台灣話文之大局設想,願意完全公開。

六、如何公開?

先將2700本庫藏掃描建檔,再逐本打字,做成word檔,逐字校對,考量人力負擔,可能無法做多次校對,但至少亦應有二校;如果可能,三校更圓滿;目標是將錯字控制在0.1%,就是每千字僅可能有一個錯字。

word檔會有兩種,一是原字檔,就是完全按真本之刻印文字字體打字,不改錯字,亦不改變字形;另一是通行字檔,即是將真本文字改成目前社會通用之字如:「卩」改成「腳」;「镸」改做「頭」;原文檔打字極為費時費力,但非做不可,其意義有三:供研究字形及其演變,供文義推敲,供音義比對,避免個人主觀認定。

通行字檔純然基於方便閱讀,方便印刷,方便查索之考慮;另外再建立PDF檔,當word檔失真時,可供查照及比對。所以共將建立四個檔案:scanword1word2pdf

但「歌仔冊語料庫」不僅要建立台灣厝2700本庫藏,更要校正合併「王順隆歌仔冊文庫527本」、「中研院歌仔冊文庫860本」;「台大楊雲萍文庫400本」、補入「報章雜誌及專書之歌仔冊文本」,目標是;完成迄今最完整,最精詳可靠之語料庫,供各界利用,完成後,任何人皆不必央三託四,到處奔波索閱資料,試想:若非群策群力,任何個人短期內皆無法建立如此龐大之資料。

七、一世人憨(come)一擺

曾想利用公家資源進行,奈何理念不同,難以成事!

「歌仔冊語料庫」約略一千萬資金就可成事;對公部門而言,親像挽一支頭毛;對企業家而言,更是桌頂拈柑;換做慈濟功德會,可能三下兩吝半就款起來;但歌仔冊道友儘管心急,卻是目珠金金,人傷重;深恐如此重大之文化建設,就此嗚呼哀哉。

道友建議:何不邀集民間有志之士,眾人代一─鬥陣來建設?只要有33人願意承擔大柱,做大奇(),一世人憨(come)一擺,一半資金就可募集,初期事業就可展開;其餘或邀歌仔冊相關知音,或邀對建設台灣語文有志者,一點一注共同湊齊,就可成局!

「歌仔冊語料庫」之意義、價值,及其所能發揮之功能,普通人或許不甚了了,然則歌仔冊道友及先覺知之甚詳;至盼眾名士先覺跳出來讚聲,大力促成。成就自己,也成就台灣語文!

至於非研究者,亦請有志一同,就當做是去宮廟點一葩光明燈,所不同者,廟裡點燈庇佑一己或一家,為建設台灣語文點燈是庇佑台灣!出一點仔錢,別人就有機會打拼,完成建設台灣語文資料庫之重大工程,致蔭眾人;坐享其成總是不合理,不為大局想,請為自己想,不為自己想,請為大局想。是不是請大家潦落去!引出更多陳樹菊!

「歌仔冊語料庫」完成時間,暫時無法精確估算,但眾道友皆希望愈快愈好,若能成局,最好一年有粗胚,兩年至三年完成。雖說困難度極高,但會當做目標,全力以赴。

郵政劃撥帳號:06709248,戶名:林月英。

聯絡人:施炳華 E-mailbeings10@yahoo.com.tw  tel:06-2595381

        杜建坊 E-mailgetting.rich@msa.hinet.net

        蕭藤村 E-mailtai5gi2siau@xuite.net

 

本文共同執筆者及發起人:

杜建坊「歌仔冊語料庫」執行者 getting.rich@msa.hinet.net

蕭藤村 (中正大學兼任教師) tai5gi2siau <tai5gi2siau@xuite.net

張屏生 (中山大學教授) cps@ms5.url.com.tw

施炳華 (南台科技大學教授) beings10@yahoo.com.tw

呂興昌 (成功大學教授) lihc@mail.ncku.edu.tw

董忠司 (新竹教育大學教授) ctung36@yahoo.com.tw

曾子良 (大同大學教授) 曾子良<tltseng@ttu.edu.tw>

 

arrow
arrow
    全站熱搜

    taiuanbugikausu 發表在 痞客邦 留言(0) 人氣()