節目討論區
01集 邁向顛峰
02集 憲法改造與公民社會
03集 選制改了,政治會變嗎?
04集 全球氣候變遷與台灣
05集 節約能源愛地球
06集 給點顏色瞧瞧
07集 文學的秘密花園:經典與詮釋
08集 從廢墟到王城
09集 傾聽古早女性的聲音
10集 殖民性 VS 反殖民性 - 台灣現代化雙重奏
11集 探索肝炎病毒的奧秘
12集 台灣生物資料庫
13集 肥胖基因大改造
14集 一粒米打造新世界:水稻基因研究
15集 人類與病毒的拉鋸戰: SARS 經驗
16集 人造螢光蠶:基因工程揭密
17集 消失的海岸線 : 鱟知鱟覺
18集 植物抗逆境研究:蕃茄抗寒實錄
19集 台灣南島語言的奧秘
20集 大地的脈動:台北盆地的隱形殺手
21集 永續經營的藍色寶盒 : 墾丁珊瑚礁生態
22集 顛覆古典物理學:奈米超能力
23集 舞動旋臂的星系
24集 奈米鑽石的另類價值
25集 彗星:太陽系的古老化石
26集 數位化漢字之美
   

第 26 集 數位化漢字之美

*播出時間: 2006 年 9 月 27 日〈週三晚間 10 點〉*

本集影片:數位化漢字之美

人類思想上的活動,大多數都要倚靠文字完成,文字不僅是表達意念、互相溝通的工具,也是傳承歷史文化的重要載體。中國人使用漢字的歷史已有數千年,在西方科技文明的衝擊下,始於圖像的漢字該如何與電腦計算機並存共容?則是當代科學家致力突破的課題。在這段磨合的陣痛期,中研院資訊所的科學家,不但建構漢字在電腦世界立足的知識體系,也發掘出自身與文化間密不可分的情感,而從資源共享的角度來看,他們努力的成果,也替未來中國文化的發揚,奠定良好的基礎。

本集來賓:

莊德明 中研院資訊科學研究所 研究助技師
陳昭容 中研院歷史語言研究所 研究員
亓婷婷 國立台灣師範大學國文系 副教授

座談大綱

莊德明:我們數位化的目的,主要就是要用電腦來處理中文,因為所有的資料進入電腦,都要轉換成數字,談到中文數位化,值得一提的是,在中央研究院在民國七十三年開始進行當時資料庫大概是 100MB , 100MB 現在不但可以很輕易的儲存在隨身碟,或者是光碟中,更可很快速的在網路上傳輸,更不用說我們可以在一秒之內,用檢索辭找到所有的它出現的段落,這是數位化的迷人之處,但是中文數位化也產生了一些問題,基本上還是字的問題,比如說缺字問題、中文字的排序問題、輸入問題,這也就是我們要建構「 漢字構形資料庫」的動機,希望透過「 漢字構形資料庫」,能增加電腦處理中文的能力……

議題二:「漢字構形資料庫」的推廣及應用價值

陳昭容:在電腦上面的缺字問題,我們現在很方便的利用這個「 漢字構形資料庫」,很容易就能夠把這個字貼到你的文章上面來,然後繼續寫你的論文,我覺得這只是個資料庫的工具性的一部分,這資料庫其實很重要的還有一點,它其實是一個研究型的資料庫,就是它把一個字,它從原始到怎麼樣發展,到怎麼樣演變,它從甲骨文的時代是怎樣,金人的時代是怎樣,小篆的時候變成什麼,它還有多少異體字,現在的牌體是怎麼樣的寫法,所以它就是把每一個字的歷史,從頭到尾做了一個清楚的表達,所以其實它也可以應用成一個研究型的知識庫,所以這一點對我們來講,我們很容易從這個資料庫裡面,找到它每一個字的淵源跟演變,那這樣子在教學上面,也是很方便的。我們隨時可以抓出一個金人的字型來告訴學生說,這個字在西周的時候,它的結構是怎麼樣,我們可以隨時抓出一個甲骨字,原型的字,來告訴學生說,你看甲骨的時候,它是怎麼的寫法,所以我覺得在教學上面,它的意義是非常廣的……

亓婷婷: 我們曉得學漢字,大家都有痛苦的經驗就是寫生字,一直在抄抄抄,抄一百遍,抄兩百遍,非常的可怕、很痛苦,而且這種經驗會造成以後對這個字的恐懼感,今天我們假如能夠好好利用這套資料庫的話,事實上我們可以把這個教學,變的很趣味化,而且便很活潑,最有趣就是我們可以變換字體,那現在的小孩子愛炫,對不對?常常喜歡把英文、日文,放在中文裡面,然後喜歡用他們自己的創意,我覺得這個字可以讓他們有一套,就等於說把字的學習,當成是一種有趣的遊戲,而老師們也可以跟他們一起玩,我想這一個可以分幾個層次,小學、中學、大學都可以的……

議題三:「漢字構形資料庫」當前工作及未來可能性

莊德明:簡體中文版的使用 漢字構形資料庫問題,應該是明年底可以解決,我可以為簡體中文版的,修改我們的系統,這個 漢字構形資料庫,我們的期待就是說

, 不僅是可以溝通兩岸文字,而且還可以溝通古今文字,那對整個漢字構形資料庫,其實是非常,其實漢字構形資料庫還算是我們的階段性的工作,我們真的想要做的是,文字學的數位化,像文字學的數位化,包含字型, 漢字構形資料庫目前是集中在字型,那這個文字學的數位化,除了字型,還要有字音、字義,它的意義也就是說一個字,它從甲骨文怎麼演變到現在,它型體上的變化、它讀音上的變化,還有它意義上的變化,這些都是我們要放在電腦裡面,這樣的架構才是完整的……