2020年9月2日 星期三

[筆記] 死人糟粕無盡藏

老早以前就有考慮把個人常用的典籍資料庫整理起來,但懶癌從沒好過。正好上週末與前途無量的小(?)朋友在聊死人糟粕,乾脆趁把簡介生出來──本文以收錄「漢字文化圈」典籍「書影」的資料庫為主,『漢籍電子文獻資料庫』或『Docusky數位人文學術研究平台』等偏向純文字而沒有或甚少底本的平臺從略,至於『中國哲學書電子化計劃』……那個是常識(?),跳過。

China-US Million Book Digital Library Project (CADAL) 
高等学校中英文图书数字化国际合作计划
北京大学浙江大学為主力的古籍藏書掃本,其中將近八成是四庫全書收錄書籍的掃本,『中國哲學書電子化計畫』所援用的底本多數來自於此。收錄文獻皆為黑白掃本,檔案size小,偶有不清晰或脫誤。系統上的分類標籤比較雜亂,也沒有目錄,因此只適合鎖定文獻以書名為關鍵字搜尋,不適合快速掃描單一分類有哪些文獻。 另外,本計畫檔案放置平台『Internet Archive』是類似古騰堡計劃的共享檔案平台,也有許多漢文古籍以外的資料;惟資料種類與檔案類型較為混亂無序。

Kanripo 漢籍リポジトリ
最早是一位日本博士生為了論文方便搞出來的個人用資料庫,二十餘年來逐漸協作者及協作計畫,從佛教文獻開始、道教文獻加入到四庫全書和四部叢刊。資料庫本身以「經、史、子、集、道、佛」六部惟分類,也可以依叢書查看目錄,檢索方便性極高;內容以矯正過的文字資料為主,但僅四庫系列以外的佛、道典籍書影較缺。在許多與『中國哲學書電子化計畫』重複的典籍上文字校正完成度和檢索便利度更高。

国立国会図書館デジタルコレクション
線上公開古籍約八萬筆,有NDC分類和出版年代標籤,介面一目了然,也有詳細出版資料,算是相當方便的典籍書影來源,雖然以和古籍為主。掃本高清彩色掃本,可以單頁輸出為jpg或多頁輸出為pdf,微不足道的小缺點是pdf單次輸出上限50頁,超過50頁的文獻需分段輸出後再自行用軟體合併。

早稲田大学図書館古典籍総合データベース
個人最初的古籍書影來源,以和漢古籍為主。跟CADAL一樣沒有典籍列表可看,只能以關鍵字去搜尋是否有目標內容。優點是典籍的出版資料登載詳盡,掃本高清彩色掃本,而且可以直接下載。咱最早是為了查華岡青洲的紫雲膏原文而順便找到的資料庫。

新日本古典籍総合データベース
国文学研究資料館(National Institute of Japanese Literature)建立、整合日本大多數學術單位的古典籍書目資料的搜尋引擎,會顯示某項資料收藏於何處,但多數為無圖像的純書目資料,僅少書影有公開的會直接顯示圖像,而且整合範圍並非真正完全無欠,因此個人甚少使用。

Digital collections of the Vietnamese Nôm Preservation Foundation
Vietnamese Nôm Preservation Foundation(暫譯:喃字遺產保護會)主持的「the Digitization Project of the Hán-Nôm Special Collection」計畫所建置的漢喃數位文獻資料庫,依照文獻來源分為Thư viện Quốc gia Việt Nam(National Library of Vietnam)Chùa Thắng Nghiêm(勝嚴寺)Chùa Phổ Nhân(普仁禪寺)三區,以宗教及傳統醫學書籍為主,也有一些宗教繪畫文物照片,個人當年是好奇《海上醫宗心領》的具體內容時google到的。優點是附帶典籍基本介紹,雖然是越南文;缺點是翻頁介面有可能翻不到書封和書底,要自己從網址列手動改成page/0或page/n+1、page/n+2之類才看得到。

Harvard-Yenching Library Collections
Harvard–Yenching Library(哈佛燕京圖書館)數位化的中文古籍收藏,基於介面就個人而言不甚親切,因此甚少使用,但藏書量應該沒話說,詳細操作請參考臺灣大學圖書館的介紹( http://tul.blog.ntu.edu.tw/archives/1417 )以及聯合資源網( https://www.lib.ntu.edu.tw/events/hy-ntu/ ),此略。

國家圖書館 - 古籍與特藏文獻資源
http://rbook.ncl.edu.tw/NCLSearch/ ) 類似『新日本古典籍総合データベース』,屬於集合複數收藏單位的綜合書目檢索系統,也同樣沒有書目只能用關鍵字檢索指定目標,估計是資料量過大的緣故。可以選擇是否限定有圖像,省得一筆一筆過濾,不過搜尋功能偶爾會當機。這個資料庫似乎是2016前後才上線的,因此十年來日本資源用習慣了,最近才知道這個資料庫,因此尚且少用及不熟悉。

臺灣華文電子書庫
這個也是國家圖書館的資料庫,涵蓋國圖及各大學圖書館之古籍及現代出版品電子書計三萬餘件,分類介面類似『国立国会図書館デジタルコレクション』可以按照類別或年代一覽。檔案品質高,但是讀取慢,而且雖然是pdf格式但不給輸出,因此個人少用。跟『國家圖書館 - 古籍與特藏文獻資源』同樣是2016前後才上線,之前是為了《清稗類鈔》的底本才用到,而且這筆《清稗類鈔》書影在『國家圖書館 - 古籍與特藏文獻資源』中找不到,難道是民國初年出版的所以不算古籍嗎?

World Digital Library 世界数字图书馆
聯合國教科文組織和世界32個公共團體合作建立、由美國國會圖書館主導開發的創用CC計劃成果網站,有7種語言介面,會依據IP自動跳轉語言(當然還是可以手動選),目前總共將近兩萬筆檔案,涵蓋全世界各國、種類也比較雜,因此漢文古籍分量不高,不會是個人查資料首選,比較適合休閒用途,不過畢竟是聯合國計畫,姑且提一下。

以上,大略前四個算個人常用網站,通常是找沒目標才向其他去翻,也有部分更適合休閒時隨興瀏覽。至於為什麼沒有韓國網站……嗯,因為咱不通韓文,也還沒意外google到過,如果有人熟悉那邊也歡迎跟咱介紹。

另外,本人雲端( https://drive.google.com/drive/folders/1MuA5lerju0YyE7UMOog07cqwJIFlFiKg )中其它來源的文獻、繪卷,則多半是仰賴google得自其它大學、地方圖書館或寺院的公開資源,倘一一列舉則稍嫌瑣碎,略。總之,作為野生的原典廚,最重要的技能就是google,所謂「信google,得永生」是也。

沒有留言:

張貼留言