首頁>收藏·鑒寶>資訊資訊
數字善本亟待抱團取暖
十幾年前,電子版《文淵閣四庫全書》《四部叢刊》等古籍數據庫問世,極大提升了古代文獻的檢索效率,給文史研究帶來了便利。近來,在北京大學、中國人民大學等大學圖書館的網站上,陸續出現了“中華經典古籍庫”的身影,其所收入的600多種、4億字古籍全部經過點校整理、正版授權,文史研究的學術生態因此又一次改變。隨著中華書局、巴蜀書社、鳳凰出版社、天津古籍出版社等古籍社相繼加盟該數據庫建設,國內古籍出版的業態也悄然發生著變化。
上海圖書館庫房 資料圖片
讀者在進行古籍數字產品體驗。資料圖片
呼喚數字善本
從前,說起古籍數據庫,學者總有些“放心不下”。學者只承認古籍數據庫是獲取文獻的重要輔助工具,但在論文、著作中征引文獻時,仍要使用點校本紙書,而絕少使用古籍數據庫的文本。如果有哪位學者大量征引古籍數據庫的文本,通常會被視為“不專業”。
“數字古籍產生問題的原因眾多,數字文獻選擇底本的不善,某些開發商因規避版權等原因,錄入文本與宣稱版本往往名不符實。數字文獻制作中因字形差異,校核不精等所產生錯字、缺字眾多,甚至錯行錯頁、脫行脫頁之例也屢見不鮮。”中國社會科學院歷史研究所研究員陳爽曾在一篇文章中指出,時下學者對數字古籍的質量要求遠不及印刷文本,將檢索而來的史料覆按原書,成為論文付梓前一道必不可少的工序。
根據陳爽的經驗,即使是文本錄入準確率很高的臺灣“漢籍資料庫”,也存在一些瑕疵。比如,在這個數據庫中,《太平御覽》等古籍中所有“鹽”“劍”的異體字都被當作無法顯示、檢索的生僻字,做成了圖片格式,看似忠實原書,實際上造成了檢索的困難。陳爽說:“這對于古代經濟史料和軍事史料的搜集將是災難性的。”
在文史學界,像陳爽一樣對各種古籍數據庫的優勢、劣勢了然于胸的畢竟是少數,而且這些經驗需要花費大量時間不斷積累。這使得本應成為學術研究“利器”的古籍數據庫,無法發揮出其應有的作用。有學者提出了“數字善本”的概念,希望古籍數據庫從過去的貪大、貪全,轉變為求精、求準。
在“中華經典古籍庫”的出版方、古聯(北京)數字傳媒科技有限公司總經理顧青看來,在“數字善本”求精、求準的基礎上,還應該充分體現當代古籍整理的成果。他認為,以往的古籍數據庫主要是將古籍的文字進行數字化,方便了檢索,即使文本準確,這些數字化了的古籍沒有標點,而且保留著古書在流傳中出現的種種錯誤,不適合一般讀者使用,專業學者也沒辦法引用,將當代學者整理的點校本古籍進行數字化,是未來古籍數字化發展的大趨勢。但當代古籍整理的點校本涉及復雜的版權歸屬以及學術質量評價等問題,做起來并不容易。
顧青介紹,雖然困難不少,但“中華經典古籍庫”所收圖書均為整理本古籍,包含二十四史、新編諸子集成、清人十三經注疏、史料筆記叢刊、古典文學基本叢書等,今后還將不斷增加文獻數據量,將全國各大古籍出版社的優秀整理本進行數字化。
古籍出版,也需融合發展
據統計,新中國成立以來已整理出版2萬多種古籍,其中版權清晰、整理質量較高的5000種,體量達50億字。然而,這些點校本的版權分散在全國幾十家古籍出版社和眾多大學出版社、社科出版社,如果各出版社單打獨斗,就會出現數十個小型古籍數據庫,難以形成規模優勢。如果“抱團取暖”,把這些古籍整理成果集納到一起,海量經過整理、篩選的“數字善本”,將成為文史研究的重要文獻資源。
“在傳統出版年代,各古籍出版社圍繞國家規劃,團結合作,平等互利,我們特別希望,在數字出版階段大家也能形成這樣一種合力,否則我們的資源優勢會逐步喪失。”中華書局總經理徐俊認為,對于古籍整理出版這樣的專業出版形態,資源的橫向聚合十分重要。
目前,除了中華書局、巴蜀書社、鳳凰出版社、華東師大出版社、天津古籍出版社,同屬“全國古籍出版社聯合會”成員的齊魯書社、遼海出版社也有意加入“中華經典古籍庫”。顧青希望,2016年“中華經典古籍庫”的數據規模能達10億字。
在服務大學、科研院所等機構用戶的同時,供個人使用的在線版、手機版“中華經典古籍庫”也正在研發之中,一般的傳統文化愛好者也將有機會使用權威數據庫認識傳統文化。在顧青心中,未來的“中華經典古籍庫”不僅僅是一個古籍數據庫,而且是一個學者可以發表學術觀點、交流學術心得,出版社可以進行版權貿易的融合出版平臺,這將成為媒體融合時代古籍出版社轉型的重要嘗試。(本報記者 杜 羽)
編輯:邢賀揚
關鍵詞:數字善本 古籍數據庫 中華經典古籍庫 古籍出版