首頁>人物·生活>集·言論集·言論

王曉光 陳 靜:數字人文打開文化新視野

2020年02月25日 15:02 | 作者:王曉光 陳 靜 | 來源:人民日報
分享到: 

作者:王曉光 陳 靜

計算機可以幫助學者在紛繁龐雜的信息中快速發現和定位議題,在宏觀的學科脈絡中把握關鍵問題;學者又可以發揮個人學養所長,深刻探究問題所在,解釋背后的義理與規律

新興數字技術正在加速數字中國的構建進程,以數字媒介和人工智能為基礎的新興文化形態和知識生產體系正日見雛形,數字人文正在積極引領文化時空的數字化轉換,并展現出廣闊的發展前景

數字人文是一種將計算機方法與技術融入人文研究,進而提出并回答人文問題的新范式。在傳統人文研究中,研究過程多表現為一種書齋式的、針對典籍文獻的細讀和考據。隨著計算機和電子文本的發展,研究者開始利用數據庫查找資料,并借助地理信息系統、機器學習、信息可視化等多種計算分析工具,開展認知計算、文本挖掘、情感分析、圖像識別、視覺分析、社會網絡分析、數字記憶構建等研究。在此過程中,一些新型研究方法,如遠讀、文本計量、文化分析等陸續浮現,并在文學、史學、文化研究等領域得到創新性應用。

為人文研究提供顯微鏡和望遠鏡

數字人文為人文研究開啟三種新維度,分別是快讀、遠讀、共讀。

快讀,指的是借助計算機技術,大大加快閱讀和利用文獻資料的速度。隨著圖書文獻的數字化轉換,高校、科研院所、圖書館等機構建設了大量數字資源。如果用傳統研究方式,以個人之力“窮盡”所有文獻資源,根本不可能。如何從海量數字資源中發現并獲取所需文獻,完成研究任務,這就需要元數據、關聯數據、知識圖譜等數字技術支撐研究者實現“快讀”的需求。比如《紅樓夢》中姓名稱謂有730多個,想要從70多萬字的文本中找到這些人名,需要花費大量時間。清華大學統計學研究中心團隊利用數據科學方法,在不到1分鐘的時間內,得到按照詞頻排列的各類詞,其中出現兩次以上的人名抓取準確率達93%以上。這極大縮短了研究者的搜索查詢時間,同時還減少了手工篩選過程中的失誤。再比如中國歷代人物傳記資料庫,共收錄超過42萬條人物傳記資料,記錄了各方面的詳細數據,這些數據可以為各領域的人物關系和歷史事件研究提供基礎數據支撐,檢索技術可以幫助研究者快速獲取所需數據。

遠讀具有兩重含義,第一重含義是指傳統的細讀方法導致大量文學作品從未被研究者閱讀,如果要理解整個世界文學體系,就必須采取遠讀方法,聚焦“比文本小很多或大很多的單位:手法、主題、修辭或文類和體系”。在該理論影響下,研究者開始運用計算方法研究文學作品。也有學者將社會網絡分析方法和信息可視化技術相結合,描繪小說的敘事結構、情節發展和人物關系。這些嘗試都為文學文本提供了一種新的解讀視角與研究路徑,凸顯了一種更為“宏大”的敘事邏輯。

遠讀的第二重含義是指時間跨度上較大或素材數量較多的研究,這在近年來數字文化遺產和數字博物館建設中體現得較為充分。在我國,敦煌研究院和上海博物館率先引入數字人文理念,并借助“數字敦煌”和“董其昌數字人文”書畫專題展覽,為文化遺產知識與數字資源的關聯性可視化呈現提供了示范。以“數字敦煌”為例,敦煌研究院在已經完成的敦煌石窟數字化基礎上進行敦煌知識圖譜建設,借助更細粒度的敦煌壁畫圖像語義標注,可以實現圖像片段的全球發布和鏈接,研究者和大眾在看到特定主題圖像的同時,也能看到全球其他博物館中相同主題的圖像片段。這為圖像學、考古學以及文化研究學者提供了巨大的“閱讀”便利,也為公眾親近人類豐富的歷史文化遺產提供了更多可能。

共讀則強調合作。盡管我們強調數字人文在人文研究方面的“快”與“遠”,但并不意味著數字人文就以機器閱讀代替了人工閱讀。數字人文強調人與機器的合作,遠讀與細讀的結合。計算機可以幫助學者在紛繁龐雜的信息中快速發現和定位議題,在宏觀的學科脈絡中把握關鍵問題;學者又可以發揮個人學養所長,深刻探究問題所在,解釋背后的義理與規律。比如有研究者在對中國近代“美”的觀念進行概念史研究時,借助大規模數據庫的文本資料,以一億兩千萬字的文本為研究范圍,對中國近代“美”觀念的發展軌跡進行遠讀式描繪,為傳統細讀研究提供了頗為有效的實證支撐。

除了人與機器的合作,共讀還意味著將多種閱讀模式結合,獲得全新知識圖景。其中值得關注的是電子文本與數字地圖相結合形成的時空交互閱讀框架。比如中南民族大學研究團隊就“唐宋詩人行旅路線”建立“唐宋文學編年地圖”,以地理信息系統為基礎架構,在數字地圖上呈現唐宋著名詩人詞人的行旅蹤跡,為讀者理解唐宋詩詞打開新視角。時空交互閱讀框架不僅以時空架構直觀展示時間、地點、人物、事件、作品間的網絡關系,還為深入解讀文本內涵提供可能。

此外,共讀還強調眾包協同。借助開放眾包技術,上海圖書館開發“中國家譜知識服務平臺”,允許用戶上傳和編輯自己家族的家譜。中華書局建立的古籍整理平臺,也采取眾包模式,組織高校學生、出版社編輯、圖書館館員等社會力量進行底本校對,日均工作量達100萬字,大大提升了古籍電子文本的審校速度。

引領文化時空數字化轉換

進入新世紀以來,以大數據、人工智能等為代表的新興數字技術正在加速數字中國的構建進程,以數字媒介和人工智能為基礎的新興文化形態和知識生產體系正日見雛形。作為新一代人文學者認知世界和傳播文化的路徑,數字人文正在積極引領文化時空的數字化轉換,并展現出廣闊的發展前景。

數字人文可成為推動人文學術創新的重要力量。與自然科學和社會科學相比,人文學者對數字技術的采納相對滯后,甚至有一定誤解。比如有人認為,“將文學當作數據會失去文學本身豐富的意蘊”,這種觀點是對數據功能與意義的誤讀。事實上,凡是計算機可以處理的電子文本都可稱為數據。隨著數字社會的發展,文本的主體形態早已轉換成計算思維下的數據,文學對“人本”和“文本”意義的追求并不會因其形態而改變,所以說文學與數據的關系是“道”與“器”的統一,而非對立。在利用新技術解決傳統人文問題的同時,數字人文也應更加關注新興人文議題,比如新聞推薦算法和人工智能模型的倫理約束等。數字人文在強調知識生產、表現、教學、傳播數字化轉型的同時,應更加積極對接開放科學行動框架,支持科研領域的開放獲取、開放數據、開放創新,并在學術活動中推動協同、眾包、互聯、交互、跨學科、跨國界、跨專業合作等學術理念的普及與范式創新。

數字人文可為優秀傳統文化傳承發揮積極作用。目前,數字人文正在引領文化生產體系的數字轉向,已經成為一個語言學、文學、史學、哲學、藝術學等傳統人文學科與圖書情報學、計算機科學、人工智能等信息科學共同關注的新興跨學科領域。數字人文不僅推動了大學與其傳統科研學科體系加速適應社會的數字化轉型,還在公共文化機構中推動了人文知識向更大范圍的公眾開放,使得普通人能夠更加便捷有效地學習傳承中華優秀傳統文化。敦煌研究院、上海圖書館、中華書局等單位推出的一系列數字人文項目和成果,在推動優秀傳統文化傳承和傳播方面具有很強的示范意義。

數字人文應致力促進科技與人文的互動與融合。過去幾年里,人工智能不僅是科技界熱點,同時也是人文研究及藝術界熱點。對人文學者來說,人工智能不僅是一種工具技術,也是一種人類文明活動的參與主體,由此帶來的文本生產問題、情感經驗問題以及審美問題等都是難以回避的新興人文學術課題。對于人工智能專家來說,人文思考和倫理關懷也是研究過程必須引入的維度。在此背景下,數字人文研究應以更加積極的姿態為科技與人文、機器與文藝互動融合提供試驗場和方向標,面向未來打開文化新視野。

(作者分別為武漢大學教授、南京大學副教授)

編輯:董雨吉

關鍵詞:人文 數字 研究 文化

更多

更多

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
人人狠狠久久亚洲区 | 综合国产精品一区二区三区 | 中文字幕HD天堂字幕乱码五月 | 亚洲国产2021乱码 | 一级欧美一级日韩片中文 | 日韩国产欧美一二三区 |