首頁>書畫·現(xiàn)場>訊息訊息

“蒙古語語料庫”二期工程:填補互聯(lián)網(wǎng)上無蒙古文文獻空白

2018年11月26日 15:20 | 來源:中國新聞網(wǎng)
分享到: 

內(nèi)蒙古自治區(qū)社會科學(xué)院“蒙古語語料庫”首席專家巴特爾26日向中新網(wǎng)記者介紹,正在實施的“蒙古語語料庫”二期工程(簡稱二期工程)總字數(shù)將達到1.2億詞,目前已完成佛教重要典籍《甘珠爾經(jīng)》的錄入工作。其最大意義在于“填補互聯(lián)網(wǎng)上無蒙古文文獻的空白,最終能使蒙古學(xué)學(xué)者有文獻可用”。

巴特爾對記者透露,二期工程“文獻語料庫”是“掃描文件、電子文檔、拉丁文轉(zhuǎn)寫”三位一體的大型蒙古文文獻語料庫。

巴特爾表示,二期工程語料庫有三大特點:第一、窮盡式收集自蒙古文第一份文獻成吉思汗碑以及《蒙古秘史》等中世紀文獻,好中選優(yōu)《黃金史》《甘珠爾經(jīng)》《御制清文鑒》等木刻板文獻,均衡選錄社會科學(xué)、自然科學(xué)、報紙、政治、法律、文學(xué)、醫(yī)學(xué)、農(nóng)牧業(yè)、應(yīng)用、口語等10大類文獻;第二、遵循文獻學(xué)原則,即每份文獻提供原圖、錄入文件、拉丁文標音三種形式;第三、語料庫實現(xiàn)免費在線網(wǎng)絡(luò)查詢檢索。

巴特爾告訴記者,二期工程自2015年實施近三年來,截至目前已完成13世紀—16世紀中世紀文獻、17世紀—18世紀近代文獻(大部分)、19世紀現(xiàn)代文獻部分和20世紀—21世紀當代文獻部分,約完成8000萬字語料的錄入校對工作。

“蒙古語語料庫建設(shè)工程”是“一次規(guī)劃,多年實施”的中國首個蒙古語、達斡爾語、鄂溫克語、鄂倫春語大型綜合性語料庫。它涵蓋言語語料和文獻語料兩部分,總字數(shù)將達到2億詞。

2005年“蒙古語語料庫建設(shè)工程”確立為內(nèi)蒙古自治區(qū)民族文化大區(qū)建設(shè)重點項目,設(shè)計20年完成。一期工程言語語料庫(2005-2014)已于2014年11月驗收,二期工程文獻語料庫(2015-2024)正在實施。

巴特爾表示,一期工程言語語料庫(8000小時語料)旨在大規(guī)模搜集真實言語語料,重點在中國八省自治區(qū)、蒙古國四省一市、俄羅斯布里亞特共和國和卡爾梅克共和國境內(nèi)97個點采訪了6725人,搜集蒙古語、達斡爾語、鄂溫克語、鄂倫春語自然口語語料4192小時(相當于4000多萬詞)。它是已建成的世界上最大的蒙古語自然口語語料庫。同時還完成了4000多小時的書面語語料庫。兩項合計“蒙古語語料庫建設(shè)工程”一期工程共完成了8000多小時的言語語料。

在巴特爾看來,二期工程的實施,不僅對蒙古語等少數(shù)民族語言(文字)的規(guī)范化、信息化和內(nèi)蒙古語言生活的健康和諧發(fā)展,具有重要的理論意義,也對保護、傳承和開發(fā)、利用民族語言文化遺產(chǎn),維護中國語言文化安全具有重要的現(xiàn)實意義。(完)


編輯:楊嵐

關(guān)鍵詞:文獻 二期工程 語料庫

更多

更多

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
久久久免费精品视频 | 亚洲精品国产综合野狼 | 亚洲无线码在线高清 | 亚洲欧美精品久久久 | 日本高清无卡码一区二区久久 | 在线人成视频福利免费 |