文字
圖片
浙江大學(xué)“智慧古籍平臺(tái)”?!⊥τ辍z
浙江大學(xué)上線了“智慧古籍平臺(tái)”。據(jù)悉,該平臺(tái)的建設(shè)為讀者掃除古代文獻(xiàn)閱讀障礙,打造了古籍閱讀、整理和研究的新范式。
中華上下五千年的典籍,記錄著中華民族寶貴的文化密碼。浙江大學(xué)教授徐永明及其團(tuán)隊(duì)多年來(lái)致力于文史大數(shù)據(jù)結(jié)構(gòu)化和智慧化建設(shè)。
從2018年的“學(xué)術(shù)地圖發(fā)布平臺(tái)”到2020年的“智慧古籍平臺(tái)”,該團(tuán)隊(duì)通過(guò)一項(xiàng)項(xiàng)學(xué)術(shù)進(jìn)展,讓收藏在禁宮里的文物、書(shū)寫(xiě)在古籍里的文字“活起來(lái)”。
據(jù)介紹,“智慧古籍平臺(tái)”綜合運(yùn)用大數(shù)據(jù)的計(jì)量統(tǒng)計(jì)、定位查詢(xún)、聚類(lèi)查詢(xún)、空間分析、數(shù)據(jù)關(guān)聯(lián)等技術(shù),將中國(guó)古典文獻(xiàn)和研究成果圖譜化、智能化。
記者看到,只要點(diǎn)擊“智慧古籍平臺(tái)”首頁(yè)的“著述導(dǎo)覽”頁(yè)面,便可查閱著述的章節(jié)目錄、著述提要等基本信息及相關(guān)作者的世系圖、社會(huì)關(guān)系圖;點(diǎn)擊“篇目導(dǎo)覽”即可進(jìn)入文本閱讀界面。
為提高文本的準(zhǔn)確性,減少閱讀時(shí)頻繁查閱相關(guān)資料的工作量,該平臺(tái)還提供了古籍圖片與古籍?dāng)?shù)字化文本一一對(duì)應(yīng)的功能和關(guān)鍵字詞釋義功能。
如文本中的重要信息及疑難詞已按人名、地名、時(shí)間、典故等不同類(lèi)型以不同顏色顯示,點(diǎn)擊即可查看不同類(lèi)型的釋義。同時(shí),“智慧古籍平臺(tái)”與學(xué)術(shù)地圖發(fā)布平臺(tái)相連接,點(diǎn)擊“著者詳情”,即可查看所連接的人物行跡圖。
看似便利的閱讀體驗(yàn),離不開(kāi)前期的重重把關(guān)。據(jù)介紹,上傳到“智慧古籍平臺(tái)”的文獻(xiàn)資料將經(jīng)過(guò)OCR識(shí)別、機(jī)器標(biāo)點(diǎn)、人工校對(duì)、專(zhuān)家審核、機(jī)器標(biāo)引、標(biāo)引審核等程序,審核無(wú)誤后,才能在前臺(tái)發(fā)布。
OCR識(shí)別即“光學(xué)字符識(shí)別”技術(shù)。該技術(shù)能較為精確地識(shí)別版刻古籍,將圖像中的文字轉(zhuǎn)換成文本格式。同時(shí),憑借機(jī)器古籍標(biāo)點(diǎn)技術(shù),可在古籍文本上自動(dòng)標(biāo)注現(xiàn)代中文標(biāo)點(diǎn)符號(hào),兩者的準(zhǔn)確率都達(dá)90%以上。
在古籍整理上,該平臺(tái)利用眾包技術(shù),在中國(guó)乃至世界范圍內(nèi)遴選和組建專(zhuān)業(yè)團(tuán)隊(duì),突破團(tuán)隊(duì)人員數(shù)量和地域的限制,完成線上古籍整理。
該團(tuán)隊(duì)相關(guān)負(fù)責(zé)人表示,該平臺(tái)的建設(shè),將進(jìn)一步推進(jìn)古籍?dāng)?shù)據(jù)資源的整合和開(kāi)放共享,改變“數(shù)據(jù)在中國(guó),數(shù)據(jù)庫(kù)在國(guó)外”的局面,在為讀者掃除古代文獻(xiàn)閱讀障礙,推動(dòng)古籍閱讀普及化的同時(shí),激活學(xué)者的研究成果,突破學(xué)術(shù)圈的壁壘,將前沿的學(xué)術(shù)研究成果轉(zhuǎn)化為社會(huì)大眾共享的文化資源。
作者:童笑雨
資料來(lái)源:中國(guó)新聞網(wǎng)