時間:2023-03-31 14:44:17
序論:好文章的創(chuàng)作是一個不斷探索和完善的過程,我們?yōu)槟扑]一篇大數(shù)據(jù)時代檔案數(shù)據(jù)共享探析范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來更深刻的閱讀感受。
利用服務(wù)是檔案工作的目標和宗旨。共享利用強調(diào)共同享有、發(fā)揮效用,是實現(xiàn)檔案數(shù)據(jù)價值、釋放檔案數(shù)據(jù)能量的關(guān)鍵方式,也是檔案數(shù)據(jù)治理的重要環(huán)節(jié)。面對大數(shù)據(jù)時代社會公眾日益便捷化、高效化、知識化、多樣化的檔案信息和檔案文化需求,需要借助大數(shù)據(jù)、人工智能、知識發(fā)現(xiàn)、虛擬現(xiàn)實、數(shù)字人文等現(xiàn)代信息技術(shù),探索新時期檔案數(shù)據(jù)公共服務(wù)轉(zhuǎn)型路徑,創(chuàng)新檔案數(shù)據(jù)開發(fā)利用方式,促進檔案數(shù)據(jù)資源的開放共享、深度開發(fā)及有效利用,構(gòu)建精細、精簡、精準、智慧的檔案數(shù)據(jù)公共服務(wù)體系,推動檔案數(shù)據(jù)服務(wù)的智能化、社會化、個性化,把“資源庫”變成“知識庫”“思想庫”“智庫”【1】。檔案數(shù)據(jù)共享利用是指充分利用現(xiàn)代信息技術(shù)和管理手段,注重多主體協(xié)同聯(lián)動,強化檔案數(shù)據(jù)資源建設(shè),實現(xiàn)檔案數(shù)據(jù)資源共建共享與互聯(lián)互通。其中,各類現(xiàn)代信息技術(shù)是支撐,多主體協(xié)同聯(lián)動是方式,檔案數(shù)據(jù)資源建設(shè)是關(guān)鍵,檔案數(shù)據(jù)資源共建共享與互聯(lián)互通是目標。
1檔案信息開發(fā)利用與檔案數(shù)據(jù)共享利用辨析
1.1從內(nèi)涵上看
檔案信息是由檔案中的文字、數(shù)據(jù)、圖表、符號、信號等形式和內(nèi)容所構(gòu)成檔案的內(nèi)容就是信息,檔案信息的構(gòu)成就是檔案所記載的各種事物的狀態(tài)及表征【2】。數(shù)據(jù)是記錄信息的物理符號,是表達和傳遞信息的工具【3】,數(shù)據(jù)被稱為信息的原材料,而信息被稱為在上下文語境中的數(shù)據(jù)【4】。檔案數(shù)據(jù)屬于數(shù)據(jù),具有數(shù)據(jù)的一般屬性。檔案數(shù)據(jù)是客觀事物的原始記錄“符號”,檔案信息則是檔案數(shù)據(jù)加工后的產(chǎn)物,具有傳達檔案內(nèi)容信息和形式信息的功能,檔案數(shù)據(jù)是檔案信息的基本構(gòu)成元素。這里的“加工”并非指改變檔案信息原始記錄性的人為處理,而是指運用技術(shù)或人工手段,將數(shù)據(jù)輔以背景信息等描述,使之可被理解。檔案信息資源開發(fā)利用是對已知檔案信息資源進行有意識組織、加工的活動和過程,著重于檔案信息資源的編纂編研、展示傳播,缺少深層次關(guān)聯(lián)和細粒度挖掘,屬于淺表化開發(fā)。檔案數(shù)據(jù)共享利用則注重數(shù)據(jù)的開放性、流動性、關(guān)聯(lián)性、精準性,強調(diào)運用知識發(fā)現(xiàn)、數(shù)據(jù)挖掘、數(shù)據(jù)計算、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)字人文等技術(shù)方法對細粒度數(shù)據(jù)進行識別處理、深度開發(fā),在知識關(guān)聯(lián)的基礎(chǔ)上充分釋放檔案數(shù)據(jù)價值【5】。
1.2從方式上看
在開發(fā)層次上,檔案信息開發(fā)利用通常是淺表式開發(fā)利用,主要通過陳列展覽、編纂出版、網(wǎng)上展示等方式提供利用,注重檔案信息顯性價值的開發(fā)。大數(shù)據(jù)時代,檔案數(shù)據(jù)共享利用追求深層次開發(fā),主要采用新技術(shù)、新方法、新手段,在匯聚融合多種格式、多種類型、多種結(jié)構(gòu)檔案數(shù)據(jù)的基礎(chǔ)上,追求檔案信息服務(wù)的精益化、知識化、智慧化,充分挖掘檔案數(shù)據(jù)價值潛能,注重檔案數(shù)據(jù)隱性價值和顯性價值的全面開發(fā)。有利于挖掘發(fā)現(xiàn)檔案數(shù)據(jù)中的隱性知識,使檔案信息服務(wù)內(nèi)容從表層向深層拓展,實現(xiàn)檔案數(shù)據(jù)資源的潛在價值,提高檔案信息服務(wù)深度和質(zhì)量【6】。在開發(fā)手段上,檔案信息開發(fā)利用主要基于人工操作和自動化技術(shù)開展利用,開發(fā)能力有限,服務(wù)效率較低。檔案數(shù)據(jù)共享利用采用大數(shù)據(jù)、云計算、人工智能、數(shù)字人文、虛擬現(xiàn)實、區(qū)塊鏈等新一代信息技術(shù)對多元化檔案數(shù)據(jù)資源進行整合、感知、挖掘、計算、關(guān)聯(lián)、可視化,建立檔案數(shù)據(jù)共享利用平臺,實現(xiàn)檔案數(shù)據(jù)開發(fā)手段智能化。如河南省數(shù)字檔案館建成基于自然語言處理技術(shù)的智能檢索系統(tǒng),對館藏檔案數(shù)據(jù)資源深度挖掘,將關(guān)聯(lián)信息準確有效地從大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中挖掘出來,進行匯總、統(tǒng)計、分析,并關(guān)聯(lián)形成知識圖譜,進而形成檔案知識庫【7】。
1.3從效果上看
檔案信息開發(fā)利用面向館藏實體檔案、數(shù)字檔案等檔案信息資源,通過傳統(tǒng)加工手段和計算機處理技術(shù),形成成果匯編、專題展覽、電子文獻等開發(fā)利用產(chǎn)品。檔案信息開發(fā)利用主要以館藏為中心,屬于“供給導(dǎo)向”服務(wù)模式,處于“等客上門”“你查我調(diào)”的被動式服務(wù)狀態(tài)。這種服務(wù)模式制約了檔案信息開發(fā)利用的范圍和水平,社會利用意愿不強烈、利用效果有限,不利于檔案工作社會影響力和社會生態(tài)位的提升。檔案數(shù)據(jù)共享利用秉持“用戶為中心”的服務(wù)理念,追求的效果是實現(xiàn)檔案數(shù)據(jù)的增值化和知識化。通過語義理解、知識發(fā)現(xiàn)、全景或3D建模等新技術(shù)新手段,依托檔案數(shù)據(jù)共享利用平臺,深入挖掘展示檔案數(shù)據(jù)的深層次價值,知識增值能力顯著增強,為用戶帶來便捷的檔案信息服務(wù)。檔案數(shù)據(jù)共享利用可根據(jù)用戶的歷史行為軌跡和檢索檔案內(nèi)容,進行統(tǒng)計、挖掘、分析,系統(tǒng)掌握用戶信息需求,定制個性化的服務(wù)方案,主動推送相關(guān)檔案信息,達到“投其所好”的服務(wù)效果,進一步提升用戶體驗感,使檔案信息服務(wù)由靜態(tài)轉(zhuǎn)向動態(tài),由被動轉(zhuǎn)向主動,由普適轉(zhuǎn)向個性,由滯后轉(zhuǎn)向超前。以實時數(shù)據(jù)為支撐,做到一切盡在掌握,基于數(shù)據(jù)分析結(jié)果,采取更為精細化的服務(wù)方式,全方位滿足用戶多樣化、差異化的檔案信息需求【6】。綜上,檔案數(shù)據(jù)共享利用是在檔案信息開發(fā)利用基礎(chǔ)上,依托新一代信息技術(shù),深度挖掘檔案數(shù)據(jù)價值,實現(xiàn)檔案數(shù)據(jù)融合互聯(lián),提供檔案數(shù)據(jù)化服務(wù)。根據(jù)檔案數(shù)據(jù)生命周期理論,檔案數(shù)據(jù)價值決定著檔案數(shù)據(jù)生命周期的長度,通過深度開發(fā)、知識激活、價值增值,有助于延長檔案數(shù)據(jù)生命周期。檔案數(shù)據(jù)共享利用不僅有助于數(shù)據(jù)資源的互聯(lián)互通、集成匯聚,而且有助于推動以用戶需求為導(dǎo)向的服務(wù)模式轉(zhuǎn)型,有助于突破當(dāng)前檔案資源開發(fā)瓶頸,實現(xiàn)從“載體開發(fā)”到“內(nèi)容開發(fā)”的轉(zhuǎn)變,進而推動檔案管理和服務(wù)模式創(chuàng)新。
2檔案數(shù)據(jù)共享利用現(xiàn)實阻礙
當(dāng)前,檔案數(shù)據(jù)共享利用面臨觀念障礙、制度缺陷、技術(shù)瓶頸和人才短板等諸多困境,數(shù)據(jù)污染、數(shù)據(jù)異構(gòu)、數(shù)據(jù)冗余、數(shù)據(jù)安全、數(shù)據(jù)孤島等問題普遍存在,給檔案數(shù)據(jù)資源服務(wù)創(chuàng)新、開放共享、安全利用等帶來巨大挑戰(zhàn)。
2.1法規(guī)標準缺失
法律是治國之重器,良法是善治之前提。《中華人民共和國檔案法》《各級國家檔案館開放檔案辦法》等法規(guī)為檔案開放利用提供保障。但檔案數(shù)據(jù)屬于新生事物,關(guān)于檔案數(shù)據(jù)共享利用的針對性法規(guī)政策尚未建立,尤其是微觀層面數(shù)據(jù)共享技術(shù)、數(shù)據(jù)生成質(zhì)量、數(shù)據(jù)存儲格式、數(shù)據(jù)平臺架構(gòu)等具體標準規(guī)范缺失。隨著大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,檔案數(shù)據(jù)來源除了館藏檔案數(shù)據(jù)化外,業(yè)務(wù)活動生成的檔案數(shù)據(jù)呈爆發(fā)式增長。據(jù)統(tǒng)計,2020年底,全國3341個國家綜合檔案館的檔案數(shù)據(jù)已經(jīng)達到了21479T【8】。與此同時,數(shù)據(jù)來源多方、數(shù)據(jù)格式多樣、數(shù)據(jù)結(jié)構(gòu)多元、數(shù)據(jù)類型多種,對檔案數(shù)據(jù)整合存儲、共建共享、服務(wù)利用帶來諸多困難,需要構(gòu)建完善的檔案數(shù)據(jù)共享利用法規(guī)標準框架。為此,一方面,要關(guān)注檔案數(shù)據(jù)開放范圍、共享機制、利用規(guī)則等規(guī)范制定;另一方面,要關(guān)注檔案數(shù)據(jù)質(zhì)量、檔案數(shù)據(jù)格式、檔案數(shù)據(jù)共享平臺等標準建設(shè)。此外,還需關(guān)注檔案數(shù)據(jù)國際流動、檔案數(shù)據(jù)整合交換、檔案數(shù)據(jù)倫理保護與安全保障等相關(guān)政策法規(guī)的制定。
2.2管理體制機制制約
檔案管理體制是指在某系統(tǒng)內(nèi)部圍繞權(quán)力的劃分和運行而形成的一種制度化的關(guān)系模式【9】。在檔案事業(yè)“統(tǒng)一領(lǐng)導(dǎo)、分級管理”原則指導(dǎo)下,我國檔案事業(yè)呈現(xiàn)出“條塊分割”的特征。“條塊分割”的檔案管理體制符合我國疆域遼闊、行政區(qū)域?qū)蛹壒芾淼默F(xiàn)實國情,但也造成了不同區(qū)域檔案信息資源之間的隔閡,同屬于黨和國家的檔案因為各自為政,互不往來,造成了信息難以被整合,其利用的效能也無法最大化;而由于過多地強調(diào)了‘條’的從屬關(guān)系,許多行政管理機關(guān)從“塊”的管理中剝離出來,直接從屬于上級政府部門領(lǐng)導(dǎo)【10】,阻礙了各區(qū)域、各檔案館的檔案數(shù)據(jù)互聯(lián)互通和共享利用。此外,各行業(yè)、各部門、各類檔案管理系統(tǒng)分散保存檔案數(shù)據(jù),政務(wù)檔案數(shù)據(jù)和社會檔案數(shù)據(jù)由于數(shù)據(jù)主體性質(zhì)不同、利益不同,缺乏科學(xué)合理的協(xié)作機制,導(dǎo)致檔案數(shù)據(jù)管理各自為政,各行業(yè)檔案數(shù)據(jù)資源相互獨立、互不相通,無法真正實現(xiàn)全社會層面的檔案數(shù)據(jù)資源共享利用。如醫(yī)療系統(tǒng)、交通系統(tǒng)、金融系統(tǒng)、稅務(wù)系統(tǒng)、公安系統(tǒng)、民政系統(tǒng)等,各自保管自行產(chǎn)生的檔案數(shù)據(jù),缺乏跨系統(tǒng)跨部門跨行業(yè)的檔案數(shù)據(jù)共享利用平臺,難以實現(xiàn)檔案數(shù)據(jù)的互聯(lián)互通和共建共享。從檔案管理體制機制來看,管理體制條塊分割,管理機制對接不暢,管理系統(tǒng)煙囪林立、重復(fù)建設(shè)等問題明顯,跨區(qū)域、跨部門、跨層級、跨系統(tǒng)統(tǒng)籌協(xié)調(diào)難度大,難以形成整體合力,使得檔案數(shù)據(jù)無法融合互通,阻礙共享利用的實現(xiàn)。
2.3數(shù)據(jù)技術(shù)能力薄弱
技術(shù)是檔案數(shù)據(jù)共享利用的基礎(chǔ)支撐,當(dāng)前檔案數(shù)據(jù)共享利用的技術(shù)應(yīng)用能力相對薄弱,主要體現(xiàn)在:一是檔案數(shù)據(jù)共享利用平臺欠缺。共享利用平臺是檔案部門向社會提供檔案數(shù)據(jù)服務(wù)的重要窗口,是展現(xiàn)檔案部門服務(wù)成效的關(guān)鍵場域。當(dāng)前,我國各省市縣綜合檔案館大多建設(shè)了官方網(wǎng)站和微信公眾號平臺,微博、客戶端等平臺建設(shè)也越發(fā)普遍,各類平臺主要提供館藏目錄查詢、專題展覽、成果展示、業(yè)界資訊、業(yè)務(wù)動態(tài)等服務(wù),從平臺功能、服務(wù)類型、資源范圍來看普遍處于淺層次利用。缺乏統(tǒng)一的檔案數(shù)據(jù)共享利用平臺,集成整合各類檔案數(shù)據(jù)資源,實現(xiàn)一站式檔案信息服務(wù),需要構(gòu)建功能完備、運維高效、安全實用的檔案數(shù)據(jù)共享利用平臺。二是檔案數(shù)據(jù)開發(fā)利用技術(shù)不足。新一代信息技術(shù)是實現(xiàn)檔案數(shù)據(jù)共享利用、互聯(lián)互通的重要工具,但限于觀念保守、經(jīng)費投入不足、數(shù)據(jù)管理人員欠缺、技術(shù)風(fēng)險以及地區(qū)經(jīng)濟社會發(fā)展不平衡等因素制約,檔案部門數(shù)據(jù)開發(fā)利用技術(shù)應(yīng)用不充分、不普遍、不深入、不均衡等問題突出,東中西部區(qū)域差距明顯,檔案工作與新興技術(shù)融合參差不齊,整體水平較低。同時,由于技術(shù)能力有限,檔案數(shù)據(jù)資源深層次開發(fā)與高效化利用不足,檔案數(shù)據(jù)知識化、智慧化服務(wù)能力不強,制約檔案數(shù)據(jù)價值發(fā)揮與潛能釋放。三是檔案數(shù)據(jù)管理專業(yè)技術(shù)人才匱乏。隨著檔案數(shù)據(jù)急劇增長,檔案數(shù)據(jù)共享利用的廣度和深度不斷拓展,檔案數(shù)據(jù)應(yīng)用場景更加廣泛,迫切需要檔案數(shù)據(jù)管理專業(yè)人才。當(dāng)前,檔案部門中數(shù)據(jù)管理、數(shù)據(jù)計算、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)開發(fā)等技術(shù)人才十分匱乏,尤其缺乏兼具數(shù)據(jù)管理技術(shù)與檔案管理經(jīng)驗的復(fù)合型人才,隊伍整體的數(shù)據(jù)處理技能和數(shù)據(jù)知識素養(yǎng)亟待提升。
2.4數(shù)據(jù)資源問題突出
一是數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量是檔案數(shù)據(jù)科學(xué)管理、有效開發(fā)的前提。檔案數(shù)據(jù)質(zhì)量受到技術(shù)因素以及非技術(shù)因素的影響,當(dāng)前檔案數(shù)據(jù)質(zhì)量標準體系尚未建立,未實現(xiàn)對檔案數(shù)據(jù)質(zhì)量的全方位、全流程控制。首先,檔案數(shù)據(jù)的真實性、完整性、可讀性、安全性等難以保障【11】。檔案數(shù)據(jù)采集獲取主要以業(yè)務(wù)部門移交和館藏檔案數(shù)據(jù)化為主,對各平臺系統(tǒng)和網(wǎng)絡(luò)中產(chǎn)生的檔案數(shù)據(jù)采集缺少“四性”檢測標準與質(zhì)量管控技術(shù),難以保障來源廣泛、類型多樣數(shù)據(jù)資源的安全完整與真實有效。如全國民國檔案資料目錄中心組織專家對30個省市報送的2016年、2017年計3000余萬條民國檔案文件級目錄數(shù)據(jù)進行驗收審核后發(fā)現(xiàn)每個著錄項都存在不規(guī)范問題。如著錄項著錄錯位、文種錯誤、偽政權(quán)和解放后政權(quán)沒做政權(quán)標識、頁數(shù)與頁碼不相符、時間標識錯誤等【12】。其次,檔案數(shù)據(jù)格式標準不統(tǒng)一。檔案數(shù)據(jù)來源廣泛、內(nèi)容復(fù)雜、類型多樣,大多是非(半)結(jié)構(gòu)化檔案數(shù)據(jù)。檔案數(shù)據(jù)存儲和管理系統(tǒng)各不相同,處理手段和技術(shù)存在差異,缺乏統(tǒng)一標準規(guī)范,導(dǎo)致檔案數(shù)據(jù)異構(gòu)現(xiàn)象嚴重,無法保證檔案數(shù)據(jù)質(zhì)量,嚴重影響檔案數(shù)據(jù)共享利用和互聯(lián)互通【13】。再次,檔案數(shù)據(jù)的實時性影響共享利用成效。實時性是檔案數(shù)據(jù)的基本特征之一,失時的檔案數(shù)據(jù)其價值將大打折扣,為此對檔案數(shù)據(jù)處理速度提出更高要求,如果數(shù)據(jù)處理不及時,有些變化速度快的數(shù)據(jù)就失去了其最有價值的階段【14】。二是數(shù)據(jù)孤島。“數(shù)據(jù)孤島”是制度、技術(shù)等多重因素共同作用的結(jié)果【15】,致使檔案系統(tǒng)、檔案部門之間數(shù)據(jù)孤島林立,無法互聯(lián)互通,影響檔案數(shù)據(jù)價值發(fā)揮、降低檔案數(shù)據(jù)利用效率。管理層面,一方面,檔案管理體制造成數(shù)據(jù)資源分散。我國條塊分割的檔案管理體制導(dǎo)致各級檔案部門檔案數(shù)據(jù)資源和檔案數(shù)據(jù)管理系統(tǒng)相對隔離,導(dǎo)致檔案數(shù)據(jù)資源難以兼容、關(guān)聯(lián)困難、彼此孤立;另一方面,由于不同行業(yè)之間的固有壁壘,使得各行業(yè)檔案數(shù)據(jù)管理系統(tǒng)差異較大,數(shù)據(jù)煙囪叢生,數(shù)據(jù)信息難以流通。技術(shù)層面,大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)的生成、來源、操作系統(tǒng)、存儲管理技術(shù)等都可能導(dǎo)致檔案數(shù)據(jù)格式異構(gòu);各級各類檔案部門的數(shù)據(jù)交換、數(shù)據(jù)清洗、數(shù)據(jù)關(guān)聯(lián)等數(shù)據(jù)處理技術(shù)水平差異,導(dǎo)致檔案數(shù)據(jù)質(zhì)量參差不齊;由于缺乏統(tǒng)籌規(guī)劃和統(tǒng)一管理,檔案部門在選取和應(yīng)用檔案數(shù)據(jù)管理系統(tǒng)和利用平臺時具有較大的自主性,導(dǎo)致各平臺之間孤立異構(gòu)。針對數(shù)據(jù)孤島,需要借助現(xiàn)代信息技術(shù)將來源分散的檔案數(shù)據(jù)加以集中匯聚、整合融通,破除管理、技術(shù)、系統(tǒng)等造成的數(shù)據(jù)壁壘,從而實現(xiàn)檔案數(shù)據(jù)共建共享,達到深層次利用的目的。三是數(shù)據(jù)安全。在檔案數(shù)據(jù)共享利用過程中,由于網(wǎng)絡(luò)環(huán)境的不確定性、操作流程的復(fù)雜性、涉及主體的多元性,黑客攻擊、病毒侵襲、木馬感染、信息非授權(quán)訪問、管理疏漏等極易造成數(shù)據(jù)竊取丟失、篡改偽造和損壞泄露,安全問題日益復(fù)雜和突出,需要從組織規(guī)劃、制度規(guī)范、日常管理、人才隊伍、應(yīng)急預(yù)案等方面構(gòu)建動態(tài)、高效、立體的檔案數(shù)據(jù)共享利用安全保護體系,促進檔案數(shù)據(jù)安全有效利用【16】。首先是檔案數(shù)據(jù)權(quán)屬問題。檔案數(shù)據(jù)在整合匯聚、流轉(zhuǎn)遷移、交換傳播、集成共享中涉及多部門、多主體,權(quán)屬確定、權(quán)責(zé)劃分、權(quán)益保障等問題越發(fā)凸顯,尤其是不同應(yīng)用場景、不同利用主體導(dǎo)致的責(zé)任劃分不清、權(quán)限難以控制、數(shù)據(jù)溯源困難等問題亟待破解。其次是檔案數(shù)據(jù)倫理風(fēng)險。檔案數(shù)據(jù)在開放共享、開發(fā)利用過程中涉及到的安全保密、知情同意、知識產(chǎn)權(quán)、個人隱私、法律救濟等問題也是檔案數(shù)據(jù)安全防范的重要內(nèi)容。再次是檔案數(shù)據(jù)國際流動、跨境傳輸帶來的安全風(fēng)險。大數(shù)據(jù)時代,檔案數(shù)據(jù)跨境流動、跨國傳輸帶來的信息泄露、網(wǎng)絡(luò)攻擊等風(fēng)險加劇,威脅國家主權(quán)和社會安全。如2021年3月,國家安全機關(guān)工作發(fā)現(xiàn),國家某重要軍事基地周邊建有一可疑氣象觀測設(shè)備,具備采集精確位置信息和多類型氣象數(shù)據(jù)的功能,所采集數(shù)據(jù)直接傳送至境外【17】。為此,應(yīng)積極開展檔案數(shù)據(jù)共享利用的國際合作交流,參與制定檔案數(shù)據(jù)安全相關(guān)規(guī)則標準,有序推動檔案數(shù)據(jù)安全流動、跨境傳播。
3檔案數(shù)據(jù)共享利用實現(xiàn)路徑
根據(jù)檔案數(shù)據(jù)共享利用現(xiàn)狀,為解決檔案數(shù)據(jù)共享利用面臨的現(xiàn)實阻礙,需要從法規(guī)建設(shè)、機制創(chuàng)建、平臺打造、技術(shù)賦能四個方面,構(gòu)筑檔案數(shù)據(jù)共享利用實現(xiàn)路徑,推動檔案數(shù)據(jù)共享利用有序開展。
3.1加強檔案數(shù)據(jù)共享利用法規(guī)標準建設(shè)
完善檔案數(shù)據(jù)共享利用政策法規(guī)。政策法規(guī)建設(shè)是戰(zhàn)略層設(shè)計,是推動檔案數(shù)據(jù)共享利用順利開展的重要保障,具有指導(dǎo)引領(lǐng)作用。當(dāng)前,國家層面針對公共數(shù)據(jù)開放利用、政務(wù)數(shù)據(jù)互聯(lián)互通、檔案信息共建共享等方面頒布了一系列政策法規(guī),為檔案數(shù)據(jù)共享利用提供制度保障,在此基礎(chǔ)上,需要進一步完善檔案數(shù)據(jù)共享利用政策法規(guī)框架。一是強化檔案數(shù)據(jù)開放。開放是數(shù)據(jù)價值實現(xiàn)的重要前提【18】,需要加大檔案數(shù)據(jù)資源開放力度,按照“先解密、后審核、再開放”的原則,加強檔案部門、保密部門和檔案數(shù)據(jù)形成單位的業(yè)務(wù)協(xié)同,建立健全解密流程與開放審核機制,促進檔案數(shù)據(jù)在安全可控下最大程度開放;制定檔案數(shù)據(jù)開放策略和開放目錄,促進檔案數(shù)據(jù)統(tǒng)一匯聚和有序開放,優(yōu)先推動民生保障服務(wù)相關(guān)領(lǐng)域的檔案數(shù)據(jù)向社會開放;加強對開放檔案數(shù)據(jù)的更新維護,不斷擴大檔案數(shù)據(jù)開放范圍,促進數(shù)據(jù)資源動態(tài)更新,推動檔案數(shù)據(jù)安全運行、有效共享。二是推動檔案數(shù)據(jù)資源共建和協(xié)同共享。強化政策引領(lǐng)和機制協(xié)同,明確各部門檔案數(shù)據(jù)共享方式和范圍邊界,厘清各部門檔案數(shù)據(jù)共享的權(quán)利義務(wù),建立政府和社會多元主體互動的檔案數(shù)據(jù)采集制度;統(tǒng)籌推進檔案數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),打造多級聯(lián)動、統(tǒng)一規(guī)范的檔案數(shù)據(jù)共享利用平臺,推動跨部門、跨區(qū)域、跨行業(yè)檔案數(shù)據(jù)管理系統(tǒng)互聯(lián)互通和信息共享。三是促進檔案數(shù)據(jù)安全利用。加強檔案數(shù)據(jù)安全利用制度設(shè)計,增強檔案數(shù)據(jù)深度挖掘與服務(wù)創(chuàng)新,鼓勵和引導(dǎo)檔案數(shù)據(jù)社會化開發(fā)利用,確保檔案數(shù)據(jù)資源開發(fā)利用、共建共享安全運行。明確檔案數(shù)據(jù)共享范圍和使用權(quán)限,推動檔案數(shù)據(jù)隱私保護和權(quán)益保障,強化對檔案數(shù)據(jù)濫用、侵犯個人隱私和知識產(chǎn)權(quán)等行為的管理和懲戒,維護檔案數(shù)據(jù)資源安全、網(wǎng)絡(luò)安全和利用安全。建立健全檔案數(shù)據(jù)共享利用標準體系。標準是檔案數(shù)據(jù)共享利用的重要基礎(chǔ),迫切需要加強檔案數(shù)據(jù)共享利用相關(guān)標準規(guī)范建設(shè),構(gòu)建內(nèi)容完備、結(jié)構(gòu)合理、協(xié)調(diào)一致、相互配套的檔案數(shù)據(jù)共享利用標準體系,實現(xiàn)對檔案數(shù)據(jù)資源開放、共享、利用的規(guī)范化管理,解決因技術(shù)不同、格式不一致、系統(tǒng)不兼容等導(dǎo)致的數(shù)據(jù)融合融通困難等問題,充分發(fā)揮標準在推進檔案數(shù)據(jù)共享利用中的保障作用。一是管理標準。制定檔案數(shù)據(jù)共享利用管理標準,明確檔案數(shù)據(jù)共享利用的職責(zé)權(quán)限、管理模式、安全保障、組織架構(gòu),規(guī)范多主體參與檔案數(shù)據(jù)共享利用的行為方式與協(xié)作機制;建立檔案數(shù)據(jù)共享利用評價指標體系,強化服務(wù)流程管理和考核評價。二是技術(shù)標準。制定檔案數(shù)據(jù)共享利用技術(shù)標準,首先是明確網(wǎng)絡(luò)傳輸、系統(tǒng)分級保密、內(nèi)外網(wǎng)和局域網(wǎng)控制、網(wǎng)站門戶運維等基礎(chǔ)設(shè)施要求;其次是規(guī)范檔案數(shù)據(jù)共享利用平臺,包括平臺架構(gòu)功能、交換訪問接口、部署模式、系統(tǒng)整合、業(yè)務(wù)銜接、數(shù)據(jù)流轉(zhuǎn)監(jiān)控、運行服務(wù)等內(nèi)容,建設(shè)上下聯(lián)動、縱橫協(xié)管、安全高效的規(guī)范化標準化平臺,推動檔案數(shù)據(jù)統(tǒng)一匯聚、資源整合和集中開放;最后是檔案數(shù)據(jù)開發(fā)利用,包括云計算、大數(shù)據(jù)、區(qū)塊鏈、人工智能等現(xiàn)代信息技術(shù)在檔案數(shù)據(jù)中的應(yīng)用。三是資源標準。制定檔案數(shù)據(jù)共享利用資源標準,推進檔案數(shù)據(jù)采集接收、組織描述、著錄標引、交換共享、流通傳輸、分級分類、訪問利用等標準制定和實施,統(tǒng)一檔案數(shù)據(jù)生成格式和元數(shù)據(jù)格式,規(guī)范檔案數(shù)據(jù)操作處理程序,確保檔案數(shù)據(jù)來源可靠、程序規(guī)范、要素合規(guī)、質(zhì)量上乘,建設(shè)形式多樣、內(nèi)容豐富、結(jié)構(gòu)合理、覆蓋廣泛、及時更新的檔案數(shù)據(jù)倉儲,為實現(xiàn)同一標準采集數(shù)據(jù)、同一源頭提供數(shù)據(jù)、同一系統(tǒng)共享數(shù)據(jù)打好基礎(chǔ)【19】。
3.2創(chuàng)建檔案數(shù)據(jù)共享利用機制
檔案數(shù)據(jù)共享利用涉及主體多、應(yīng)用范圍廣、協(xié)調(diào)難度大、技術(shù)要求高,圍繞檔案數(shù)據(jù)開放流通、共建共享、開發(fā)利用、安全監(jiān)管等內(nèi)容,從管理、組織、人才、評價等方面創(chuàng)建檔案數(shù)據(jù)共享利用機制,加強檔案部門、數(shù)據(jù)管理機構(gòu)、社會組織、信息技術(shù)企業(yè)、公眾等多元主體的協(xié)作,推進檔案數(shù)據(jù)共享利用規(guī)范開展、高效運行。建立檔案數(shù)據(jù)共享利用協(xié)同管理機制。建立檔案部門主導(dǎo),多主體協(xié)同共治的管理機制,是檔案管理走向檔案治理的時代要求,需要建立檔案數(shù)據(jù)共享利用協(xié)同管理機制,加強部門協(xié)同、區(qū)域協(xié)同、行業(yè)協(xié)同,鼓勵、引導(dǎo)、規(guī)范社會力量參與檔案事務(wù)【20】,發(fā)揮多主體資源、技術(shù)、智力等優(yōu)勢,提高檔案數(shù)據(jù)開放共享程度,創(chuàng)新檔案數(shù)據(jù)開發(fā)形式,提升檔案數(shù)據(jù)知識化智慧化服務(wù)能力與水平。第一,檔案部門在檔案數(shù)據(jù)共享利用中扮演“元治”角色,發(fā)揮主導(dǎo)作用。多主體協(xié)同共治并非無組織、無秩序,而是在檔案部門主導(dǎo)下的多主體協(xié)同合作,從而保障共享利用的有序進行【21】。檔案部門需要加強統(tǒng)籌謀劃和業(yè)務(wù)指導(dǎo),充分發(fā)揮檔案數(shù)據(jù)資源建設(shè)、質(zhì)量管控、平臺搭建、安全保障等方面的主體作用,制定檔案數(shù)據(jù)共享利用相關(guān)政策法規(guī)和標準規(guī)范,培育社會組織和公民個人參與檔案數(shù)據(jù)共建共享,為檔案數(shù)據(jù)社會共建、協(xié)作開發(fā)、全民共享營造良好環(huán)境,構(gòu)建上下貫通、執(zhí)行有力、運行通暢的檔案工作體制機制。第二,政府機構(gòu)、數(shù)據(jù)管理部門、社會組織等多元主體是檔案數(shù)據(jù)共享利用的重要參與者、建設(shè)者,需要發(fā)揮各自優(yōu)勢,通過多渠道、多方式、多手段參與共建共享,形成多元主體協(xié)同互動的檔案數(shù)據(jù)共享利用新格局。第三,社會公眾是推進檔案數(shù)據(jù)共享利用的重要力量。公眾是檔案數(shù)據(jù)的重要持有者和檔案數(shù)據(jù)共享利用的重要受眾者,對于共享利用需求、效果呈現(xiàn)等更具發(fā)言權(quán),可通過志愿服務(wù)、眾包眾創(chuàng)等方式參與檔案數(shù)據(jù)共建共享和開發(fā)利用,推動檔案數(shù)據(jù)建設(shè)的社會化和民主性,拓展檔案事業(yè)多維空間。構(gòu)建檔案數(shù)據(jù)共享利用組織保障機制。檔案數(shù)據(jù)共享利用的有效開展離不開科學(xué)合理的領(lǐng)導(dǎo)機構(gòu)和組織架構(gòu),協(xié)調(diào)各方關(guān)系,強化資金保障、政策支持和技術(shù)應(yīng)用,推動形成職責(zé)明晰、協(xié)同共進、立治有體、施治有序的工作格局。建立健全檔案數(shù)據(jù)共享利用組織保障機制,明確職責(zé),理順關(guān)系,加強統(tǒng)籌協(xié)調(diào)和戰(zhàn)略規(guī)劃,強化頂層設(shè)計、制度配套和資金投入,科學(xué)設(shè)計檔案數(shù)據(jù)共享利用的整體框架、實施路線和行動方案,按照“誰主管,誰提供,誰負責(zé)”的原則,抓好措施落實和安全保障。具體而言,發(fā)揮國家檔案局總攬全局、協(xié)調(diào)各方的核心領(lǐng)導(dǎo)地位,成立檔案數(shù)據(jù)共享利用領(lǐng)導(dǎo)小組,負責(zé)檔案數(shù)據(jù)共享利用戰(zhàn)略規(guī)劃和標準制定;地方各級檔案主管部門組建實施小組,專門負責(zé)監(jiān)督、指導(dǎo)和推進本行政區(qū)域內(nèi)檔案數(shù)據(jù)共享利用活動開展。此外,檔案部門需要積極融入政府?dāng)?shù)據(jù)開放共享、開發(fā)利用等治理活動,加入政府?dāng)?shù)據(jù)管理委員會,形成數(shù)據(jù)治理高端對話機制【22】。實施內(nèi)外聯(lián)動的人才培育機制。人才是檔案數(shù)據(jù)共享利用的核心力量,加強檔案數(shù)據(jù)共享利用專業(yè)人才培養(yǎng),創(chuàng)新人才培育模式,建立健全多層次、多類型的檔案數(shù)據(jù)管理人才培養(yǎng)體系,能夠有效提升檔案部門數(shù)據(jù)管理和檔案數(shù)據(jù)共享利用能力。一是強化高校檔案數(shù)據(jù)管理專業(yè)人才培養(yǎng),創(chuàng)新檔案專業(yè)人才培育機制,增強人才培養(yǎng)的針對性和實踐性,培養(yǎng)適應(yīng)大數(shù)據(jù)時代檔案管理的復(fù)合型人才,助推檔案數(shù)據(jù)共享利用科學(xué)高效開展。二是提升檔案部門管理人員數(shù)據(jù)技能。大數(shù)據(jù)背景下開發(fā)利用海量檔案數(shù)據(jù)資源,對檔案工作人員的專業(yè)素養(yǎng)、職業(yè)技能提出更高要求,檔案部門需要轉(zhuǎn)變理念,強化數(shù)據(jù)意識和信息技能,推動檔案管理人員數(shù)據(jù)管理能力提升。三是面向社會開展檔案數(shù)據(jù)共享利用宣傳教育。社會民眾是檔案數(shù)據(jù)共享利用的重要主體,需要充分利用全媒體、自媒體、新媒體等融媒體,搭建多層次、立體化的宣傳平臺,面向大眾開展檔案數(shù)據(jù)共享利用宣傳教育,提升社會民眾檔案數(shù)據(jù)共建共享能力。落實檔案數(shù)據(jù)共享利用評價機制。建立結(jié)構(gòu)合理、內(nèi)容完善、指標科學(xué)的檔案數(shù)據(jù)共享利用評價機制,明確檔案數(shù)據(jù)共享利用評價原則、評價方法和評價方式,有助于合理衡量檔案數(shù)據(jù)共享利用成效、掌握用戶體驗,在效益反饋中不斷改進檔案數(shù)據(jù)共享利用服務(wù)策略,提升檔案數(shù)據(jù)共享利用運行效果,提高檔案數(shù)據(jù)服務(wù)能力與水平。在檔案數(shù)據(jù)共享利用評價過程中,應(yīng)堅持科學(xué)實用、系統(tǒng)規(guī)范、動態(tài)靈活、針對有效、可操作性強的評價原則;為保證評價結(jié)果的科學(xué)性、全面性和客觀性,可綜合采用定量評估、定性評估、實地調(diào)研、平臺監(jiān)測、組織訪談、問卷調(diào)查和第三方評價等評價方式。根據(jù)國家標準《GB/T38664.3-2020信息技術(shù)大數(shù)據(jù)政務(wù)數(shù)據(jù)開放共享第3部分:開放程度評價》,結(jié)合檔案數(shù)據(jù)共享利用實踐,構(gòu)建出檔案數(shù)據(jù)共享利用評價指標體系,如表1所示。檔案數(shù)據(jù)共享利用評價指標體系涵蓋數(shù)據(jù)資源、平臺設(shè)施、安全保障、管理機制和應(yīng)用成效五個一級指標,各一級指標根據(jù)需要設(shè)置相關(guān)二級指標。數(shù)據(jù)資源主要對開放檔案數(shù)據(jù)涉及的數(shù)量、種類、質(zhì)量等內(nèi)容進行評價;平臺設(shè)施主要對檔案數(shù)據(jù)共享利用平臺交互訪問、運行服務(wù)等內(nèi)容進行評價;安全保障主要對檔案數(shù)據(jù)安全防護能力的有效性進行評價;管理機制主要對檔案數(shù)據(jù)共享利用戰(zhàn)略規(guī)劃、體制機制、標準規(guī)范等內(nèi)容進行評價;應(yīng)用成效主要從檔案數(shù)據(jù)滿足利用需求角度進行評價。根據(jù)各指標在檔案數(shù)據(jù)共享利用中的重要性賦予相應(yīng)權(quán)重,在實際操作中可結(jié)合現(xiàn)實狀況進行動態(tài)調(diào)整,綜合打分、客觀評價,以評促建、以評促改、以評促優(yōu),推動檔案數(shù)據(jù)開放共享和開發(fā)利用。
3.3打造全國檔案數(shù)據(jù)共享利用平臺
目前,國家正在積極打造數(shù)據(jù)資源開放共享平臺,推動數(shù)據(jù)資源共建共享與開發(fā)利用,助力數(shù)字中國、數(shù)字社會、數(shù)字政府、數(shù)字經(jīng)濟建設(shè)。平臺建設(shè)是檔案數(shù)據(jù)共享利用的重要載體和關(guān)鍵渠道,為檔案數(shù)據(jù)資源共享交換提供支撐。大數(shù)據(jù)時代,檔案數(shù)據(jù)成為檔案信息資源的重要形態(tài),建設(shè)檔案數(shù)據(jù)共享利用平臺是展現(xiàn)檔案數(shù)據(jù)開發(fā)成果、釋放檔案數(shù)據(jù)價值潛能、滿足用戶知識信息需求的重要方式。為此,需要遵循“需求導(dǎo)向、集約建設(shè)、安全可控、便捷高效”原則,從國家、地區(qū)多層面共同推進檔案數(shù)據(jù)共享利用工作,運用現(xiàn)代信息技術(shù),整合集成相互獨立、保存分散的檔案數(shù)據(jù)資源,打破“各自為政、煙囪林立、數(shù)據(jù)壁壘”,推動與業(yè)務(wù)辦公系統(tǒng)、檔案管理系統(tǒng)有效銜接,形成覆蓋全國、統(tǒng)籌利用、統(tǒng)一接入、互聯(lián)互通的檔案數(shù)據(jù)共享利用平臺,實現(xiàn)檔案數(shù)據(jù)跨層級、跨區(qū)域、跨系統(tǒng)、跨行業(yè)、跨部門共享利用。建設(shè)方式:分布構(gòu)建,逐步集成。為促進檔案數(shù)據(jù)互聯(lián)互通與開放共享,需要采用分布設(shè)置接口、逐步集成資源的建設(shè)思路,構(gòu)建物理分散、邏輯集中、快速鏈接、高效搜索的檔案數(shù)據(jù)共享利用平臺,實現(xiàn)分布性和集中性有機統(tǒng)一。分布性體現(xiàn)在物理層面,即檔案數(shù)據(jù)來源于不同站點的檔案數(shù)據(jù)庫;集中性是從邏輯層面將地理分散的站點進行連接,整合集聚來源廣泛、分散存儲的各類檔案數(shù)據(jù)資源,依據(jù)“統(tǒng)一管理、分級負責(zé)”的模式對平臺業(yè)務(wù)活動進行管理,由各省級檔案主管部門逐步推動本省內(nèi)有條件的檔案館加入平臺,最終實現(xiàn)全國各級檔案館全部接入【23】。建設(shè)落點:形成多元檔案數(shù)據(jù)資源庫。檔案數(shù)據(jù)共享利用平臺建設(shè),需要數(shù)量豐富、類型多樣、結(jié)構(gòu)優(yōu)化、質(zhì)量上乘、特色鮮明的檔案數(shù)據(jù)資源倉庫支撐。根據(jù)當(dāng)前檔案數(shù)據(jù)利用需求特征,運用語義挖掘、關(guān)聯(lián)集成、聚類分析等技術(shù)手段,通過統(tǒng)一交換,對各站點數(shù)據(jù)庫中符合特定主題的檔案數(shù)據(jù)資源進行提取、匯聚和整合,形成以政務(wù)檔案數(shù)據(jù)資源庫、民生檔案數(shù)據(jù)資源庫和專題檔案數(shù)據(jù)資源庫為主的多元檔案數(shù)據(jù)資源庫群。建設(shè)成效:搭建檔案數(shù)據(jù)共享利用平臺。大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)共享利用強調(diào)內(nèi)容豐富性、功能便捷性、數(shù)據(jù)實時性,追求基于檔案數(shù)據(jù)內(nèi)容深度挖掘的知識化智慧化服務(wù)。為此,需要以多類型檔案數(shù)據(jù)資源庫為基礎(chǔ),建立相關(guān)工作管理制度和技術(shù)標準規(guī)范,運用“Web數(shù)據(jù)挖掘技術(shù),全文檢索技術(shù),Push技術(shù),異構(gòu)數(shù)據(jù)庫整合技術(shù),智能代理技術(shù),知識倉庫技術(shù)”【24】,從資源層、處理層、服務(wù)層建設(shè)統(tǒng)一聯(lián)動的檔案數(shù)據(jù)共享利用平臺。一是資源層。“資源層是知識服務(wù)平臺的基礎(chǔ)設(shè)施”【25】,是檔案數(shù)據(jù)共享利用平臺建設(shè)的核心要素,需要多渠道、多方式、多路徑匯聚檔案數(shù)據(jù)資源,形成全國檔案數(shù)據(jù)共享利用資源池。二是處理層。處理層是檔案數(shù)據(jù)共享利用平臺建設(shè)的關(guān)鍵環(huán)節(jié)。處理層建設(shè)的主要任務(wù)是通過一系列技術(shù)手段,對檔案數(shù)據(jù)資源進行數(shù)據(jù)分級、脫敏清洗、安全控制,對數(shù)據(jù)顆粒的知識單元進行提取、關(guān)聯(lián)和分析,使檔案數(shù)據(jù)庫轉(zhuǎn)化為信息庫、知識庫。三是服務(wù)層。檔案數(shù)據(jù)共享利用平臺服務(wù)層應(yīng)具有信息查詢與數(shù)據(jù)獲取、數(shù)據(jù)分析與可視化、文化傳播與知識供給、互動參與與反饋評價等功能,可通過檔案網(wǎng)站、移動終端、微信公眾號、應(yīng)用小程序等途徑查詢利用,實現(xiàn)一窗受理、一網(wǎng)通辦,提供便捷化、豐富化、智慧化的檔案數(shù)據(jù)服務(wù),使用戶通過檢索得到的不再是簡單的檔案目錄信息,而是經(jīng)過系統(tǒng)整合的全文信息和知識集合,提升用戶體驗滿意度。借助平臺的互動功能,引導(dǎo)行業(yè)組織、技術(shù)企業(yè)、社會公眾對檔案數(shù)據(jù)進行研究、分析、挖掘,推動檔案數(shù)據(jù)創(chuàng)新開發(fā)和融合應(yīng)用。如2022年7月6日,全國檔案查詢利用服務(wù)平臺正式上線,全國檔案查詢利用服務(wù)平臺是依托互聯(lián)網(wǎng),為社會公眾提供檔案查詢利用的跨區(qū)域、跨層級的公共服務(wù)平臺。建設(shè)全國檔案查詢利用服務(wù)平臺,建立便捷的檔案信息資源共享利用聯(lián)動新機制,實現(xiàn)全國檔案信息共享利用“一網(wǎng)通辦”【26】。
3.4推動檔案數(shù)據(jù)深度開發(fā)與智慧利用信息技術(shù)
在數(shù)據(jù)價值創(chuàng)造中提供了重要的驅(qū)動力【27】。當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革席卷全球,新技術(shù)、新平臺、新模式不斷涌現(xiàn),社會數(shù)字化、網(wǎng)絡(luò)化、智能化水平不斷提升,為檔案事業(yè)轉(zhuǎn)型發(fā)展注入新動力、新活力、新潛力,需要積極借助大數(shù)據(jù)、人工智能、數(shù)字孿生、知識組織等現(xiàn)代信息技術(shù),對海量數(shù)據(jù)資源進行深度分析、知識聚合、動態(tài)呈現(xiàn),在人機物三元智慧融合中不斷增強檔案數(shù)據(jù)利用能力和服務(wù)能力【28】。數(shù)據(jù)挖掘與可視化。檔案數(shù)據(jù)挖掘,即從檔案數(shù)據(jù)中挖掘知識信息。大數(shù)據(jù)挖掘技術(shù)有效地解決了數(shù)據(jù)和知識之間的鴻溝,是將數(shù)據(jù)轉(zhuǎn)變?yōu)橹R的有效方式【29】。通過對類型多樣、來源廣泛的巨量檔案數(shù)據(jù)進行格式轉(zhuǎn)化、語義分析、關(guān)聯(lián)聚合,深度挖掘檔案數(shù)據(jù)蘊含的信息、知識,將檔案數(shù)據(jù)隱性價值轉(zhuǎn)化為顯性價值,充分釋放檔案數(shù)據(jù)潛能。數(shù)據(jù)可視化技術(shù)是指運用計算機圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術(shù)【3】。借助VR、AR、MR等數(shù)據(jù)可視化技術(shù),對檔案數(shù)據(jù)承載的知識信息以清晰明朗、高效直觀的方式進行動態(tài)表達、多維呈現(xiàn),發(fā)現(xiàn)檔案數(shù)據(jù)背后的洞見與規(guī)律,創(chuàng)新檔案服務(wù)方式,提高檔案資源利用效率。智能分析與智慧服務(wù)。人工智能涉及計算機科學(xué)、數(shù)據(jù)科學(xué)、心理學(xué)、倫理學(xué)、哲學(xué)、傳播學(xué)等不同領(lǐng)域,通過自然語言處理、語言圖像識別、模式識別、深度學(xué)習(xí)、機器神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、模擬算法、邏輯推理、智能聚合等技術(shù)方法,對人的意識、思維、行動進行仿真類比,探尋智能的實質(zhì),開拓人類智慧的全新空間。人工智能技術(shù)已應(yīng)用到數(shù)據(jù)管理與檔案管理中,在檔案數(shù)據(jù)化處理、智能分析、智慧服務(wù)等方面前景廣闊。借助語音識別、人臉識別、OCR識別、圖像分析、篇章分析、語義理解、加工計算、自動標引、自動文摘、智能感知等技術(shù)方法,對紙質(zhì)檔案、照片檔案、音視頻檔案進行識別分析、數(shù)據(jù)化處理、智能分類、編目著錄、劃控鑒定等,增強檔案數(shù)據(jù)智能采集、智能捕獲、智能處理、智能鑒定等智能化管理分析能力,提升檔案數(shù)據(jù)運行效能。運用智能化挖掘開發(fā)工具,開展檔案數(shù)據(jù)智能篩選、智能組配、智能推送、智能決策等服務(wù),拓展檔案數(shù)據(jù)智慧服務(wù)場景,發(fā)揮檔案數(shù)據(jù)在預(yù)測分析、決策支持、戰(zhàn)略咨詢等方面的作用。通過智能匹配、智能拓展、智能運作等技術(shù)在檔案數(shù)據(jù)檢索中的應(yīng)用,提高檔案數(shù)據(jù)智慧檢索能力,提升檔案利用的精準度和快捷性;依托智能網(wǎng)絡(luò)、智能交互、智能解讀和智能研判技術(shù),建立檔案數(shù)據(jù)智能利用咨詢系統(tǒng),實現(xiàn)檔案數(shù)據(jù)咨詢服務(wù)自動篩選、自動推理、自動應(yīng)答;通過手機檔案館等智能服務(wù)平臺,開展檔案數(shù)據(jù)菜單式、訂單式和一站式服務(wù),實現(xiàn)檔案信息個性化、特色化、便捷化服務(wù),隨時隨地方便用戶利用檔案數(shù)據(jù)資源【30】。數(shù)字人文與數(shù)字孿生。數(shù)字人文借助數(shù)字技術(shù)再現(xiàn)歷史記憶、編織數(shù)字記憶,檔案數(shù)據(jù)作為價值厚重的文化信息,為數(shù)字人文提供了豐富的人文資源【31】。通過對細粒度檔案數(shù)據(jù)進行上下文識別、元數(shù)據(jù)標注、要素提取、靜態(tài)關(guān)聯(lián)、動態(tài)聚合、深度計算、語義重組、敘事化表現(xiàn)等,挖掘和串聯(lián)檔案數(shù)據(jù)知識單元,促進檔案數(shù)據(jù)人文價值發(fā)揮。數(shù)字孿生是以數(shù)字化方式創(chuàng)建物理實體的虛擬模型,借助數(shù)據(jù)模擬物理實體在現(xiàn)實環(huán)境中的行為,通過虛實交互反饋、數(shù)據(jù)融合分析、決策迭代優(yōu)化等手段,為物理實體增加或擴展新的能力【32】。數(shù)字孿生技術(shù)作為一種加速社會數(shù)字化轉(zhuǎn)型的綜合科技體系,對于推動智慧檔案館資源數(shù)據(jù)化、提供數(shù)智服務(wù)、構(gòu)建智能運作模式等具有重要意義【33】。數(shù)字孿生的基礎(chǔ)是數(shù)據(jù)和建模,從數(shù)據(jù)中挖掘知識,以知識驅(qū)動生產(chǎn)管控的自動化、智能化,是數(shù)字孿生技術(shù)應(yīng)用研究的核心思想【34】。借助協(xié)同計算、虛實映射、技術(shù)迭代、系統(tǒng)交互、物聯(lián)感知、模擬仿真等技術(shù)方法,形成資源豐裕、準確可靠、格式規(guī)范、傳輸穩(wěn)定的檔案孿生大數(shù)據(jù),構(gòu)建要素豐富、數(shù)據(jù)驅(qū)動、交互映射、智能可控的智慧孿生檔案館,發(fā)揮連接物理世界和信息世界的橋梁和紐帶作用,形成與現(xiàn)實空間相互聯(lián)通、平行存在的檔案“元宇宙”,促進檔案數(shù)據(jù)互聯(lián)互通和共建共享,提供更加實時、高效、智慧的檔案數(shù)據(jù)服務(wù)。知識組織與用戶畫像。知識組織是在信息組織的基礎(chǔ)上,研究知識的獲取、描述、整理、表達、控制、共享等整個知識組織過程的理論和方法,包括知識獲取、知識表達、知識處理和知識共享四部分重要內(nèi)容【35】。隨著信息技術(shù)發(fā)展和社會進步,用戶信息素養(yǎng)不斷提升,知識需求日益增加,迫切需要提供檔案知識化服務(wù)。檔案部門需要以社會需求為導(dǎo)向,利用分詞標引、自動摘要、編碼分析、分類聚類、數(shù)據(jù)挖掘、語義網(wǎng)絡(luò)、超媒體等技術(shù)方法,對檔案數(shù)據(jù)資源進行描述加工、整序優(yōu)化、集成處理、提煉開發(fā),挖掘蘊含在檔案數(shù)據(jù)中的隱性知識單元,并對這些知識單元進行整合、組織與管理,形成各類知識產(chǎn)品,促進知識交流、知識傳播、知識共享、知識增值和知識再生產(chǎn),發(fā)揮檔案館的知識管理、知識開發(fā)、知識導(dǎo)航和知識創(chuàng)新功能,成為政府決策、科學(xué)研究、技術(shù)創(chuàng)新的重要知識庫。大數(shù)據(jù)時代充分挖掘發(fā)現(xiàn)用戶的偏好、特征、需求等全貌信息有助于提升檔案信息服務(wù)水平,而嵌入用戶畫像能精準捕捉用戶信息、科學(xué)預(yù)測信息需求,為檔案館開展智能化檔案信息服務(wù)提供方向【36】。通過對用戶行為數(shù)據(jù)、網(wǎng)絡(luò)瀏覽數(shù)據(jù)、檔案利用統(tǒng)計數(shù)據(jù)等數(shù)據(jù)資源進行清洗轉(zhuǎn)換、文本挖掘、標簽抽取、分類描述、回歸分析、相似度測算、模型建構(gòu)等,在語義檢索分析和用戶行為理解的基礎(chǔ)上,建構(gòu)涵蓋基本屬性、行為特征、興趣愛好和社交網(wǎng)絡(luò)等內(nèi)容的檔案用戶畫像,掌握不同類型、不同群體的用戶興趣、習(xí)慣和利用需求,從而提供精準檢索、自主推送、定點宣傳、知識決策等定制化、個性化服務(wù),改善用戶體驗,提升服務(wù)品質(zhì),拓展檔案數(shù)據(jù)服務(wù)空間。
參考文獻
1金波,楊鵬.大數(shù)據(jù)時代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(4):29-37.
2黃子林.檔案信息資源開發(fā)[M].長沙:湖南科學(xué)技術(shù)出版社,1995.
3李紅.數(shù)據(jù)庫原理與應(yīng)用[M].北京:高等教育出版社,2003.
4[美]DAMA國際.DAMA數(shù)據(jù)管理知識體系指南[M].DAMA中國分會翻譯組,譯.北京:機械工業(yè)出版社,2020.
5金波,添志鵬.檔案數(shù)據(jù)內(nèi)涵與特征探析[J].檔案學(xué)通訊,2020(3):4-11.
6金波,晏秦.數(shù)據(jù)管理與檔案信息服務(wù)創(chuàng)新[J].檔案學(xué)研究,2017(6):99-104.
7李珂.提升檔案信息化發(fā)展水平實現(xiàn)遠程利用社會共享——河南省數(shù)字檔案館建設(shè)概述[N].中國檔案報,2020-06-11(001).
8李明華.關(guān)于建立國家電子檔案戰(zhàn)略備份中心的提案[J].中國檔案,2022(3):20.
9羅軍.我國檔案管理體制改革研究[J].檔案學(xué)通訊,2009(5):46-49.
10鄭鷗.加強檔案信息資源整合勢在必行[J].上海檔案,2006(5):22-25.
12許茵.國家重點檔案文件級目錄題名著錄問題探析——以全國民國檔案文件級目錄著錄為例[J].檔案學(xué)研究,2018(6):59-63.
13倪代川,金波.論數(shù)字檔案資源數(shù)據(jù)化發(fā)展[J].檔案學(xué)研究,2021(5):17-22.
14宗威,吳鋒.大數(shù)據(jù)時代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報(社會科學(xué)版),2013(5):38-43.
15周俊.以整體智治消除基層“數(shù)據(jù)孤島”[J].國家治理,2020(30):24-26.
作者:金波 楊鵬 邢慧 單位:上海大學(xué)文化遺產(chǎn)與信息管理學(xué)院 中國船舶工業(yè)集團公司