時(shí)間:2023-03-31 14:44:17
序論:好文章的創(chuàng)作是一個(gè)不斷探索和完善的過程,我們?yōu)槟扑]一篇大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)共享探析范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來更深刻的閱讀感受。
利用服務(wù)是檔案工作的目標(biāo)和宗旨。共享利用強(qiáng)調(diào)共同享有、發(fā)揮效用,是實(shí)現(xiàn)檔案數(shù)據(jù)價(jià)值、釋放檔案數(shù)據(jù)能量的關(guān)鍵方式,也是檔案數(shù)據(jù)治理的重要環(huán)節(jié)。面對(duì)大數(shù)據(jù)時(shí)代社會(huì)公眾日益便捷化、高效化、知識(shí)化、多樣化的檔案信息和檔案文化需求,需要借助大數(shù)據(jù)、人工智能、知識(shí)發(fā)現(xiàn)、虛擬現(xiàn)實(shí)、數(shù)字人文等現(xiàn)代信息技術(shù),探索新時(shí)期檔案數(shù)據(jù)公共服務(wù)轉(zhuǎn)型路徑,創(chuàng)新檔案數(shù)據(jù)開發(fā)利用方式,促進(jìn)檔案數(shù)據(jù)資源的開放共享、深度開發(fā)及有效利用,構(gòu)建精細(xì)、精簡(jiǎn)、精準(zhǔn)、智慧的檔案數(shù)據(jù)公共服務(wù)體系,推動(dòng)檔案數(shù)據(jù)服務(wù)的智能化、社會(huì)化、個(gè)性化,把“資源庫”變成“知識(shí)庫”“思想庫”“智庫”【1】。檔案數(shù)據(jù)共享利用是指充分利用現(xiàn)代信息技術(shù)和管理手段,注重多主體協(xié)同聯(lián)動(dòng),強(qiáng)化檔案數(shù)據(jù)資源建設(shè),實(shí)現(xiàn)檔案數(shù)據(jù)資源共建共享與互聯(lián)互通。其中,各類現(xiàn)代信息技術(shù)是支撐,多主體協(xié)同聯(lián)動(dòng)是方式,檔案數(shù)據(jù)資源建設(shè)是關(guān)鍵,檔案數(shù)據(jù)資源共建共享與互聯(lián)互通是目標(biāo)。
1檔案信息開發(fā)利用與檔案數(shù)據(jù)共享利用辨析
1.1從內(nèi)涵上看
檔案信息是由檔案中的文字、數(shù)據(jù)、圖表、符號(hào)、信號(hào)等形式和內(nèi)容所構(gòu)成檔案的內(nèi)容就是信息,檔案信息的構(gòu)成就是檔案所記載的各種事物的狀態(tài)及表征【2】。數(shù)據(jù)是記錄信息的物理符號(hào),是表達(dá)和傳遞信息的工具【3】,數(shù)據(jù)被稱為信息的原材料,而信息被稱為在上下文語境中的數(shù)據(jù)【4】。檔案數(shù)據(jù)屬于數(shù)據(jù),具有數(shù)據(jù)的一般屬性。檔案數(shù)據(jù)是客觀事物的原始記錄“符號(hào)”,檔案信息則是檔案數(shù)據(jù)加工后的產(chǎn)物,具有傳達(dá)檔案內(nèi)容信息和形式信息的功能,檔案數(shù)據(jù)是檔案信息的基本構(gòu)成元素。這里的“加工”并非指改變檔案信息原始記錄性的人為處理,而是指運(yùn)用技術(shù)或人工手段,將數(shù)據(jù)輔以背景信息等描述,使之可被理解。檔案信息資源開發(fā)利用是對(duì)已知檔案信息資源進(jìn)行有意識(shí)組織、加工的活動(dòng)和過程,著重于檔案信息資源的編纂編研、展示傳播,缺少深層次關(guān)聯(lián)和細(xì)粒度挖掘,屬于淺表化開發(fā)。檔案數(shù)據(jù)共享利用則注重?cái)?shù)據(jù)的開放性、流動(dòng)性、關(guān)聯(lián)性、精準(zhǔn)性,強(qiáng)調(diào)運(yùn)用知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘、數(shù)據(jù)計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)字人文等技術(shù)方法對(duì)細(xì)粒度數(shù)據(jù)進(jìn)行識(shí)別處理、深度開發(fā),在知識(shí)關(guān)聯(lián)的基礎(chǔ)上充分釋放檔案數(shù)據(jù)價(jià)值【5】。
1.2從方式上看
在開發(fā)層次上,檔案信息開發(fā)利用通常是淺表式開發(fā)利用,主要通過陳列展覽、編纂出版、網(wǎng)上展示等方式提供利用,注重檔案信息顯性價(jià)值的開發(fā)。大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)共享利用追求深層次開發(fā),主要采用新技術(shù)、新方法、新手段,在匯聚融合多種格式、多種類型、多種結(jié)構(gòu)檔案數(shù)據(jù)的基礎(chǔ)上,追求檔案信息服務(wù)的精益化、知識(shí)化、智慧化,充分挖掘檔案數(shù)據(jù)價(jià)值潛能,注重檔案數(shù)據(jù)隱性價(jià)值和顯性價(jià)值的全面開發(fā)。有利于挖掘發(fā)現(xiàn)檔案數(shù)據(jù)中的隱性知識(shí),使檔案信息服務(wù)內(nèi)容從表層向深層拓展,實(shí)現(xiàn)檔案數(shù)據(jù)資源的潛在價(jià)值,提高檔案信息服務(wù)深度和質(zhì)量【6】。在開發(fā)手段上,檔案信息開發(fā)利用主要基于人工操作和自動(dòng)化技術(shù)開展利用,開發(fā)能力有限,服務(wù)效率較低。檔案數(shù)據(jù)共享利用采用大數(shù)據(jù)、云計(jì)算、人工智能、數(shù)字人文、虛擬現(xiàn)實(shí)、區(qū)塊鏈等新一代信息技術(shù)對(duì)多元化檔案數(shù)據(jù)資源進(jìn)行整合、感知、挖掘、計(jì)算、關(guān)聯(lián)、可視化,建立檔案數(shù)據(jù)共享利用平臺(tái),實(shí)現(xiàn)檔案數(shù)據(jù)開發(fā)手段智能化。如河南省數(shù)字檔案館建成基于自然語言處理技術(shù)的智能檢索系統(tǒng),對(duì)館藏檔案數(shù)據(jù)資源深度挖掘,將關(guān)聯(lián)信息準(zhǔn)確有效地從大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中挖掘出來,進(jìn)行匯總、統(tǒng)計(jì)、分析,并關(guān)聯(lián)形成知識(shí)圖譜,進(jìn)而形成檔案知識(shí)庫【7】。
1.3從效果上看
檔案信息開發(fā)利用面向館藏實(shí)體檔案、數(shù)字檔案等檔案信息資源,通過傳統(tǒng)加工手段和計(jì)算機(jī)處理技術(shù),形成成果匯編、專題展覽、電子文獻(xiàn)等開發(fā)利用產(chǎn)品。檔案信息開發(fā)利用主要以館藏為中心,屬于“供給導(dǎo)向”服務(wù)模式,處于“等客上門”“你查我調(diào)”的被動(dòng)式服務(wù)狀態(tài)。這種服務(wù)模式制約了檔案信息開發(fā)利用的范圍和水平,社會(huì)利用意愿不強(qiáng)烈、利用效果有限,不利于檔案工作社會(huì)影響力和社會(huì)生態(tài)位的提升。檔案數(shù)據(jù)共享利用秉持“用戶為中心”的服務(wù)理念,追求的效果是實(shí)現(xiàn)檔案數(shù)據(jù)的增值化和知識(shí)化。通過語義理解、知識(shí)發(fā)現(xiàn)、全景或3D建模等新技術(shù)新手段,依托檔案數(shù)據(jù)共享利用平臺(tái),深入挖掘展示檔案數(shù)據(jù)的深層次價(jià)值,知識(shí)增值能力顯著增強(qiáng),為用戶帶來便捷的檔案信息服務(wù)。檔案數(shù)據(jù)共享利用可根據(jù)用戶的歷史行為軌跡和檢索檔案內(nèi)容,進(jìn)行統(tǒng)計(jì)、挖掘、分析,系統(tǒng)掌握用戶信息需求,定制個(gè)性化的服務(wù)方案,主動(dòng)推送相關(guān)檔案信息,達(dá)到“投其所好”的服務(wù)效果,進(jìn)一步提升用戶體驗(yàn)感,使檔案信息服務(wù)由靜態(tài)轉(zhuǎn)向動(dòng)態(tài),由被動(dòng)轉(zhuǎn)向主動(dòng),由普適轉(zhuǎn)向個(gè)性,由滯后轉(zhuǎn)向超前。以實(shí)時(shí)數(shù)據(jù)為支撐,做到一切盡在掌握,基于數(shù)據(jù)分析結(jié)果,采取更為精細(xì)化的服務(wù)方式,全方位滿足用戶多樣化、差異化的檔案信息需求【6】。綜上,檔案數(shù)據(jù)共享利用是在檔案信息開發(fā)利用基礎(chǔ)上,依托新一代信息技術(shù),深度挖掘檔案數(shù)據(jù)價(jià)值,實(shí)現(xiàn)檔案數(shù)據(jù)融合互聯(lián),提供檔案數(shù)據(jù)化服務(wù)。根據(jù)檔案數(shù)據(jù)生命周期理論,檔案數(shù)據(jù)價(jià)值決定著檔案數(shù)據(jù)生命周期的長(zhǎng)度,通過深度開發(fā)、知識(shí)激活、價(jià)值增值,有助于延長(zhǎng)檔案數(shù)據(jù)生命周期。檔案數(shù)據(jù)共享利用不僅有助于數(shù)據(jù)資源的互聯(lián)互通、集成匯聚,而且有助于推動(dòng)以用戶需求為導(dǎo)向的服務(wù)模式轉(zhuǎn)型,有助于突破當(dāng)前檔案資源開發(fā)瓶頸,實(shí)現(xiàn)從“載體開發(fā)”到“內(nèi)容開發(fā)”的轉(zhuǎn)變,進(jìn)而推動(dòng)檔案管理和服務(wù)模式創(chuàng)新。
2檔案數(shù)據(jù)共享利用現(xiàn)實(shí)阻礙
當(dāng)前,檔案數(shù)據(jù)共享利用面臨觀念障礙、制度缺陷、技術(shù)瓶頸和人才短板等諸多困境,數(shù)據(jù)污染、數(shù)據(jù)異構(gòu)、數(shù)據(jù)冗余、數(shù)據(jù)安全、數(shù)據(jù)孤島等問題普遍存在,給檔案數(shù)據(jù)資源服務(wù)創(chuàng)新、開放共享、安全利用等帶來巨大挑戰(zhàn)。
2.1法規(guī)標(biāo)準(zhǔn)缺失
法律是治國(guó)之重器,良法是善治之前提。《中華人民共和國(guó)檔案法》《各級(jí)國(guó)家檔案館開放檔案辦法》等法規(guī)為檔案開放利用提供保障。但檔案數(shù)據(jù)屬于新生事物,關(guān)于檔案數(shù)據(jù)共享利用的針對(duì)性法規(guī)政策尚未建立,尤其是微觀層面數(shù)據(jù)共享技術(shù)、數(shù)據(jù)生成質(zhì)量、數(shù)據(jù)存儲(chǔ)格式、數(shù)據(jù)平臺(tái)架構(gòu)等具體標(biāo)準(zhǔn)規(guī)范缺失。隨著大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,檔案數(shù)據(jù)來源除了館藏檔案數(shù)據(jù)化外,業(yè)務(wù)活動(dòng)生成的檔案數(shù)據(jù)呈爆發(fā)式增長(zhǎng)。據(jù)統(tǒng)計(jì),2020年底,全國(guó)3341個(gè)國(guó)家綜合檔案館的檔案數(shù)據(jù)已經(jīng)達(dá)到了21479T【8】。與此同時(shí),數(shù)據(jù)來源多方、數(shù)據(jù)格式多樣、數(shù)據(jù)結(jié)構(gòu)多元、數(shù)據(jù)類型多種,對(duì)檔案數(shù)據(jù)整合存儲(chǔ)、共建共享、服務(wù)利用帶來諸多困難,需要構(gòu)建完善的檔案數(shù)據(jù)共享利用法規(guī)標(biāo)準(zhǔn)框架。為此,一方面,要關(guān)注檔案數(shù)據(jù)開放范圍、共享機(jī)制、利用規(guī)則等規(guī)范制定;另一方面,要關(guān)注檔案數(shù)據(jù)質(zhì)量、檔案數(shù)據(jù)格式、檔案數(shù)據(jù)共享平臺(tái)等標(biāo)準(zhǔn)建設(shè)。此外,還需關(guān)注檔案數(shù)據(jù)國(guó)際流動(dòng)、檔案數(shù)據(jù)整合交換、檔案數(shù)據(jù)倫理保護(hù)與安全保障等相關(guān)政策法規(guī)的制定。
2.2管理體制機(jī)制制約
檔案管理體制是指在某系統(tǒng)內(nèi)部圍繞權(quán)力的劃分和運(yùn)行而形成的一種制度化的關(guān)系模式【9】。在檔案事業(yè)“統(tǒng)一領(lǐng)導(dǎo)、分級(jí)管理”原則指導(dǎo)下,我國(guó)檔案事業(yè)呈現(xiàn)出“條塊分割”的特征。“條塊分割”的檔案管理體制符合我國(guó)疆域遼闊、行政區(qū)域?qū)蛹?jí)管理的現(xiàn)實(shí)國(guó)情,但也造成了不同區(qū)域檔案信息資源之間的隔閡,同屬于黨和國(guó)家的檔案因?yàn)楦髯詾檎ゲ煌鶃恚斐闪诵畔㈦y以被整合,其利用的效能也無法最大化;而由于過多地強(qiáng)調(diào)了‘條’的從屬關(guān)系,許多行政管理機(jī)關(guān)從“塊”的管理中剝離出來,直接從屬于上級(jí)政府部門領(lǐng)導(dǎo)【10】,阻礙了各區(qū)域、各檔案館的檔案數(shù)據(jù)互聯(lián)互通和共享利用。此外,各行業(yè)、各部門、各類檔案管理系統(tǒng)分散保存檔案數(shù)據(jù),政務(wù)檔案數(shù)據(jù)和社會(huì)檔案數(shù)據(jù)由于數(shù)據(jù)主體性質(zhì)不同、利益不同,缺乏科學(xué)合理的協(xié)作機(jī)制,導(dǎo)致檔案數(shù)據(jù)管理各自為政,各行業(yè)檔案數(shù)據(jù)資源相互獨(dú)立、互不相通,無法真正實(shí)現(xiàn)全社會(huì)層面的檔案數(shù)據(jù)資源共享利用。如醫(yī)療系統(tǒng)、交通系統(tǒng)、金融系統(tǒng)、稅務(wù)系統(tǒng)、公安系統(tǒng)、民政系統(tǒng)等,各自保管自行產(chǎn)生的檔案數(shù)據(jù),缺乏跨系統(tǒng)跨部門跨行業(yè)的檔案數(shù)據(jù)共享利用平臺(tái),難以實(shí)現(xiàn)檔案數(shù)據(jù)的互聯(lián)互通和共建共享。從檔案管理體制機(jī)制來看,管理體制條塊分割,管理機(jī)制對(duì)接不暢,管理系統(tǒng)煙囪林立、重復(fù)建設(shè)等問題明顯,跨區(qū)域、跨部門、跨層級(jí)、跨系統(tǒng)統(tǒng)籌協(xié)調(diào)難度大,難以形成整體合力,使得檔案數(shù)據(jù)無法融合互通,阻礙共享利用的實(shí)現(xiàn)。
2.3數(shù)據(jù)技術(shù)能力薄弱
技術(shù)是檔案數(shù)據(jù)共享利用的基礎(chǔ)支撐,當(dāng)前檔案數(shù)據(jù)共享利用的技術(shù)應(yīng)用能力相對(duì)薄弱,主要體現(xiàn)在:一是檔案數(shù)據(jù)共享利用平臺(tái)欠缺。共享利用平臺(tái)是檔案部門向社會(huì)提供檔案數(shù)據(jù)服務(wù)的重要窗口,是展現(xiàn)檔案部門服務(wù)成效的關(guān)鍵場(chǎng)域。當(dāng)前,我國(guó)各省市縣綜合檔案館大多建設(shè)了官方網(wǎng)站和微信公眾號(hào)平臺(tái),微博、客戶端等平臺(tái)建設(shè)也越發(fā)普遍,各類平臺(tái)主要提供館藏目錄查詢、專題展覽、成果展示、業(yè)界資訊、業(yè)務(wù)動(dòng)態(tài)等服務(wù),從平臺(tái)功能、服務(wù)類型、資源范圍來看普遍處于淺層次利用。缺乏統(tǒng)一的檔案數(shù)據(jù)共享利用平臺(tái),集成整合各類檔案數(shù)據(jù)資源,實(shí)現(xiàn)一站式檔案信息服務(wù),需要構(gòu)建功能完備、運(yùn)維高效、安全實(shí)用的檔案數(shù)據(jù)共享利用平臺(tái)。二是檔案數(shù)據(jù)開發(fā)利用技術(shù)不足。新一代信息技術(shù)是實(shí)現(xiàn)檔案數(shù)據(jù)共享利用、互聯(lián)互通的重要工具,但限于觀念保守、經(jīng)費(fèi)投入不足、數(shù)據(jù)管理人員欠缺、技術(shù)風(fēng)險(xiǎn)以及地區(qū)經(jīng)濟(jì)社會(huì)發(fā)展不平衡等因素制約,檔案部門數(shù)據(jù)開發(fā)利用技術(shù)應(yīng)用不充分、不普遍、不深入、不均衡等問題突出,東中西部區(qū)域差距明顯,檔案工作與新興技術(shù)融合參差不齊,整體水平較低。同時(shí),由于技術(shù)能力有限,檔案數(shù)據(jù)資源深層次開發(fā)與高效化利用不足,檔案數(shù)據(jù)知識(shí)化、智慧化服務(wù)能力不強(qiáng),制約檔案數(shù)據(jù)價(jià)值發(fā)揮與潛能釋放。三是檔案數(shù)據(jù)管理專業(yè)技術(shù)人才匱乏。隨著檔案數(shù)據(jù)急劇增長(zhǎng),檔案數(shù)據(jù)共享利用的廣度和深度不斷拓展,檔案數(shù)據(jù)應(yīng)用場(chǎng)景更加廣泛,迫切需要檔案數(shù)據(jù)管理專業(yè)人才。當(dāng)前,檔案部門中數(shù)據(jù)管理、數(shù)據(jù)計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)開發(fā)等技術(shù)人才十分匱乏,尤其缺乏兼具數(shù)據(jù)管理技術(shù)與檔案管理經(jīng)驗(yàn)的復(fù)合型人才,隊(duì)伍整體的數(shù)據(jù)處理技能和數(shù)據(jù)知識(shí)素養(yǎng)亟待提升。
2.4數(shù)據(jù)資源問題突出
一是數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量是檔案數(shù)據(jù)科學(xué)管理、有效開發(fā)的前提。檔案數(shù)據(jù)質(zhì)量受到技術(shù)因素以及非技術(shù)因素的影響,當(dāng)前檔案數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)體系尚未建立,未實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)質(zhì)量的全方位、全流程控制。首先,檔案數(shù)據(jù)的真實(shí)性、完整性、可讀性、安全性等難以保障【11】。檔案數(shù)據(jù)采集獲取主要以業(yè)務(wù)部門移交和館藏檔案數(shù)據(jù)化為主,對(duì)各平臺(tái)系統(tǒng)和網(wǎng)絡(luò)中產(chǎn)生的檔案數(shù)據(jù)采集缺少“四性”檢測(cè)標(biāo)準(zhǔn)與質(zhì)量管控技術(shù),難以保障來源廣泛、類型多樣數(shù)據(jù)資源的安全完整與真實(shí)有效。如全國(guó)民國(guó)檔案資料目錄中心組織專家對(duì)30個(gè)省市報(bào)送的2016年、2017年計(jì)3000余萬條民國(guó)檔案文件級(jí)目錄數(shù)據(jù)進(jìn)行驗(yàn)收審核后發(fā)現(xiàn)每個(gè)著錄項(xiàng)都存在不規(guī)范問題。如著錄項(xiàng)著錄錯(cuò)位、文種錯(cuò)誤、偽政權(quán)和解放后政權(quán)沒做政權(quán)標(biāo)識(shí)、頁數(shù)與頁碼不相符、時(shí)間標(biāo)識(shí)錯(cuò)誤等【12】。其次,檔案數(shù)據(jù)格式標(biāo)準(zhǔn)不統(tǒng)一。檔案數(shù)據(jù)來源廣泛、內(nèi)容復(fù)雜、類型多樣,大多是非(半)結(jié)構(gòu)化檔案數(shù)據(jù)。檔案數(shù)據(jù)存儲(chǔ)和管理系統(tǒng)各不相同,處理手段和技術(shù)存在差異,缺乏統(tǒng)一標(biāo)準(zhǔn)規(guī)范,導(dǎo)致檔案數(shù)據(jù)異構(gòu)現(xiàn)象嚴(yán)重,無法保證檔案數(shù)據(jù)質(zhì)量,嚴(yán)重影響檔案數(shù)據(jù)共享利用和互聯(lián)互通【13】。再次,檔案數(shù)據(jù)的實(shí)時(shí)性影響共享利用成效。實(shí)時(shí)性是檔案數(shù)據(jù)的基本特征之一,失時(shí)的檔案數(shù)據(jù)其價(jià)值將大打折扣,為此對(duì)檔案數(shù)據(jù)處理速度提出更高要求,如果數(shù)據(jù)處理不及時(shí),有些變化速度快的數(shù)據(jù)就失去了其最有價(jià)值的階段【14】。二是數(shù)據(jù)孤島。“數(shù)據(jù)孤島”是制度、技術(shù)等多重因素共同作用的結(jié)果【15】,致使檔案系統(tǒng)、檔案部門之間數(shù)據(jù)孤島林立,無法互聯(lián)互通,影響檔案數(shù)據(jù)價(jià)值發(fā)揮、降低檔案數(shù)據(jù)利用效率。管理層面,一方面,檔案管理體制造成數(shù)據(jù)資源分散。我國(guó)條塊分割的檔案管理體制導(dǎo)致各級(jí)檔案部門檔案數(shù)據(jù)資源和檔案數(shù)據(jù)管理系統(tǒng)相對(duì)隔離,導(dǎo)致檔案數(shù)據(jù)資源難以兼容、關(guān)聯(lián)困難、彼此孤立;另一方面,由于不同行業(yè)之間的固有壁壘,使得各行業(yè)檔案數(shù)據(jù)管理系統(tǒng)差異較大,數(shù)據(jù)煙囪叢生,數(shù)據(jù)信息難以流通。技術(shù)層面,大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)的生成、來源、操作系統(tǒng)、存儲(chǔ)管理技術(shù)等都可能導(dǎo)致檔案數(shù)據(jù)格式異構(gòu);各級(jí)各類檔案部門的數(shù)據(jù)交換、數(shù)據(jù)清洗、數(shù)據(jù)關(guān)聯(lián)等數(shù)據(jù)處理技術(shù)水平差異,導(dǎo)致檔案數(shù)據(jù)質(zhì)量參差不齊;由于缺乏統(tǒng)籌規(guī)劃和統(tǒng)一管理,檔案部門在選取和應(yīng)用檔案數(shù)據(jù)管理系統(tǒng)和利用平臺(tái)時(shí)具有較大的自主性,導(dǎo)致各平臺(tái)之間孤立異構(gòu)。針對(duì)數(shù)據(jù)孤島,需要借助現(xiàn)代信息技術(shù)將來源分散的檔案數(shù)據(jù)加以集中匯聚、整合融通,破除管理、技術(shù)、系統(tǒng)等造成的數(shù)據(jù)壁壘,從而實(shí)現(xiàn)檔案數(shù)據(jù)共建共享,達(dá)到深層次利用的目的。三是數(shù)據(jù)安全。在檔案數(shù)據(jù)共享利用過程中,由于網(wǎng)絡(luò)環(huán)境的不確定性、操作流程的復(fù)雜性、涉及主體的多元性,黑客攻擊、病毒侵襲、木馬感染、信息非授權(quán)訪問、管理疏漏等極易造成數(shù)據(jù)竊取丟失、篡改偽造和損壞泄露,安全問題日益復(fù)雜和突出,需要從組織規(guī)劃、制度規(guī)范、日常管理、人才隊(duì)伍、應(yīng)急預(yù)案等方面構(gòu)建動(dòng)態(tài)、高效、立體的檔案數(shù)據(jù)共享利用安全保護(hù)體系,促進(jìn)檔案數(shù)據(jù)安全有效利用【16】。首先是檔案數(shù)據(jù)權(quán)屬問題。檔案數(shù)據(jù)在整合匯聚、流轉(zhuǎn)遷移、交換傳播、集成共享中涉及多部門、多主體,權(quán)屬確定、權(quán)責(zé)劃分、權(quán)益保障等問題越發(fā)凸顯,尤其是不同應(yīng)用場(chǎng)景、不同利用主體導(dǎo)致的責(zé)任劃分不清、權(quán)限難以控制、數(shù)據(jù)溯源困難等問題亟待破解。其次是檔案數(shù)據(jù)倫理風(fēng)險(xiǎn)。檔案數(shù)據(jù)在開放共享、開發(fā)利用過程中涉及到的安全保密、知情同意、知識(shí)產(chǎn)權(quán)、個(gè)人隱私、法律救濟(jì)等問題也是檔案數(shù)據(jù)安全防范的重要內(nèi)容。再次是檔案數(shù)據(jù)國(guó)際流動(dòng)、跨境傳輸帶來的安全風(fēng)險(xiǎn)。大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)跨境流動(dòng)、跨國(guó)傳輸帶來的信息泄露、網(wǎng)絡(luò)攻擊等風(fēng)險(xiǎn)加劇,威脅國(guó)家主權(quán)和社會(huì)安全。如2021年3月,國(guó)家安全機(jī)關(guān)工作發(fā)現(xiàn),國(guó)家某重要軍事基地周邊建有一可疑氣象觀測(cè)設(shè)備,具備采集精確位置信息和多類型氣象數(shù)據(jù)的功能,所采集數(shù)據(jù)直接傳送至境外【17】。為此,應(yīng)積極開展檔案數(shù)據(jù)共享利用的國(guó)際合作交流,參與制定檔案數(shù)據(jù)安全相關(guān)規(guī)則標(biāo)準(zhǔn),有序推動(dòng)檔案數(shù)據(jù)安全流動(dòng)、跨境傳播。
3檔案數(shù)據(jù)共享利用實(shí)現(xiàn)路徑
根據(jù)檔案數(shù)據(jù)共享利用現(xiàn)狀,為解決檔案數(shù)據(jù)共享利用面臨的現(xiàn)實(shí)阻礙,需要從法規(guī)建設(shè)、機(jī)制創(chuàng)建、平臺(tái)打造、技術(shù)賦能四個(gè)方面,構(gòu)筑檔案數(shù)據(jù)共享利用實(shí)現(xiàn)路徑,推動(dòng)檔案數(shù)據(jù)共享利用有序開展。
3.1加強(qiáng)檔案數(shù)據(jù)共享利用法規(guī)標(biāo)準(zhǔn)建設(shè)
完善檔案數(shù)據(jù)共享利用政策法規(guī)。政策法規(guī)建設(shè)是戰(zhàn)略層設(shè)計(jì),是推動(dòng)檔案數(shù)據(jù)共享利用順利開展的重要保障,具有指導(dǎo)引領(lǐng)作用。當(dāng)前,國(guó)家層面針對(duì)公共數(shù)據(jù)開放利用、政務(wù)數(shù)據(jù)互聯(lián)互通、檔案信息共建共享等方面頒布了一系列政策法規(guī),為檔案數(shù)據(jù)共享利用提供制度保障,在此基礎(chǔ)上,需要進(jìn)一步完善檔案數(shù)據(jù)共享利用政策法規(guī)框架。一是強(qiáng)化檔案數(shù)據(jù)開放。開放是數(shù)據(jù)價(jià)值實(shí)現(xiàn)的重要前提【18】,需要加大檔案數(shù)據(jù)資源開放力度,按照“先解密、后審核、再開放”的原則,加強(qiáng)檔案部門、保密部門和檔案數(shù)據(jù)形成單位的業(yè)務(wù)協(xié)同,建立健全解密流程與開放審核機(jī)制,促進(jìn)檔案數(shù)據(jù)在安全可控下最大程度開放;制定檔案數(shù)據(jù)開放策略和開放目錄,促進(jìn)檔案數(shù)據(jù)統(tǒng)一匯聚和有序開放,優(yōu)先推動(dòng)民生保障服務(wù)相關(guān)領(lǐng)域的檔案數(shù)據(jù)向社會(huì)開放;加強(qiáng)對(duì)開放檔案數(shù)據(jù)的更新維護(hù),不斷擴(kuò)大檔案數(shù)據(jù)開放范圍,促進(jìn)數(shù)據(jù)資源動(dòng)態(tài)更新,推動(dòng)檔案數(shù)據(jù)安全運(yùn)行、有效共享。二是推動(dòng)檔案數(shù)據(jù)資源共建和協(xié)同共享。強(qiáng)化政策引領(lǐng)和機(jī)制協(xié)同,明確各部門檔案數(shù)據(jù)共享方式和范圍邊界,厘清各部門檔案數(shù)據(jù)共享的權(quán)利義務(wù),建立政府和社會(huì)多元主體互動(dòng)的檔案數(shù)據(jù)采集制度;統(tǒng)籌推進(jìn)檔案數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),打造多級(jí)聯(lián)動(dòng)、統(tǒng)一規(guī)范的檔案數(shù)據(jù)共享利用平臺(tái),推動(dòng)跨部門、跨區(qū)域、跨行業(yè)檔案數(shù)據(jù)管理系統(tǒng)互聯(lián)互通和信息共享。三是促進(jìn)檔案數(shù)據(jù)安全利用。加強(qiáng)檔案數(shù)據(jù)安全利用制度設(shè)計(jì),增強(qiáng)檔案數(shù)據(jù)深度挖掘與服務(wù)創(chuàng)新,鼓勵(lì)和引導(dǎo)檔案數(shù)據(jù)社會(huì)化開發(fā)利用,確保檔案數(shù)據(jù)資源開發(fā)利用、共建共享安全運(yùn)行。明確檔案數(shù)據(jù)共享范圍和使用權(quán)限,推動(dòng)檔案數(shù)據(jù)隱私保護(hù)和權(quán)益保障,強(qiáng)化對(duì)檔案數(shù)據(jù)濫用、侵犯?jìng)€(gè)人隱私和知識(shí)產(chǎn)權(quán)等行為的管理和懲戒,維護(hù)檔案數(shù)據(jù)資源安全、網(wǎng)絡(luò)安全和利用安全。建立健全檔案數(shù)據(jù)共享利用標(biāo)準(zhǔn)體系。標(biāo)準(zhǔn)是檔案數(shù)據(jù)共享利用的重要基礎(chǔ),迫切需要加強(qiáng)檔案數(shù)據(jù)共享利用相關(guān)標(biāo)準(zhǔn)規(guī)范建設(shè),構(gòu)建內(nèi)容完備、結(jié)構(gòu)合理、協(xié)調(diào)一致、相互配套的檔案數(shù)據(jù)共享利用標(biāo)準(zhǔn)體系,實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)資源開放、共享、利用的規(guī)范化管理,解決因技術(shù)不同、格式不一致、系統(tǒng)不兼容等導(dǎo)致的數(shù)據(jù)融合融通困難等問題,充分發(fā)揮標(biāo)準(zhǔn)在推進(jìn)檔案數(shù)據(jù)共享利用中的保障作用。一是管理標(biāo)準(zhǔn)。制定檔案數(shù)據(jù)共享利用管理標(biāo)準(zhǔn),明確檔案數(shù)據(jù)共享利用的職責(zé)權(quán)限、管理模式、安全保障、組織架構(gòu),規(guī)范多主體參與檔案數(shù)據(jù)共享利用的行為方式與協(xié)作機(jī)制;建立檔案數(shù)據(jù)共享利用評(píng)價(jià)指標(biāo)體系,強(qiáng)化服務(wù)流程管理和考核評(píng)價(jià)。二是技術(shù)標(biāo)準(zhǔn)。制定檔案數(shù)據(jù)共享利用技術(shù)標(biāo)準(zhǔn),首先是明確網(wǎng)絡(luò)傳輸、系統(tǒng)分級(jí)保密、內(nèi)外網(wǎng)和局域網(wǎng)控制、網(wǎng)站門戶運(yùn)維等基礎(chǔ)設(shè)施要求;其次是規(guī)范檔案數(shù)據(jù)共享利用平臺(tái),包括平臺(tái)架構(gòu)功能、交換訪問接口、部署模式、系統(tǒng)整合、業(yè)務(wù)銜接、數(shù)據(jù)流轉(zhuǎn)監(jiān)控、運(yùn)行服務(wù)等內(nèi)容,建設(shè)上下聯(lián)動(dòng)、縱橫協(xié)管、安全高效的規(guī)范化標(biāo)準(zhǔn)化平臺(tái),推動(dòng)檔案數(shù)據(jù)統(tǒng)一匯聚、資源整合和集中開放;最后是檔案數(shù)據(jù)開發(fā)利用,包括云計(jì)算、大數(shù)據(jù)、區(qū)塊鏈、人工智能等現(xiàn)代信息技術(shù)在檔案數(shù)據(jù)中的應(yīng)用。三是資源標(biāo)準(zhǔn)。制定檔案數(shù)據(jù)共享利用資源標(biāo)準(zhǔn),推進(jìn)檔案數(shù)據(jù)采集接收、組織描述、著錄標(biāo)引、交換共享、流通傳輸、分級(jí)分類、訪問利用等標(biāo)準(zhǔn)制定和實(shí)施,統(tǒng)一檔案數(shù)據(jù)生成格式和元數(shù)據(jù)格式,規(guī)范檔案數(shù)據(jù)操作處理程序,確保檔案數(shù)據(jù)來源可靠、程序規(guī)范、要素合規(guī)、質(zhì)量上乘,建設(shè)形式多樣、內(nèi)容豐富、結(jié)構(gòu)合理、覆蓋廣泛、及時(shí)更新的檔案數(shù)據(jù)倉儲(chǔ),為實(shí)現(xiàn)同一標(biāo)準(zhǔn)采集數(shù)據(jù)、同一源頭提供數(shù)據(jù)、同一系統(tǒng)共享數(shù)據(jù)打好基礎(chǔ)【19】。
3.2創(chuàng)建檔案數(shù)據(jù)共享利用機(jī)制
檔案數(shù)據(jù)共享利用涉及主體多、應(yīng)用范圍廣、協(xié)調(diào)難度大、技術(shù)要求高,圍繞檔案數(shù)據(jù)開放流通、共建共享、開發(fā)利用、安全監(jiān)管等內(nèi)容,從管理、組織、人才、評(píng)價(jià)等方面創(chuàng)建檔案數(shù)據(jù)共享利用機(jī)制,加強(qiáng)檔案部門、數(shù)據(jù)管理機(jī)構(gòu)、社會(huì)組織、信息技術(shù)企業(yè)、公眾等多元主體的協(xié)作,推進(jìn)檔案數(shù)據(jù)共享利用規(guī)范開展、高效運(yùn)行。建立檔案數(shù)據(jù)共享利用協(xié)同管理機(jī)制。建立檔案部門主導(dǎo),多主體協(xié)同共治的管理機(jī)制,是檔案管理走向檔案治理的時(shí)代要求,需要建立檔案數(shù)據(jù)共享利用協(xié)同管理機(jī)制,加強(qiáng)部門協(xié)同、區(qū)域協(xié)同、行業(yè)協(xié)同,鼓勵(lì)、引導(dǎo)、規(guī)范社會(huì)力量參與檔案事務(wù)【20】,發(fā)揮多主體資源、技術(shù)、智力等優(yōu)勢(shì),提高檔案數(shù)據(jù)開放共享程度,創(chuàng)新檔案數(shù)據(jù)開發(fā)形式,提升檔案數(shù)據(jù)知識(shí)化智慧化服務(wù)能力與水平。第一,檔案部門在檔案數(shù)據(jù)共享利用中扮演“元治”角色,發(fā)揮主導(dǎo)作用。多主體協(xié)同共治并非無組織、無秩序,而是在檔案部門主導(dǎo)下的多主體協(xié)同合作,從而保障共享利用的有序進(jìn)行【21】。檔案部門需要加強(qiáng)統(tǒng)籌謀劃和業(yè)務(wù)指導(dǎo),充分發(fā)揮檔案數(shù)據(jù)資源建設(shè)、質(zhì)量管控、平臺(tái)搭建、安全保障等方面的主體作用,制定檔案數(shù)據(jù)共享利用相關(guān)政策法規(guī)和標(biāo)準(zhǔn)規(guī)范,培育社會(huì)組織和公民個(gè)人參與檔案數(shù)據(jù)共建共享,為檔案數(shù)據(jù)社會(huì)共建、協(xié)作開發(fā)、全民共享營(yíng)造良好環(huán)境,構(gòu)建上下貫通、執(zhí)行有力、運(yùn)行通暢的檔案工作體制機(jī)制。第二,政府機(jī)構(gòu)、數(shù)據(jù)管理部門、社會(huì)組織等多元主體是檔案數(shù)據(jù)共享利用的重要參與者、建設(shè)者,需要發(fā)揮各自優(yōu)勢(shì),通過多渠道、多方式、多手段參與共建共享,形成多元主體協(xié)同互動(dòng)的檔案數(shù)據(jù)共享利用新格局。第三,社會(huì)公眾是推進(jìn)檔案數(shù)據(jù)共享利用的重要力量。公眾是檔案數(shù)據(jù)的重要持有者和檔案數(shù)據(jù)共享利用的重要受眾者,對(duì)于共享利用需求、效果呈現(xiàn)等更具發(fā)言權(quán),可通過志愿服務(wù)、眾包眾創(chuàng)等方式參與檔案數(shù)據(jù)共建共享和開發(fā)利用,推動(dòng)檔案數(shù)據(jù)建設(shè)的社會(huì)化和民主性,拓展檔案事業(yè)多維空間。構(gòu)建檔案數(shù)據(jù)共享利用組織保障機(jī)制。檔案數(shù)據(jù)共享利用的有效開展離不開科學(xué)合理的領(lǐng)導(dǎo)機(jī)構(gòu)和組織架構(gòu),協(xié)調(diào)各方關(guān)系,強(qiáng)化資金保障、政策支持和技術(shù)應(yīng)用,推動(dòng)形成職責(zé)明晰、協(xié)同共進(jìn)、立治有體、施治有序的工作格局。建立健全檔案數(shù)據(jù)共享利用組織保障機(jī)制,明確職責(zé),理順關(guān)系,加強(qiáng)統(tǒng)籌協(xié)調(diào)和戰(zhàn)略規(guī)劃,強(qiáng)化頂層設(shè)計(jì)、制度配套和資金投入,科學(xué)設(shè)計(jì)檔案數(shù)據(jù)共享利用的整體框架、實(shí)施路線和行動(dòng)方案,按照“誰主管,誰提供,誰負(fù)責(zé)”的原則,抓好措施落實(shí)和安全保障。具體而言,發(fā)揮國(guó)家檔案局總攬全局、協(xié)調(diào)各方的核心領(lǐng)導(dǎo)地位,成立檔案數(shù)據(jù)共享利用領(lǐng)導(dǎo)小組,負(fù)責(zé)檔案數(shù)據(jù)共享利用戰(zhàn)略規(guī)劃和標(biāo)準(zhǔn)制定;地方各級(jí)檔案主管部門組建實(shí)施小組,專門負(fù)責(zé)監(jiān)督、指導(dǎo)和推進(jìn)本行政區(qū)域內(nèi)檔案數(shù)據(jù)共享利用活動(dòng)開展。此外,檔案部門需要積極融入政府?dāng)?shù)據(jù)開放共享、開發(fā)利用等治理活動(dòng),加入政府?dāng)?shù)據(jù)管理委員會(huì),形成數(shù)據(jù)治理高端對(duì)話機(jī)制【22】。實(shí)施內(nèi)外聯(lián)動(dòng)的人才培育機(jī)制。人才是檔案數(shù)據(jù)共享利用的核心力量,加強(qiáng)檔案數(shù)據(jù)共享利用專業(yè)人才培養(yǎng),創(chuàng)新人才培育模式,建立健全多層次、多類型的檔案數(shù)據(jù)管理人才培養(yǎng)體系,能夠有效提升檔案部門數(shù)據(jù)管理和檔案數(shù)據(jù)共享利用能力。一是強(qiáng)化高校檔案數(shù)據(jù)管理專業(yè)人才培養(yǎng),創(chuàng)新檔案專業(yè)人才培育機(jī)制,增強(qiáng)人才培養(yǎng)的針對(duì)性和實(shí)踐性,培養(yǎng)適應(yīng)大數(shù)據(jù)時(shí)代檔案管理的復(fù)合型人才,助推檔案數(shù)據(jù)共享利用科學(xué)高效開展。二是提升檔案部門管理人員數(shù)據(jù)技能。大數(shù)據(jù)背景下開發(fā)利用海量檔案數(shù)據(jù)資源,對(duì)檔案工作人員的專業(yè)素養(yǎng)、職業(yè)技能提出更高要求,檔案部門需要轉(zhuǎn)變理念,強(qiáng)化數(shù)據(jù)意識(shí)和信息技能,推動(dòng)檔案管理人員數(shù)據(jù)管理能力提升。三是面向社會(huì)開展檔案數(shù)據(jù)共享利用宣傳教育。社會(huì)民眾是檔案數(shù)據(jù)共享利用的重要主體,需要充分利用全媒體、自媒體、新媒體等融媒體,搭建多層次、立體化的宣傳平臺(tái),面向大眾開展檔案數(shù)據(jù)共享利用宣傳教育,提升社會(huì)民眾檔案數(shù)據(jù)共建共享能力。落實(shí)檔案數(shù)據(jù)共享利用評(píng)價(jià)機(jī)制。建立結(jié)構(gòu)合理、內(nèi)容完善、指標(biāo)科學(xué)的檔案數(shù)據(jù)共享利用評(píng)價(jià)機(jī)制,明確檔案數(shù)據(jù)共享利用評(píng)價(jià)原則、評(píng)價(jià)方法和評(píng)價(jià)方式,有助于合理衡量檔案數(shù)據(jù)共享利用成效、掌握用戶體驗(yàn),在效益反饋中不斷改進(jìn)檔案數(shù)據(jù)共享利用服務(wù)策略,提升檔案數(shù)據(jù)共享利用運(yùn)行效果,提高檔案數(shù)據(jù)服務(wù)能力與水平。在檔案數(shù)據(jù)共享利用評(píng)價(jià)過程中,應(yīng)堅(jiān)持科學(xué)實(shí)用、系統(tǒng)規(guī)范、動(dòng)態(tài)靈活、針對(duì)有效、可操作性強(qiáng)的評(píng)價(jià)原則;為保證評(píng)價(jià)結(jié)果的科學(xué)性、全面性和客觀性,可綜合采用定量評(píng)估、定性評(píng)估、實(shí)地調(diào)研、平臺(tái)監(jiān)測(cè)、組織訪談、問卷調(diào)查和第三方評(píng)價(jià)等評(píng)價(jià)方式。根據(jù)國(guó)家標(biāo)準(zhǔn)《GB/T38664.3-2020信息技術(shù)大數(shù)據(jù)政務(wù)數(shù)據(jù)開放共享第3部分:開放程度評(píng)價(jià)》,結(jié)合檔案數(shù)據(jù)共享利用實(shí)踐,構(gòu)建出檔案數(shù)據(jù)共享利用評(píng)價(jià)指標(biāo)體系,如表1所示。檔案數(shù)據(jù)共享利用評(píng)價(jià)指標(biāo)體系涵蓋數(shù)據(jù)資源、平臺(tái)設(shè)施、安全保障、管理機(jī)制和應(yīng)用成效五個(gè)一級(jí)指標(biāo),各一級(jí)指標(biāo)根據(jù)需要設(shè)置相關(guān)二級(jí)指標(biāo)。數(shù)據(jù)資源主要對(duì)開放檔案數(shù)據(jù)涉及的數(shù)量、種類、質(zhì)量等內(nèi)容進(jìn)行評(píng)價(jià);平臺(tái)設(shè)施主要對(duì)檔案數(shù)據(jù)共享利用平臺(tái)交互訪問、運(yùn)行服務(wù)等內(nèi)容進(jìn)行評(píng)價(jià);安全保障主要對(duì)檔案數(shù)據(jù)安全防護(hù)能力的有效性進(jìn)行評(píng)價(jià);管理機(jī)制主要對(duì)檔案數(shù)據(jù)共享利用戰(zhàn)略規(guī)劃、體制機(jī)制、標(biāo)準(zhǔn)規(guī)范等內(nèi)容進(jìn)行評(píng)價(jià);應(yīng)用成效主要從檔案數(shù)據(jù)滿足利用需求角度進(jìn)行評(píng)價(jià)。根據(jù)各指標(biāo)在檔案數(shù)據(jù)共享利用中的重要性賦予相應(yīng)權(quán)重,在實(shí)際操作中可結(jié)合現(xiàn)實(shí)狀況進(jìn)行動(dòng)態(tài)調(diào)整,綜合打分、客觀評(píng)價(jià),以評(píng)促建、以評(píng)促改、以評(píng)促優(yōu),推動(dòng)檔案數(shù)據(jù)開放共享和開發(fā)利用。
3.3打造全國(guó)檔案數(shù)據(jù)共享利用平臺(tái)
目前,國(guó)家正在積極打造數(shù)據(jù)資源開放共享平臺(tái),推動(dòng)數(shù)據(jù)資源共建共享與開發(fā)利用,助力數(shù)字中國(guó)、數(shù)字社會(huì)、數(shù)字政府、數(shù)字經(jīng)濟(jì)建設(shè)。平臺(tái)建設(shè)是檔案數(shù)據(jù)共享利用的重要載體和關(guān)鍵渠道,為檔案數(shù)據(jù)資源共享交換提供支撐。大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)成為檔案信息資源的重要形態(tài),建設(shè)檔案數(shù)據(jù)共享利用平臺(tái)是展現(xiàn)檔案數(shù)據(jù)開發(fā)成果、釋放檔案數(shù)據(jù)價(jià)值潛能、滿足用戶知識(shí)信息需求的重要方式。為此,需要遵循“需求導(dǎo)向、集約建設(shè)、安全可控、便捷高效”原則,從國(guó)家、地區(qū)多層面共同推進(jìn)檔案數(shù)據(jù)共享利用工作,運(yùn)用現(xiàn)代信息技術(shù),整合集成相互獨(dú)立、保存分散的檔案數(shù)據(jù)資源,打破“各自為政、煙囪林立、數(shù)據(jù)壁壘”,推動(dòng)與業(yè)務(wù)辦公系統(tǒng)、檔案管理系統(tǒng)有效銜接,形成覆蓋全國(guó)、統(tǒng)籌利用、統(tǒng)一接入、互聯(lián)互通的檔案數(shù)據(jù)共享利用平臺(tái),實(shí)現(xiàn)檔案數(shù)據(jù)跨層級(jí)、跨區(qū)域、跨系統(tǒng)、跨行業(yè)、跨部門共享利用。建設(shè)方式:分布構(gòu)建,逐步集成。為促進(jìn)檔案數(shù)據(jù)互聯(lián)互通與開放共享,需要采用分布設(shè)置接口、逐步集成資源的建設(shè)思路,構(gòu)建物理分散、邏輯集中、快速鏈接、高效搜索的檔案數(shù)據(jù)共享利用平臺(tái),實(shí)現(xiàn)分布性和集中性有機(jī)統(tǒng)一。分布性體現(xiàn)在物理層面,即檔案數(shù)據(jù)來源于不同站點(diǎn)的檔案數(shù)據(jù)庫;集中性是從邏輯層面將地理分散的站點(diǎn)進(jìn)行連接,整合集聚來源廣泛、分散存儲(chǔ)的各類檔案數(shù)據(jù)資源,依據(jù)“統(tǒng)一管理、分級(jí)負(fù)責(zé)”的模式對(duì)平臺(tái)業(yè)務(wù)活動(dòng)進(jìn)行管理,由各省級(jí)檔案主管部門逐步推動(dòng)本省內(nèi)有條件的檔案館加入平臺(tái),最終實(shí)現(xiàn)全國(guó)各級(jí)檔案館全部接入【23】。建設(shè)落點(diǎn):形成多元檔案數(shù)據(jù)資源庫。檔案數(shù)據(jù)共享利用平臺(tái)建設(shè),需要數(shù)量豐富、類型多樣、結(jié)構(gòu)優(yōu)化、質(zhì)量上乘、特色鮮明的檔案數(shù)據(jù)資源倉庫支撐。根據(jù)當(dāng)前檔案數(shù)據(jù)利用需求特征,運(yùn)用語義挖掘、關(guān)聯(lián)集成、聚類分析等技術(shù)手段,通過統(tǒng)一交換,對(duì)各站點(diǎn)數(shù)據(jù)庫中符合特定主題的檔案數(shù)據(jù)資源進(jìn)行提取、匯聚和整合,形成以政務(wù)檔案數(shù)據(jù)資源庫、民生檔案數(shù)據(jù)資源庫和專題檔案數(shù)據(jù)資源庫為主的多元檔案數(shù)據(jù)資源庫群。建設(shè)成效:搭建檔案數(shù)據(jù)共享利用平臺(tái)。大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)共享利用強(qiáng)調(diào)內(nèi)容豐富性、功能便捷性、數(shù)據(jù)實(shí)時(shí)性,追求基于檔案數(shù)據(jù)內(nèi)容深度挖掘的知識(shí)化智慧化服務(wù)。為此,需要以多類型檔案數(shù)據(jù)資源庫為基礎(chǔ),建立相關(guān)工作管理制度和技術(shù)標(biāo)準(zhǔn)規(guī)范,運(yùn)用“Web數(shù)據(jù)挖掘技術(shù),全文檢索技術(shù),Push技術(shù),異構(gòu)數(shù)據(jù)庫整合技術(shù),智能代理技術(shù),知識(shí)倉庫技術(shù)”【24】,從資源層、處理層、服務(wù)層建設(shè)統(tǒng)一聯(lián)動(dòng)的檔案數(shù)據(jù)共享利用平臺(tái)。一是資源層。“資源層是知識(shí)服務(wù)平臺(tái)的基礎(chǔ)設(shè)施”【25】,是檔案數(shù)據(jù)共享利用平臺(tái)建設(shè)的核心要素,需要多渠道、多方式、多路徑匯聚檔案數(shù)據(jù)資源,形成全國(guó)檔案數(shù)據(jù)共享利用資源池。二是處理層。處理層是檔案數(shù)據(jù)共享利用平臺(tái)建設(shè)的關(guān)鍵環(huán)節(jié)。處理層建設(shè)的主要任務(wù)是通過一系列技術(shù)手段,對(duì)檔案數(shù)據(jù)資源進(jìn)行數(shù)據(jù)分級(jí)、脫敏清洗、安全控制,對(duì)數(shù)據(jù)顆粒的知識(shí)單元進(jìn)行提取、關(guān)聯(lián)和分析,使檔案數(shù)據(jù)庫轉(zhuǎn)化為信息庫、知識(shí)庫。三是服務(wù)層。檔案數(shù)據(jù)共享利用平臺(tái)服務(wù)層應(yīng)具有信息查詢與數(shù)據(jù)獲取、數(shù)據(jù)分析與可視化、文化傳播與知識(shí)供給、互動(dòng)參與與反饋評(píng)價(jià)等功能,可通過檔案網(wǎng)站、移動(dòng)終端、微信公眾號(hào)、應(yīng)用小程序等途徑查詢利用,實(shí)現(xiàn)一窗受理、一網(wǎng)通辦,提供便捷化、豐富化、智慧化的檔案數(shù)據(jù)服務(wù),使用戶通過檢索得到的不再是簡(jiǎn)單的檔案目錄信息,而是經(jīng)過系統(tǒng)整合的全文信息和知識(shí)集合,提升用戶體驗(yàn)滿意度。借助平臺(tái)的互動(dòng)功能,引導(dǎo)行業(yè)組織、技術(shù)企業(yè)、社會(huì)公眾對(duì)檔案數(shù)據(jù)進(jìn)行研究、分析、挖掘,推動(dòng)檔案數(shù)據(jù)創(chuàng)新開發(fā)和融合應(yīng)用。如2022年7月6日,全國(guó)檔案查詢利用服務(wù)平臺(tái)正式上線,全國(guó)檔案查詢利用服務(wù)平臺(tái)是依托互聯(lián)網(wǎng),為社會(huì)公眾提供檔案查詢利用的跨區(qū)域、跨層級(jí)的公共服務(wù)平臺(tái)。建設(shè)全國(guó)檔案查詢利用服務(wù)平臺(tái),建立便捷的檔案信息資源共享利用聯(lián)動(dòng)新機(jī)制,實(shí)現(xiàn)全國(guó)檔案信息共享利用“一網(wǎng)通辦”【26】。
3.4推動(dòng)檔案數(shù)據(jù)深度開發(fā)與智慧利用信息技術(shù)
在數(shù)據(jù)價(jià)值創(chuàng)造中提供了重要的驅(qū)動(dòng)力【27】。當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革席卷全球,新技術(shù)、新平臺(tái)、新模式不斷涌現(xiàn),社會(huì)數(shù)字化、網(wǎng)絡(luò)化、智能化水平不斷提升,為檔案事業(yè)轉(zhuǎn)型發(fā)展注入新動(dòng)力、新活力、新潛力,需要積極借助大數(shù)據(jù)、人工智能、數(shù)字孿生、知識(shí)組織等現(xiàn)代信息技術(shù),對(duì)海量數(shù)據(jù)資源進(jìn)行深度分析、知識(shí)聚合、動(dòng)態(tài)呈現(xiàn),在人機(jī)物三元智慧融合中不斷增強(qiáng)檔案數(shù)據(jù)利用能力和服務(wù)能力【28】。數(shù)據(jù)挖掘與可視化。檔案數(shù)據(jù)挖掘,即從檔案數(shù)據(jù)中挖掘知識(shí)信息。大數(shù)據(jù)挖掘技術(shù)有效地解決了數(shù)據(jù)和知識(shí)之間的鴻溝,是將數(shù)據(jù)轉(zhuǎn)變?yōu)橹R(shí)的有效方式【29】。通過對(duì)類型多樣、來源廣泛的巨量檔案數(shù)據(jù)進(jìn)行格式轉(zhuǎn)化、語義分析、關(guān)聯(lián)聚合,深度挖掘檔案數(shù)據(jù)蘊(yùn)含的信息、知識(shí),將檔案數(shù)據(jù)隱性價(jià)值轉(zhuǎn)化為顯性價(jià)值,充分釋放檔案數(shù)據(jù)潛能。數(shù)據(jù)可視化技術(shù)是指運(yùn)用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)【3】。借助VR、AR、MR等數(shù)據(jù)可視化技術(shù),對(duì)檔案數(shù)據(jù)承載的知識(shí)信息以清晰明朗、高效直觀的方式進(jìn)行動(dòng)態(tài)表達(dá)、多維呈現(xiàn),發(fā)現(xiàn)檔案數(shù)據(jù)背后的洞見與規(guī)律,創(chuàng)新檔案服務(wù)方式,提高檔案資源利用效率。智能分析與智慧服務(wù)。人工智能涉及計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、心理學(xué)、倫理學(xué)、哲學(xué)、傳播學(xué)等不同領(lǐng)域,通過自然語言處理、語言圖像識(shí)別、模式識(shí)別、深度學(xué)習(xí)、機(jī)器神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、模擬算法、邏輯推理、智能聚合等技術(shù)方法,對(duì)人的意識(shí)、思維、行動(dòng)進(jìn)行仿真類比,探尋智能的實(shí)質(zhì),開拓人類智慧的全新空間。人工智能技術(shù)已應(yīng)用到數(shù)據(jù)管理與檔案管理中,在檔案數(shù)據(jù)化處理、智能分析、智慧服務(wù)等方面前景廣闊。借助語音識(shí)別、人臉識(shí)別、OCR識(shí)別、圖像分析、篇章分析、語義理解、加工計(jì)算、自動(dòng)標(biāo)引、自動(dòng)文摘、智能感知等技術(shù)方法,對(duì)紙質(zhì)檔案、照片檔案、音視頻檔案進(jìn)行識(shí)別分析、數(shù)據(jù)化處理、智能分類、編目著錄、劃控鑒定等,增強(qiáng)檔案數(shù)據(jù)智能采集、智能捕獲、智能處理、智能鑒定等智能化管理分析能力,提升檔案數(shù)據(jù)運(yùn)行效能。運(yùn)用智能化挖掘開發(fā)工具,開展檔案數(shù)據(jù)智能篩選、智能組配、智能推送、智能決策等服務(wù),拓展檔案數(shù)據(jù)智慧服務(wù)場(chǎng)景,發(fā)揮檔案數(shù)據(jù)在預(yù)測(cè)分析、決策支持、戰(zhàn)略咨詢等方面的作用。通過智能匹配、智能拓展、智能運(yùn)作等技術(shù)在檔案數(shù)據(jù)檢索中的應(yīng)用,提高檔案數(shù)據(jù)智慧檢索能力,提升檔案利用的精準(zhǔn)度和快捷性;依托智能網(wǎng)絡(luò)、智能交互、智能解讀和智能研判技術(shù),建立檔案數(shù)據(jù)智能利用咨詢系統(tǒng),實(shí)現(xiàn)檔案數(shù)據(jù)咨詢服務(wù)自動(dòng)篩選、自動(dòng)推理、自動(dòng)應(yīng)答;通過手機(jī)檔案館等智能服務(wù)平臺(tái),開展檔案數(shù)據(jù)菜單式、訂單式和一站式服務(wù),實(shí)現(xiàn)檔案信息個(gè)性化、特色化、便捷化服務(wù),隨時(shí)隨地方便用戶利用檔案數(shù)據(jù)資源【30】。數(shù)字人文與數(shù)字孿生。數(shù)字人文借助數(shù)字技術(shù)再現(xiàn)歷史記憶、編織數(shù)字記憶,檔案數(shù)據(jù)作為價(jià)值厚重的文化信息,為數(shù)字人文提供了豐富的人文資源【31】。通過對(duì)細(xì)粒度檔案數(shù)據(jù)進(jìn)行上下文識(shí)別、元數(shù)據(jù)標(biāo)注、要素提取、靜態(tài)關(guān)聯(lián)、動(dòng)態(tài)聚合、深度計(jì)算、語義重組、敘事化表現(xiàn)等,挖掘和串聯(lián)檔案數(shù)據(jù)知識(shí)單元,促進(jìn)檔案數(shù)據(jù)人文價(jià)值發(fā)揮。數(shù)字孿生是以數(shù)字化方式創(chuàng)建物理實(shí)體的虛擬模型,借助數(shù)據(jù)模擬物理實(shí)體在現(xiàn)實(shí)環(huán)境中的行為,通過虛實(shí)交互反饋、數(shù)據(jù)融合分析、決策迭代優(yōu)化等手段,為物理實(shí)體增加或擴(kuò)展新的能力【32】。數(shù)字孿生技術(shù)作為一種加速社會(huì)數(shù)字化轉(zhuǎn)型的綜合科技體系,對(duì)于推動(dòng)智慧檔案館資源數(shù)據(jù)化、提供數(shù)智服務(wù)、構(gòu)建智能運(yùn)作模式等具有重要意義【33】。數(shù)字孿生的基礎(chǔ)是數(shù)據(jù)和建模,從數(shù)據(jù)中挖掘知識(shí),以知識(shí)驅(qū)動(dòng)生產(chǎn)管控的自動(dòng)化、智能化,是數(shù)字孿生技術(shù)應(yīng)用研究的核心思想【34】。借助協(xié)同計(jì)算、虛實(shí)映射、技術(shù)迭代、系統(tǒng)交互、物聯(lián)感知、模擬仿真等技術(shù)方法,形成資源豐裕、準(zhǔn)確可靠、格式規(guī)范、傳輸穩(wěn)定的檔案孿生大數(shù)據(jù),構(gòu)建要素豐富、數(shù)據(jù)驅(qū)動(dòng)、交互映射、智能可控的智慧孿生檔案館,發(fā)揮連接物理世界和信息世界的橋梁和紐帶作用,形成與現(xiàn)實(shí)空間相互聯(lián)通、平行存在的檔案“元宇宙”,促進(jìn)檔案數(shù)據(jù)互聯(lián)互通和共建共享,提供更加實(shí)時(shí)、高效、智慧的檔案數(shù)據(jù)服務(wù)。知識(shí)組織與用戶畫像。知識(shí)組織是在信息組織的基礎(chǔ)上,研究知識(shí)的獲取、描述、整理、表達(dá)、控制、共享等整個(gè)知識(shí)組織過程的理論和方法,包括知識(shí)獲取、知識(shí)表達(dá)、知識(shí)處理和知識(shí)共享四部分重要內(nèi)容【35】。隨著信息技術(shù)發(fā)展和社會(huì)進(jìn)步,用戶信息素養(yǎng)不斷提升,知識(shí)需求日益增加,迫切需要提供檔案知識(shí)化服務(wù)。檔案部門需要以社會(huì)需求為導(dǎo)向,利用分詞標(biāo)引、自動(dòng)摘要、編碼分析、分類聚類、數(shù)據(jù)挖掘、語義網(wǎng)絡(luò)、超媒體等技術(shù)方法,對(duì)檔案數(shù)據(jù)資源進(jìn)行描述加工、整序優(yōu)化、集成處理、提煉開發(fā),挖掘蘊(yùn)含在檔案數(shù)據(jù)中的隱性知識(shí)單元,并對(duì)這些知識(shí)單元進(jìn)行整合、組織與管理,形成各類知識(shí)產(chǎn)品,促進(jìn)知識(shí)交流、知識(shí)傳播、知識(shí)共享、知識(shí)增值和知識(shí)再生產(chǎn),發(fā)揮檔案館的知識(shí)管理、知識(shí)開發(fā)、知識(shí)導(dǎo)航和知識(shí)創(chuàng)新功能,成為政府決策、科學(xué)研究、技術(shù)創(chuàng)新的重要知識(shí)庫。大數(shù)據(jù)時(shí)代充分挖掘發(fā)現(xiàn)用戶的偏好、特征、需求等全貌信息有助于提升檔案信息服務(wù)水平,而嵌入用戶畫像能精準(zhǔn)捕捉用戶信息、科學(xué)預(yù)測(cè)信息需求,為檔案館開展智能化檔案信息服務(wù)提供方向【36】。通過對(duì)用戶行為數(shù)據(jù)、網(wǎng)絡(luò)瀏覽數(shù)據(jù)、檔案利用統(tǒng)計(jì)數(shù)據(jù)等數(shù)據(jù)資源進(jìn)行清洗轉(zhuǎn)換、文本挖掘、標(biāo)簽抽取、分類描述、回歸分析、相似度測(cè)算、模型建構(gòu)等,在語義檢索分析和用戶行為理解的基礎(chǔ)上,建構(gòu)涵蓋基本屬性、行為特征、興趣愛好和社交網(wǎng)絡(luò)等內(nèi)容的檔案用戶畫像,掌握不同類型、不同群體的用戶興趣、習(xí)慣和利用需求,從而提供精準(zhǔn)檢索、自主推送、定點(diǎn)宣傳、知識(shí)決策等定制化、個(gè)性化服務(wù),改善用戶體驗(yàn),提升服務(wù)品質(zhì),拓展檔案數(shù)據(jù)服務(wù)空間。
參考文獻(xiàn)
1金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(4):29-37.
2黃子林.檔案信息資源開發(fā)[M].長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,1995.
3李紅.數(shù)據(jù)庫原理與應(yīng)用[M].北京:高等教育出版社,2003.
4[美]DAMA國(guó)際.DAMA數(shù)據(jù)管理知識(shí)體系指南[M].DAMA中國(guó)分會(huì)翻譯組,譯.北京:機(jī)械工業(yè)出版社,2020.
5金波,添志鵬.檔案數(shù)據(jù)內(nèi)涵與特征探析[J].檔案學(xué)通訊,2020(3):4-11.
6金波,晏秦.數(shù)據(jù)管理與檔案信息服務(wù)創(chuàng)新[J].檔案學(xué)研究,2017(6):99-104.
7李珂.提升檔案信息化發(fā)展水平實(shí)現(xiàn)遠(yuǎn)程利用社會(huì)共享——河南省數(shù)字檔案館建設(shè)概述[N].中國(guó)檔案報(bào),2020-06-11(001).
8李明華.關(guān)于建立國(guó)家電子檔案戰(zhàn)略備份中心的提案[J].中國(guó)檔案,2022(3):20.
9羅軍.我國(guó)檔案管理體制改革研究[J].檔案學(xué)通訊,2009(5):46-49.
10鄭鷗.加強(qiáng)檔案信息資源整合勢(shì)在必行[J].上海檔案,2006(5):22-25.
12許茵.國(guó)家重點(diǎn)檔案文件級(jí)目錄題名著錄問題探析——以全國(guó)民國(guó)檔案文件級(jí)目錄著錄為例[J].檔案學(xué)研究,2018(6):59-63.
13倪代川,金波.論數(shù)字檔案資源數(shù)據(jù)化發(fā)展[J].檔案學(xué)研究,2021(5):17-22.
14宗威,吳鋒.大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013(5):38-43.
15周俊.以整體智治消除基層“數(shù)據(jù)孤島”[J].國(guó)家治理,2020(30):24-26.
作者:金波 楊鵬 邢慧 單位:上海大學(xué)文化遺產(chǎn)與信息管理學(xué)院 中國(guó)船舶工業(yè)集團(tuán)公司