- 相關(guān)推薦
電子文件元數(shù)據(jù)自動(dòng)采集的原則和實(shí)施路徑研究論文
本文系“電子文件元數(shù)據(jù)自動(dòng)采集與智能分析實(shí)證研究”的項(xiàng)目成果。通過(guò)探討理論架構(gòu)并系統(tǒng)實(shí)施電子文件元數(shù)據(jù)自動(dòng)采集,實(shí)現(xiàn)標(biāo)準(zhǔn)化、自動(dòng)化管理,全面提升機(jī)構(gòu)電子文件管理水平,同時(shí)為電子文件內(nèi)容信息智能分析奠定基礎(chǔ);通過(guò)智能分析研究,充分挖掘隱含在電子文件內(nèi)容信息中的知識(shí)關(guān)聯(lián),深度開(kāi)發(fā),支持決策。
一、元數(shù)據(jù)自動(dòng)采集需求分析
元數(shù)據(jù)是描述文件背景、內(nèi)容、結(jié)構(gòu)及其整個(gè)管理過(guò)程的數(shù)據(jù)。不同于傳統(tǒng)意義上的著錄,元數(shù)據(jù)內(nèi)涵更豐富,功能更全面,要求更嚴(yán)格,不可能由檔案管理人員在文件歸檔后進(jìn)行著錄,更不可能由形成機(jī)構(gòu)文件管理人員或業(yè)務(wù)人員手工錄入。元數(shù)據(jù)需要全程規(guī)劃,需要嵌入系統(tǒng),需要實(shí)時(shí)自動(dòng)采集,需要真實(shí)、動(dòng)態(tài)地再現(xiàn)電子文件管理的背景信息及過(guò)程信息。實(shí)現(xiàn)元數(shù)據(jù)自動(dòng)采集,是元數(shù)據(jù)自身管理的要求,也是形成機(jī)構(gòu)實(shí)際業(yè)務(wù)的需求。
(1)元數(shù)據(jù)管理要求
國(guó)際標(biāo)準(zhǔn)《信息與文獻(xiàn)電子辦公環(huán)境中文件管理原則與功能要求》(ISO 16175 1-3)一再?gòu)?qiáng)調(diào),文件管理元數(shù)據(jù)(metadata)包括“識(shí)別、認(rèn)證文件和文件背景關(guān)聯(lián)等信息以及生成、管理、維護(hù)和使用文件的人員、流程和系統(tǒng)的信息,文件管理政策”。只有伴有界定了關(guān)鍵特征元數(shù)據(jù)的文件才是真實(shí)有效的文件,這些特征必須被清晰地記錄下來(lái)。元數(shù)據(jù)在文件捕獲點(diǎn)上對(duì)文件進(jìn)行詳細(xì)說(shuō)明,固化文件與其業(yè)務(wù)背景的關(guān)聯(lián),對(duì)文件實(shí)施管理控制。在整個(gè)生命周期中,新的元數(shù)據(jù)不斷伴隨業(yè)務(wù)的開(kāi)展、提供利用而持續(xù)增加,以長(zhǎng)期保證真實(shí)性、完整性、可靠性、可用性,使得對(duì)文件的管理成為可能。
在電子文件管理系統(tǒng)中必須實(shí)現(xiàn)元數(shù)據(jù)的有效管理。電子文件管理系統(tǒng)(ERMS)作為專(zhuān)門(mén)用于對(duì)文件的維護(hù)和處置予以管理的系統(tǒng),具有如下屬性:在背景中生成文件;管理和維護(hù)文件;依據(jù)要求的時(shí)間長(zhǎng)度維護(hù)文件;文件管理元數(shù)據(jù)要可以設(shè)定。
作為描述文件背景、內(nèi)容、結(jié)構(gòu)及其整個(gè)管理過(guò)程的數(shù)據(jù),元數(shù)據(jù)最大的特征是動(dòng)態(tài)性,動(dòng)態(tài)地再現(xiàn)文件生成、流轉(zhuǎn)、管理的全過(guò)程,在整個(gè)生命周期中為電子文件(包括由此轉(zhuǎn)化而成的電子檔案)的真實(shí)、完整、可靠、可用保駕護(hù)航。元數(shù)據(jù)的重要價(jià)值在于還原文件的背景信息,反映其所生成的政策法規(guī)和技術(shù)環(huán)境,顯示與其他文件以及業(yè)務(wù)行為責(zé)任者等的各種關(guān)系,克服電子文件虛擬存在的局限?梢(jiàn),元數(shù)據(jù)記錄和反映的這些錯(cuò)綜復(fù)雜、動(dòng)態(tài)變化的信息已經(jīng)無(wú)法僅僅依靠手工進(jìn)行記錄,必須嵌入系統(tǒng),由系統(tǒng)自動(dòng)判斷、計(jì)算與識(shí)別,實(shí)現(xiàn)系統(tǒng)自動(dòng)采集元數(shù)據(jù)是元數(shù)據(jù)自身管理的要求。
(2)機(jī)構(gòu)業(yè)務(wù)需求
電子文件的特點(diǎn)決定了對(duì)元數(shù)據(jù)的采集必須前置,由前端形成機(jī)構(gòu)伴隨業(yè)務(wù)活動(dòng)的開(kāi)展和其間文件的形成進(jìn)行采集與管理。《文書(shū)類(lèi)電子文件元數(shù)據(jù)方案》(以下簡(jiǎn)稱(chēng)《元數(shù)據(jù)方案》)給出了88項(xiàng)元數(shù)據(jù)元素,其中80%需要形成機(jī)構(gòu)進(jìn)行采集,而且過(guò)程性元數(shù)據(jù)需要反復(fù)著錄,側(cè)重記錄電子文件生成的技術(shù)環(huán)境與業(yè)務(wù)過(guò)程信息,所涉問(wèn)題難度大且較復(fù)雜。特別是《元數(shù)據(jù)方案》中規(guī)定的一些元數(shù)據(jù)項(xiàng)存在“宏觀(guān)”或“籠統(tǒng)”的情況,比如元數(shù)據(jù)中“日期”項(xiàng),如不結(jié)合文件生成、運(yùn)轉(zhuǎn)、處置的流程予以細(xì)化,則無(wú)法確定采集節(jié)點(diǎn)和采集方式;僅從文件生成流程來(lái)看,面臨著起草、會(huì)商、審核、簽發(fā)等諸多“日期”,哪些日期最為關(guān)鍵、哪些應(yīng)作為元數(shù)據(jù)予以采集、在文件生命周期中是否重復(fù)元數(shù)據(jù)以及如何采集等,都需要結(jié)合機(jī)構(gòu)業(yè)務(wù)流程和相關(guān)規(guī)范深入研究,并實(shí)施精細(xì)化管理。對(duì)文件形成機(jī)構(gòu)(即業(yè)務(wù)機(jī)構(gòu))而言,因?yàn)樵獢?shù)據(jù)管理而徒增繁重手工著錄工作量,造成人力物力財(cái)力的巨大浪費(fèi),進(jìn)而影響機(jī)構(gòu)工作效率與績(jī)效。需要指出的是,元數(shù)據(jù)并不是獨(dú)立的,而是與機(jī)構(gòu)自身電子文件管理基礎(chǔ)密不可分。沒(méi)有科學(xué)的電子文件、檔案一體化全程管理流程,沒(méi)有完備的電子文件元數(shù)據(jù)管理功能要求,便無(wú)法構(gòu)建完善的元數(shù)據(jù)管理方案。因此,本文的研究?jī)?nèi)容是綜合性的,從狹義來(lái)講是電子公文元數(shù)據(jù)自動(dòng)采集方案;從廣義來(lái)講是機(jī)構(gòu)電子文件管理方案。
二、元數(shù)據(jù)自動(dòng)采集原則
(1)基于檔案管理的基本原則
1.來(lái)源原則。元數(shù)據(jù)采集雖然通過(guò)對(duì)電子文件信息加以采集、提煉、分析和組織,揭示文件、檔案的內(nèi)容及其產(chǎn)生規(guī)律,但是仍然以尊重檔案的本質(zhì)屬性和規(guī)律為前提,在采集時(shí)注重體現(xiàn)電子文件來(lái)源,使機(jī)構(gòu)中同一來(lái)源的電子文件通過(guò)元數(shù)據(jù)采集得到集中反映,使元數(shù)據(jù)與檔案的來(lái)源相聯(lián)系,以此通過(guò)元數(shù)據(jù)揭示同一來(lái)源的檔案、文件之間的各種聯(lián)系,為檔案、文件的理解與利用提供來(lái)源方面的背景信息。
2.有機(jī)聯(lián)系原則。有機(jī)聯(lián)系原則也是檔案管理的基本原則,是指系統(tǒng)中文件及組成系統(tǒng)的諸要素之間需保持時(shí)空上的相互聯(lián)系。由于電子文件是以二進(jìn)制代碼的形式分散存在于計(jì)算機(jī)之中,因此保持文件之間的有機(jī)聯(lián)系顯得尤為重要,而要保持這種有機(jī)聯(lián)系,必須依賴(lài)于元數(shù)據(jù)。以此原則為導(dǎo)向的元數(shù)據(jù)采集實(shí)質(zhì)上就是電子文件信息的系統(tǒng)化增值過(guò)程,其目的是把分散的文件信息轉(zhuǎn)化為互相聯(lián)系、系統(tǒng)的信息流,形成文秘站-您的專(zhuān)屬秘書(shū)!更高級(jí)的信息產(chǎn)品,滿(mǎn)足用戶(hù)的特定利用需求。通過(guò)元數(shù)據(jù)采集與管理過(guò)程,使大量文件特征信息加以系統(tǒng)化和組織化,有效控制檔案、文件信息揭示的數(shù)量和質(zhì)量,克服檔案、文件查詢(xún)和利用的困難,提高檢索效率,節(jié)省查詢(xún)成本和精力耗費(fèi),實(shí)現(xiàn)價(jià)值增益。
(2)基于電子文件管理的原則
1.前端控制原則。就元數(shù)據(jù)采集來(lái)說(shuō),在已經(jīng)建立了電子文件管理系統(tǒng)的機(jī)構(gòu),電子文件在系統(tǒng)中生成、運(yùn)轉(zhuǎn),電子文件元數(shù)據(jù)采集的前端“超前”至系統(tǒng)的設(shè)計(jì)階段,前端控制的形式也部分轉(zhuǎn)移到系統(tǒng)功能的設(shè)計(jì)之中,即盡可能地把文件生命周期各個(gè)階段的元數(shù)據(jù)需求設(shè)計(jì)在系統(tǒng)之中,以功能合理的OA系統(tǒng)作為管好電子文件的先決條件。
【電子文件元數(shù)據(jù)自動(dòng)采集的原則和實(shí)施路徑研究論文】相關(guān)文章:
淺談自動(dòng)觀(guān)測(cè)數(shù)據(jù)文件的預(yù)審04-26
淺談自動(dòng)觀(guān)測(cè)數(shù)據(jù)文件的預(yù)審04-29
大數(shù)據(jù)環(huán)境下的電子商務(wù)安全研究論文12-14
道路縱橫斷面測(cè)量數(shù)據(jù)的半自動(dòng)采集方法04-28
制藥企業(yè)生產(chǎn)過(guò)程的數(shù)據(jù)采集及電子記錄系統(tǒng)04-30
金屬切削數(shù)據(jù)采集05-02