国产欧美日韩一区二区国内-日韩 国产 欧美 三级-日韩欧美国产一区二区三区在线-一区二区三区国产日韩欧美在线

當前位置: 首頁?信息動態(tài) ?行業(yè)動態(tài)
淺談檔案數(shù)字化加工有著怎樣的流程呢?
來源:m.lheraulttraitlibre.com 發(fā)布時間:2019年03月21日

  一、術(shù)語和定義

  1、數(shù)字化

  用計算機技術(shù)將模擬信號轉(zhuǎn)化為數(shù)字信號的處理進程。

  2、紙質(zhì)檔案數(shù)字化

  選用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機辨認的數(shù)字圖畫或數(shù)字文本的處理進程。

  3、數(shù)字圖畫

  表明什物圖畫的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖畫發(fā)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——連續(xù)函數(shù),并在采樣點大將值最小化后的陣列。

  4、是非二值圖畫

  只要是非兩級灰度的數(shù)字圖畫。它對應于是非兩種狀態(tài)的文字稿、線條圖等。

  5、連續(xù)顏色靜態(tài)圖畫

  以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖畫。在紙質(zhì)檔案數(shù)字化進程中,通常表現(xiàn)為灰度掃描和五顏六色掃描兩種方法。

  6、分辨率

  單位長度內(nèi)圖畫包含的點數(shù)或像素數(shù),一般用每英時點數(shù)(dpi)表明。

  7、失真度

  對檔案進行數(shù)字化轉(zhuǎn)化后,數(shù)字圖畫與檔案原件在顏色、幾許等方面的偏離程度。

  8、可懂度

  數(shù)字圖畫向人或機器提供信息的能力。

  9、圖畫緊縮

  清除圖畫冗余或圖畫近似的任一種進程,其目的是對圖畫以更緊湊的方法表明。

  二、紙質(zhì)檔案數(shù)字化根本要求

  1、根本原則

  紙質(zhì)檔案數(shù)字化的根本原則是使檔案信息資源精確方便快捷地提供使用,使能夠揭露的檔案信息資源得到共享,以滿意社會對檔案使用的需求。

  2、數(shù)字化對像的確認原則

  應當對所要進行數(shù)字化的對象依照必定的原則和辦法進行確認,只要契合必定要求的紙質(zhì)檔案文獻才能進行數(shù)字化。

  1)契合國家法律法規(guī)的原則

  紙質(zhì)檔案的數(shù)字化,必須契合國家檔案敞開規(guī)定以及有關(guān)規(guī)定。

  2)價值性原則

  屬于歸檔范圍且應永久或長時間保存的、社會使用價值高的檔案可列入數(shù)字化加工的范圍。

  3、根本環(huán)節(jié)

  紙質(zhì)檔案數(shù)字化的根本環(huán)節(jié)首要包含:檔案收拾、目錄建庫、檔案掃描、圖畫處理、圖畫存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)檢驗、數(shù)據(jù)備份、效果辦理等。

  4、 進程辦理

  1)應加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密辦理機制,保證檔案原件和數(shù)字化檔案信息的安全。

  2 )紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均應進行詳細的掛號,并及時收拾、匯總,裝訂成冊,在數(shù)字化工作完結(jié)的同時樹立起完整、標準的記載。

  三、檔案收拾

  在掃描之前,根據(jù)檔案辦理狀況,按下述進程對檔案進行恰當收拾,并視需要作出標識,保證檔案數(shù)字化質(zhì)量。

  1 目錄數(shù)據(jù)預備

  2 拆除裝訂

  3 區(qū)分掃描件和非掃描件

  4 頁面修整

  5 檔案收拾掛號

  6 裝訂

  四、檔案掃描

  1、掃描方法

  1)根據(jù)檔案幅面的大小(A4、A3、A0等)挑選相應規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可選用0號圖紙掃描儀)進行掃描。大幅面檔案可選用大幅面數(shù)碼平臺,或者縮微拍照后的膠片數(shù)字化轉(zhuǎn)化設(shè)備等進行掃描,也能夠選用小幅面掃描后的圖畫拼接方法處理。

  2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應選用平板掃描方法;紙張狀況好的檔案可選用高速掃描方法以進步工作效率。

  2、掃描顏色方法

  1)掃描顏色方法一般有是非二值、灰度、五顏六色等。通常選用是非二值。

  2)頁面為是非兩色,而且筆跡明晰、不帶插圖的檔案,可選用是非二值方法進行掃描。

  3)頁面為是非兩色,但筆跡明晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可選用灰度方法掃描。

  4)頁面中有紅頭、印章或插有是非照片、五顏六色照片、五顏六色插圖的檔案,可視需要選用五顏六色方法進行掃描。

  3 、掃描分辨率

  1)掃描分辨率參數(shù)大小的挑選,原則上以掃描后的圖畫明晰、完整、不影響圖畫的使用效果為準。

  2)選用是非二值、灰度、五顏六色幾種方法對檔案進行掃描時,其分辨率一般均建議挑選≥100dpi.特殊狀況下,如文字偏小、密集、明晰度較差等,可恰當進步分辨率。

  3)需要進行OCR漢字辨認的檔案,掃描分辨率建議挑選≥200dpi.

  4、掃描登掛號

  仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,掛號掃描的頁數(shù),核對每份文件的實踐掃描頁數(shù)與檔案收拾量填寫的文件頁數(shù)是否共同,不共同時應注明詳細原因和處理辦法。

  五、圖畫處理

  1 、圖畫數(shù)據(jù)質(zhì)量查看

  1)對圖畫偏斜度、明晰度、失真度進行查看。發(fā)現(xiàn)不契合圖畫質(zhì)量要求時,應從頭進行圖畫的處理。

  2)由于操作不妥,構(gòu)成掃描的圖畫文件不完整或無法明晰辨認時,應從頭掃描。

  3)發(fā)現(xiàn)文件漏掃時,應及時補掃并正確刺進圖畫。

  4)發(fā)現(xiàn)掃描圖畫的排列次序與檔案原件不共同時,應及時進行調(diào)整。

  5)仔細填寫相關(guān)表單,記載質(zhì)檢成果和處理意見。

  2、糾偏

  對呈現(xiàn)偏斜的圖畫應進行糾偏處理,以到達視覺上根本不感覺偏斜為準。對方向不正確的圖畫應進行旋轉(zhuǎn)還原,以契合閱讀習慣。

  3、去污

  對圖畫頁面中呈現(xiàn)的影響圖畫質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應進行去污處理。處理進程中應遵循在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。

  4、圖畫拼接

  對大幅面檔案進行分區(qū)掃描構(gòu)成的多幅圖畫,應進行拼接處理,合并為一個完整的圖畫,以保證檔案數(shù)字化圖畫的整體性。

  5、裁邊處理

  選用五顏六色方法掃描的圖畫應進行裁邊處理,去除多余的白邊,以有用縮小圖畫文件的容量,節(jié)省存儲空間。

  六、圖畫存儲

  1、存儲格局

  1)選用是非二值方法掃描的圖畫文件,一般選用TIFF(G4)格局存儲。選用灰度方法和五顏六色方法掃描的文件,一般選用JPEG格局存儲。存儲時的緊縮率的挑選,應以保證掃描的圖畫明晰可讀的前提下,盡量減小存儲容量為原則。

  2)提供網(wǎng)絡(luò)查詢的掃描圖畫,也可存儲為CEB、PDF或其他格局。

  2、圖畫文件的命名

  1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖畫文件命名。

  2)多頁文件可選用該檔號樹立相應文件夾,按頁碼次序?qū)D畫文件命名。

  七、目錄建庫

  1、數(shù)據(jù)格局挑選

  目錄建庫應挑選通用的數(shù)據(jù)格局。所選定的數(shù)據(jù)格局應能直接或間接經(jīng)過XML文檔進行數(shù)據(jù)交換。

  2、檔案著錄

  依照《檔案著錄規(guī)則》(DA/T18)的要求進行著錄,樹立檔案目錄數(shù)據(jù)庫。

  3、目錄數(shù)據(jù)質(zhì)量查看

  選用人工校對或軟件主動校對的方法,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行查看。核對著錄項目是否完整、著錄內(nèi)容是否標準、精確,發(fā)現(xiàn)不合格的數(shù)據(jù)應要求進行修正或重錄。

  八、數(shù)據(jù)掛接

  1、匯總掛接

  檔案數(shù)字化轉(zhuǎn)化進程中構(gòu)成的目錄數(shù)據(jù)庫與圖畫數(shù)據(jù)庫,經(jīng)過質(zhì)檢環(huán)節(jié)確認為“合格”后,經(jīng)過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。經(jīng)過編制程序或借助相應軟件,可完成目錄數(shù)據(jù)對相相關(guān)的數(shù)字圖象的主動搜索、參加對應的電子地址信息等,完成批量、快速掛接。

  2、數(shù)據(jù)相關(guān)

  以紙質(zhì)檔案目錄數(shù)據(jù)庫為根據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖畫存儲為一份圖畫文件。將圖畫文件存儲到相應文件夾時,要仔細核對每一份圖象文件的稱號與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖畫文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否共同,圖畫文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。經(jīng)過每一份圖畫文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的共同性和唯一性,樹立起一一對應的相關(guān)關(guān)系,為完成檔案目錄數(shù)據(jù)庫與圖畫文件的批量掛接提供條件。

  3、仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,記載數(shù)據(jù)相關(guān)后的頁數(shù),核對每一份文件相關(guān)后的頁數(shù)與檔案收拾、掃描時填寫的頁數(shù)是否共同,不共同時應注明詳細原因和處理辦法。

  九、數(shù)據(jù)檢驗

  1、數(shù)據(jù)抽檢

  1)以抽檢的方法查看已完結(jié)數(shù)字化轉(zhuǎn)化的一切數(shù)據(jù),包含目錄數(shù)據(jù)庫、圖畫文件及數(shù)據(jù)掛接的總體質(zhì)量。

  2)一個全宗的檔案,數(shù)據(jù)檢驗時抽檢的比率不得低于5%.

  2、檢驗目標

  1)目錄數(shù)據(jù)庫與圖畫文件掛接過錯碼,或目錄數(shù)據(jù)庫、圖畫文件之一呈現(xiàn)不完整、不明晰、有過錯等質(zhì)量問題時,抽檢標記為“不合格”。

  2)一個全宗的檔案,數(shù)字化轉(zhuǎn)化質(zhì)量抽檢的合格率到達95%以上(含95%)時,給予以檢驗“經(jīng)過”。

  合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%

  3、檢驗審閱

  檢驗“經(jīng)過”的結(jié)論,必須經(jīng)分管領(lǐng)導審閱、簽字后方有用。

  4、檢驗掛號

  仔細填寫紙質(zhì)檔案數(shù)字化檢驗掛號表單。

相關(guān)文章