国产欧美日韩一区二区国内-日韩 国产 欧美 三级-日韩欧美国产一区二区三区在线-一区二区三区国产日韩欧美在线

當(dāng)前位置: 首頁?信息動態(tài) ?行業(yè)動態(tài)
檔案數(shù)字化加工的基本工作流程
來源:m.lheraulttraitlibre.com 發(fā)布時間:2021年12月02日
  檔案數(shù)字化加工基本工作流程檔案數(shù)字化方案。

  一、術(shù)語及定義。

  1.數(shù)字化

  模擬信號通過計算機(jī)技術(shù)轉(zhuǎn)換為數(shù)字信號的處理過程。

  2.紙質(zhì)檔案數(shù)字化。

  使用掃描儀或數(shù)碼相機(jī)等數(shù)碼設(shè)備對紙質(zhì)文件進(jìn)行數(shù)字處理,并將其轉(zhuǎn)換為存儲在磁帶、磁盤、光盤等載體上并能被計算機(jī)識別的數(shù)字圖像或數(shù)字文本的處理過程。

  3.數(shù)字圖像。

  整數(shù)陣列表示實物圖像。采樣和量化的二維或更高維函數(shù)由相同維數(shù)的連續(xù)圖像產(chǎn)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣-連續(xù)函數(shù),并在采樣點上小化值的陣列。

  4.黑白二值圖像。

  只有黑白兩級灰度的數(shù)字圖像。對應(yīng)黑白兩種狀態(tài)的文字稿、線條圖等。

  5.連續(xù)色調(diào)靜態(tài)圖像。

  靜態(tài)數(shù)字圖像由不同的層次或不同的顏色通道組成,具有超過兩級灰度。在紙質(zhì)文件的數(shù)字化過程中,通常表現(xiàn)為灰度掃描和彩色掃描。

  6.分辨率

  圖像在單位長度中包含的點數(shù)或像素數(shù)一般用每英時點數(shù)(dpi)表示。

  7.失真度

  數(shù)字化轉(zhuǎn)換檔案后,數(shù)字圖像與原始檔案在顏色、幾何等方面的偏差程度。

  8.可懂度

  向人或機(jī)器提供數(shù)字圖像信息的能力。

  9.圖像壓縮。

  任何清除圖像冗余或圖像近似的過程的目的都是以更緊湊的形式表示圖像。

  二、紙質(zhì)檔案數(shù)字化的基本要求。

  1.基本原則。

  紙質(zhì)檔案數(shù)字化的基本原則是準(zhǔn)確、方便、快捷地提供和利用檔案信息資源,共享公共檔案信息資源,滿足社會對檔案利用的需求。

  2.確定數(shù)字對像的原則。

  按照一定的原則和方法確認(rèn)要數(shù)字化的對象,只有符合一定要求的紙質(zhì)文件才能數(shù)字化。

  符合國家法律法規(guī)的原則。

  紙質(zhì)檔案的數(shù)字化必須符合國家檔案開放和有關(guān)規(guī)定。

  2)價值原則。

  屬于歸檔范圍,應(yīng)永久或長期保存的。社會利用價值高的檔案可以納入數(shù)字加工范圍。

  3.基本環(huán)節(jié)。

  紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié)主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數(shù)據(jù)質(zhì)量檢驗、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。

  4.過程管理。

  1)加強(qiáng)紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密管理機(jī)制,確保原始檔案和數(shù)字檔案信息的安全。

  2)紙質(zhì)檔案數(shù)字化的每一個環(huán)節(jié)都要詳細(xì)登記,及時整理、匯總、裝訂成冊,在完成數(shù)字化工作的同時建立完整、規(guī)范的記錄。

  三、檔案整理。

  掃描前,根據(jù)檔案管理情況,按照以下步驟對檔案進(jìn)行適當(dāng)整理,并根據(jù)需要進(jìn)行標(biāo)識,確保檔案數(shù)字化質(zhì)量。

  1.準(zhǔn)備目錄數(shù)據(jù)。

  2.拆除裝訂。

  3.區(qū)分掃描件和非掃描件。

  4.頁面修整。

  5.檔案整理登記。

  6.裝訂

  四、檔案掃描。

  1.掃描方式。

  1)根據(jù)檔案幅面大小(A4.A3.A0等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號圖紙掃描儀)進(jìn)行掃描。大幅面文件可以通過大幅面數(shù)字平臺掃描,也可以通過縮微拍攝后的膠片數(shù)字轉(zhuǎn)換設(shè)備掃描,也可以通過小幅面掃描后的圖像拼接處理。

  2)紙張條件差、太薄、太軟或太厚的文件應(yīng)采用平板掃描;紙張條件好的文件可以高速掃描,以提高工作效率。

  2.掃描顏色模式。

  1)掃描色彩模式一般有黑白二值、灰度、色彩等。通常使用黑白二值。

  2)頁面為黑白,字跡清晰。沒有插圖的文件可以通過黑白二值模式掃描。

  3)頁面為黑白,但字跡清晰度差或帶插圖的文件,頁面為多色文字的文件可以通過灰度模式掃描。

  4)頁面上有紅頭、印章或黑白照片、彩色照片、彩色插圖文件,可視需采用彩色模式掃描。

  3.掃描分辨率。

  1)掃描分辨率參數(shù)大小的選擇原則上以掃描后的圖像清晰、完整、不影響圖像利用效果為準(zhǔn)。

  2)掃描文件采用黑白二值、灰度、彩色模式時,一般建議分辨率≥100dpi。特殊情況下,如文字小、密集、清晰度差,可適當(dāng)提高分辨率。

  3)需要OCR漢字識別的文件,建議掃描分辨率≥200dpi.

  4.掃描登記。

  認(rèn)真填寫紙質(zhì)文件數(shù)字化轉(zhuǎn)換過程交接登記表,登記掃描頁數(shù),檢查每份文件的實際掃描頁數(shù)是否與文件整理數(shù)量填寫的文件頁數(shù)一致并注明具體原因和處理方法。

  五、圖像處理。

  1.圖像數(shù)據(jù)質(zhì)量檢查。

  1)檢查圖像偏斜度、清晰度和失真度。發(fā)現(xiàn)不符合圖像質(zhì)量要求時,應(yīng)重新處理圖像。

  2)由于操作不當(dāng),掃描的圖像文件不完整或無法清晰識別時,應(yīng)重新掃描。

  3)發(fā)現(xiàn)文件漏掃時,應(yīng)及時清理并正確插入圖像。

  4)掃描圖像的排列順序與原始文件不一致時,應(yīng)及時調(diào)整。

  5)認(rèn)真填寫相關(guān)表格,記錄質(zhì)檢結(jié)果和處理意見。

  2.糾偏

  偏差圖像應(yīng)進(jìn)行糾偏處理,以實現(xiàn)基本的視覺偏差。旋轉(zhuǎn)還原方向不正確的圖像,符合閱讀習(xí)慣。

  3.去污

  影響圖像頁面圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等行去污。在處理過程中,應(yīng)遵循在不影響可理解度的情況下顯示檔案原貌的原則。

  4.圖像拼接。

  對大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像,應(yīng)進(jìn)行拼接處理,合并成完整的圖像,以保證檔案數(shù)字圖像的完整性。

  5.切邊處理。

  采用彩色模式掃描的圖像應(yīng)進(jìn)行切邊處理,去除多余的白邊,有效降低圖像文件的容量,節(jié)省存儲空間。

  六、圖像存儲。

  1.存儲格式。

  圖像文件采用黑白二值模式掃描,一般采用TIFF(G4)格式存儲。掃描灰度模式和彩色模式的文件通常以JPEG格式存儲。在保證掃描圖像清晰可讀的前提下,應(yīng)盡量減少存儲容量。

  提供網(wǎng)絡(luò)查詢的掃描圖像也可以存儲在CEB.PDF或其他格式中。

  2.圖像文件的命名。

  1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每個文件都有一個相應(yīng)的檔號,以掃描后的圖像文件命名。

  2)多頁文件可以使用該文件編號建立相應(yīng)的文件夾,并根據(jù)頁碼順序命名圖像文件。

  七、目錄建庫。

  1.選擇數(shù)據(jù)格式。

  目錄建庫應(yīng)選擇一般的數(shù)據(jù)格式。選定的數(shù)據(jù)格式應(yīng)通過XML文檔直接或間接交換。

  二、檔案著錄。

  按照《檔案著錄規(guī)則》(DA/T18)的要求,建立檔案目錄數(shù)據(jù)庫。

  3.目錄數(shù)據(jù)質(zhì)量檢查。

  采用人工校對或軟件自動校對的方式,檢查目錄數(shù)據(jù)庫建庫質(zhì)量。檢查記錄項目是否完整。記錄內(nèi)容是否規(guī)范、準(zhǔn)確,應(yīng)修改或重錄不合格數(shù)據(jù)。

  八、數(shù)據(jù)掛接

  1、匯總掛接

  檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認(rèn)為“合格”后,通過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。通過編制程序或借助相應(yīng)軟件,可實現(xiàn)目錄數(shù)據(jù)對相關(guān)聯(lián)的數(shù)字圖象的自動搜索、加入對應(yīng)的電子地址信息等,實現(xiàn)批量、快速掛接。

  2、數(shù)據(jù)關(guān)聯(lián)

  以紙質(zhì)檔案目錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應(yīng)文件夾時,要認(rèn)真核查每一份圖象文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的一致性,建立起一一對應(yīng)的關(guān)聯(lián)關(guān)系,為實現(xiàn)檔案目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。

  3、認(rèn)真填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過程交接登記表單,記錄數(shù)據(jù)關(guān)聯(lián)后的頁數(shù),核對每一份文件關(guān)聯(lián)后的頁數(shù)與檔案整理、掃描時填寫的頁數(shù)是否一致,不一致時應(yīng)注明具體原因和處理辦法。

  九、數(shù)據(jù)驗收

  1、數(shù)據(jù)抽檢

  1)以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括目錄數(shù)據(jù)庫、圖像文件及數(shù)據(jù)掛接的總體質(zhì)量。

  2)一個全宗的檔案,數(shù)據(jù)驗收時抽檢的比率不得低于5%.

  2、驗收指標(biāo)

  1)目錄數(shù)據(jù)庫與圖像文件掛接錯誤碼,或目錄數(shù)據(jù)庫、圖像文件之一出現(xiàn)不完整、不清晰、有錯誤等質(zhì)量問題時,抽檢標(biāo)記為“不合格”。

  2)一個全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達(dá)到95%以上(含95%)時,給予以驗收“通過”。

  合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%

  3、驗收審核

  驗收“通過”的結(jié)論,必須經(jīng)分管領(lǐng)導(dǎo)審核、簽字后方有效。

  4、驗收登記

  認(rèn)真填寫紙質(zhì)檔案數(shù)字化驗收登記表單。

  十、數(shù)據(jù)備份

  1、備份范圍

  經(jīng)驗收合格的完整數(shù)據(jù)應(yīng)及時進(jìn)行備份。

  2、備份方式

  為保證數(shù)據(jù)安全,備份載體的選擇應(yīng)多樣化,可采用在線、離線相結(jié)合的方式實現(xiàn)多套備份,并注意異地保存。

  3、數(shù)據(jù)檢驗

  備份數(shù)據(jù)也應(yīng)進(jìn)行檢驗。備份數(shù)據(jù)的檢驗的內(nèi)容主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文件數(shù)量是否準(zhǔn)確等。

  4、備份標(biāo)簽

  數(shù)據(jù)備份后應(yīng)相應(yīng)的備份介質(zhì)上做好標(biāo)簽,以便查找和管理。

  5、備份登記

  填寫紙質(zhì)檔案數(shù)字化備份管理登記表單。

  十一、數(shù)字化成果管理

  1、應(yīng)加強(qiáng)對紙質(zhì)檔案數(shù)字化成果的管理,確保其安全、完整和長期可用。

相關(guān)文章