海南茄撑信息科技有限公司

null
null
null
您的位置:數(shù)字音視網(wǎng)/招標公告/詳細

山西省長治市圖書館數(shù)字圖書館資源建設(shè)變更公告

2018-11-27 來源:山西長治市人民政府采購

長政采[2018]JZTP-C1-2數(shù)字圖書館資源建設(shè)項目,由于采購人調(diào)整采購需求,原報價時間變更為2018年11月27日。

2018年11月21日

變更后需求如下

數(shù)字圖書館資源建設(shè)

A、數(shù)字圖書館資源建設(shè)之地方圖書數(shù)字化全文識別加工

資源數(shù)字化數(shù)量:20000頁

1、元數(shù)據(jù)加工標準

1.1規(guī)范性引用文件

下列文件對于本規(guī)則的應(yīng)用是必不可少的。

《中國文獻編目規(guī)則》(第二版)

《GB/T25100-2010 信息與文獻 都柏林核心元數(shù)據(jù)》

《信息資源的內(nèi)容形式和媒體類型標識》(GB/T3469-2013)

1.2著錄對象

以數(shù)字化文獻為著錄對象。一般以具有獨立名稱、并可獨立使用的一個數(shù)字資源為著錄單位。

圖書的著錄單位為一種圖書。對于多部分資源,一般可自由選擇綜合著錄或分散著錄。

1.3著錄信息源

著錄信息源是資源本身。資源本身是著錄的首選來源。資源本身信息不足,可參考其他信息源。

1.4著錄用文字

題名、責任者等取自資源本身的信息一般按資源本身的文字著錄。

由編目員進行描述或標引的信息均采用簡體中文著錄。

有規(guī)范或規(guī)定編碼標準的要求按標準著錄,如:語種、中圖分類。

日期用阿拉伯數(shù)字著錄。

推薦采用ISBD著錄標識符。

一個著錄項中多個著錄內(nèi)容之間以半角分號分隔。

1.5元數(shù)據(jù)著錄簡表

必備項為:加工編號、正題名、中圖分類、主題詞或關(guān)鍵詞、摘要、內(nèi)容形式、媒體類型、格式、頁碼、語種、適用對象、CDOI、數(shù)據(jù)提交單位、所屬任務(wù)年份,共計13項;有則必備項為:其它提名、責任者名稱、責任方式、附注、出版者名稱、出版地、出版日期、關(guān)聯(lián)、時間范圍、空間范圍、版本、ISBN、統(tǒng)一書號、發(fā)布地址,共計14項。

2、圖像數(shù)字化標準和命名規(guī)則

2.1圖像掃描加工

掃描前根據(jù)國際色彩協(xié)會(International Color Consortium,簡稱ICC)標準,做加工設(shè)備的基本色彩校正,及針對各類型文獻進行色彩校正;

逐頁掃描;

黑白頁和灰度頁用灰度方式掃描

色彩位深:8 位

分辨率:300 dpi;小于5號字體用400 dpi

檔案典藏級格式:TIFF 不壓縮

發(fā)布服務(wù)級:PDF(經(jīng)過 JPEG2000 壓縮后,再做格式轉(zhuǎn)換)

彩色頁用彩色方式掃描

色彩位深:24 位

分辨率:300 dpi;小于5號字體用400 dpi

檔案典藏級格式:TIFF 不壓縮

發(fā)布服務(wù)級格式:PDF(經(jīng)過 JPEG2000 壓縮后,再做格式轉(zhuǎn)換)

糾偏處理。對出現(xiàn)偏斜的圖像進行糾偏處理,圖像歪斜度不可以超過一度,對方向不正確的圖像進行旋轉(zhuǎn)還原,以符合閱讀習慣;

去污處理。對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì)如黑邊等進行去污處理;

圖像拼接。若原文獻幅面較大,無法整體采集的,可將原件分畫幅采集(分畫幅采集時,注意各拍攝區(qū)域邊緣須留有一定的重復(fù)采集區(qū)域,以保證拼接完成后所有接縫處連貫完整),服務(wù)級文件進行拼接處理,合并為一個完整的圖像,以保證數(shù)字文件的整體性(合并信息應(yīng)在readme.txt進行說明)。

2.2圖像文件質(zhì)量要求

圖像文件(各種格式)放大到1:1狀態(tài),逐頁檢查。檢查文件是否有彩點、彩線、太淡、太濃、黑邊、污點、歪斜、模糊(馬賽克等)或圖像內(nèi)容不完整等現(xiàn)象。若不符合圖像質(zhì)量要求應(yīng)進行圖像校正或重新掃描;

圖像文件真實反映原件,同冊圖書的圖像尺寸相同,不得有失真現(xiàn)象;不能有缺頁、錯頁、數(shù)據(jù)內(nèi)容缺失等現(xiàn)象(原件有缺失的除外);

檔案典藏級圖像,允許進行適當?shù)募m偏,去污等處理,以不壓縮標準格式存檔。發(fā)布服務(wù)級的圖像,為有損壓縮圖像格式,一頁為一個PDF文件,在轉(zhuǎn)換工作中應(yīng)在圖像輪廓清晰可讀的前提下(可放大到實際尺寸檢查判定),盡量減小數(shù)據(jù)量;

圖像符合掃描規(guī)格要求和技術(shù)參數(shù);

所有文件保存位置以及文件命名正確,同一流水號不得有跳號情況,可以有效打開和顯示;

圖像的綜合錯誤率不超過1‰。

2.3命名規(guī)則

2.3.1加工編號(book_id)

文獻數(shù)字化加工過程中一冊文獻的唯一標識,它由11位數(shù)字和1位下劃線組成。

文獻基本資料類型(1位)、文獻語種(1位)、任務(wù)年(2位)、機構(gòu)代碼(4位)、下劃線(1位)、單位內(nèi)部流水號(3位)。

本規(guī)則針對地方圖書的文獻基本資料類型為(0:圖書),文獻語種為(1:中文),任務(wù)年為公元年后兩位數(shù)字(16年項目統(tǒng)一為16),機構(gòu)代碼見《推廣工程數(shù)字資源聯(lián)合建設(shè)機構(gòu)代碼》,單位內(nèi)部流水號由各單位自行分配,從1開始,不足3位以0補齊。

例:01160000_001

2.3.2圖像文件名

文件后綴名為小寫字母

前封(含封一、封二)

掃描文件名為Axxxxx_00,其中xxxxx為5位數(shù)字,按原書順序依次排序。

前附頁

目錄頁之前的前附頁掃描文件名為Bxxxxx_00,其中xxxxx為5位數(shù)字,按原書順序依次排序。

目錄頁之后的前附頁掃描文件名為Dxxxxx_00,其中xxxxx為5位數(shù)字,按原書順序依次排序。

目錄頁

掃描文件名為Cxxxxx_00,其中xxxxx為5位數(shù)字,按原書順序依次排序。

正文

有頁碼的正文掃描文件名為Txxxxx_00,其中xxxxx為5位數(shù)字,與原書頁號一致,按原書順序依次排序。當存在大幅圖像需分區(qū)掃描時其文件命名為Txxxxx_00zz,其中zz為數(shù)字,表示掃描圖像分區(qū),按掃描順序排序,對應(yīng)的發(fā)布服務(wù)級進行合并后命名為Txxxxx_00。例如:該圖在原書的第28頁,該圖分成4個畫幅,則4個畫幅的掃描文件名分別為T00028_0001.tif、T00028_0002.tif、T00028_0003.tif、T00028_0004.tif,拼接后的發(fā)布級圖像文件名為T00028_00.pdf。

正文中插頁掃描文件名為Txxxxx_yy,其中xxxxx為5位數(shù)字,表示插頁的前一頁順序號,yy為數(shù)字,表示插頁,并按原書順序依次排序。當插頁中存在大幅圖像需分區(qū)掃描時其命名為Txxxxx_yyzz,yy為數(shù)字,表示插頁;zz為數(shù)字,表示掃描圖像分區(qū),按掃描順序排序,對應(yīng)的發(fā)布服務(wù)級圖像進行合并后命名為Txxxxx_yy。例如:一張圖夾在20頁、21頁之間,且該圖分成4個畫幅掃描,則4個畫幅的掃描文件名分別為T00020_0101.tif、T00020_0102.tif、T00020_0103.tif、T00020_0104.tif,將4個畫幅拼接后,該圖的文件名為T00020_01.pdf。

后附頁

掃描文件名為Yxxxxx_00,其中 xxxxx為5位數(shù)字,按原書順序依次排序。

后封(含封三、封四)

掃描文件名為Zxxxxx_00,其中xxxxx為5位數(shù)字,按原書順序依次排序。

3、TXT文本標準

對圖像數(shù)據(jù)逐頁進行ocr識別,每頁生成一個對應(yīng)的TXT文件,文件命名與TIFF圖像一致,后綴名小寫。文本轉(zhuǎn)換數(shù)據(jù)的準確率平均應(yīng)達到90%以上。

4、數(shù)據(jù)庫標準

4.1數(shù)據(jù)庫命名

對象數(shù)據(jù)所對應(yīng)數(shù)據(jù)庫。數(shù)據(jù)庫名由8位數(shù)字組成:

文獻基本資料類型(1位)、文獻語種(1位)、任務(wù)年(2位)、機構(gòu)代碼(4位)。

例:01160000.mdb

4.2數(shù)據(jù)庫制作

4.2.1 對marc數(shù)據(jù)進行加工處理,制作文獻基本信息表(book)。

4.2.2目錄信息著錄,生成文獻目錄信息表(catalog)。

4.2.3 文獻版權(quán)頁著錄,生成文獻版權(quán)信息表(copyright)。

4.2.4 不帶頁號插圖信息著錄,生成文獻插頁信息表(inset)。

注:圖書中有夾頁時,對該表字段進行標引。

4.2.5 文獻缺頁信息著錄,生成文獻缺頁信息表(lostpage)。

注:圖書有缺失頁時,對該表字段進行標引。

4.2.6 文獻結(jié)構(gòu)信息著錄,生成文獻結(jié)構(gòu)信息表(struct)。

注:起始頁號均為文獻印刷頁碼

4.2.7 記錄掃描分辨率、壓縮因子、文件數(shù)量、存儲量等信息,生成文獻加工信息表(process)。

4.3 數(shù)據(jù)庫制作要求

數(shù)據(jù)庫的制作符合下列要求。

(1)文件格式為mdb格式;

(2)使用字符集為UTF-8;

(3)著錄信息應(yīng)嚴格按照文獻實際內(nèi)容進行描述,所著內(nèi)容與對象文件應(yīng)正確鏈接;

(4)數(shù)據(jù)庫字段各類表格等內(nèi)容嚴格按照規(guī)定和樣例版式;

(5)著錄中遇到無法錄入的生僻字、公式、符號等內(nèi)容用“〓”表示。同時將“〓”所對應(yīng)圖像文件保存在檔案典藏級數(shù)據(jù)內(nèi),以“〓”命名的文件夾內(nèi),建立方法:

子目錄內(nèi)應(yīng)包含所有用“〓”表示的圖像文件;

圖像文件刪除其他信息,僅保留“無法錄入的內(nèi)容”所在行的信息,tif不壓縮格式,圖像命名不變;

多個用“〓”表示的內(nèi)容對應(yīng)同一個圖像時,僅保存一個圖像文件;

(6)各種著錄的文字、符號、版式、位置和文件名稱準確,其綜合錯誤率不超過0.3‰。

5、說明文件

5.1制作文獻的說明文件

說明文件格式:Microsoft Excel

說明文件命名:由8位組成:文獻基本資料類型(1位)、文獻語種(1位)、加工年(2位)、機構(gòu)代碼(4位)。如:01160000.xls

(說明文件的5張表需保存在同一個Excel文件的不同工作表中,每個工作表按下列表命名)。

5.1.1數(shù)據(jù)總體說明表

5.1.2保存級對象數(shù)據(jù)硬盤存儲清單

5.1.3發(fā)布級PDF對象數(shù)據(jù)硬盤存儲清單

5.1.4發(fā)布級TXT對象數(shù)據(jù)硬盤存儲清單

5.1.5圖書單冊數(shù)據(jù)量統(tǒng)計表

5.2 制作每冊文獻和保存數(shù)據(jù)介質(zhì)的說明文件

6、存儲規(guī)則

6.1 存儲介質(zhì)及命名

存儲介質(zhì)為硬盤,硬盤命名由8位組成:

文獻基本資料類型(1位)、文獻語種(1位)、加工年(2位)、機構(gòu)代碼(4位)。

6.2數(shù)據(jù)存儲規(guī)則

存儲內(nèi)容包括:TIFF圖像、PDF、TXT文本、對應(yīng)數(shù)據(jù)庫、說明文件、介質(zhì)說明文件,書目數(shù)據(jù)文件各一份。

各類型對象數(shù)據(jù)按加工編號遞增順序依次放置在硬盤內(nèi),保存目錄及文件名由四級組成:

第一級目錄為加工編號的前8位,如01160000,同時將介質(zhì)說明文件并行保存(readme.txt);

第二級目錄為TIFF,PDF,TXT同時將對應(yīng)數(shù)據(jù)庫(01160000.mdb)、說明文件(01160000.xls)、書目數(shù)據(jù)文件(01160000.iso)并行保存;

第三級目錄為加工編號;

第四級目錄為相應(yīng)格式的對象數(shù)據(jù)文件,需要相應(yīng)的單冊文獻的說明文件。

7、加工成品數(shù)據(jù)的文獻管理平臺功能要求

1.該發(fā)布系統(tǒng)需具備完善的數(shù)字圖書館資源管理和發(fā)布軟件技術(shù)平臺,包括數(shù)字資源發(fā)布、檢索、閱讀、管理、采集、制作、下載以及用戶交互等功能。資源類型包括圖書、期刊、論文以及自建數(shù)據(jù)庫,并且實現(xiàn)在圖書,期刊,論文、自建庫的統(tǒng)一的檢索和獲取。平臺功能成熟,檢索方便快捷,具備多種途徑的單項檢索、組合條件檢索。

2.能夠兼容國家863計劃中國數(shù)字圖書館示范工程標準PDG格式的電子圖書文獻資源,技術(shù)上能夠做到整合到同一平臺中,同時支持轉(zhuǎn)換PDF、PDG、PNG、Word格式的文檔資料為網(wǎng)頁版閱讀方式,方便大多數(shù)用戶使用習慣。同時實現(xiàn)不同格式的文檔轉(zhuǎn)換,所有圖書均可實現(xiàn)文字圖像復(fù)制摘錄和圖書無損縮放。支持元數(shù)據(jù)檢索、目次檢索、全文檢索等多種檢索方式,友好統(tǒng)一的用戶界面,提供各種高級的檢索功能,具有突出的檢索性能。

3.該系統(tǒng)需具備獨立完善的管理平臺,管理功能全面,具備基本狀態(tài)、流量分析、用戶管理、排行管理、IP范圍管理、圖書管理、反饋需求管理、公告問題管理、頻道專題管理、頁面模板風格管理等功能;能實現(xiàn)自建特色庫,系統(tǒng)具有良好的開放性和兼容性,除電子圖書外還可以支持音頻、視頻、期刊、專題數(shù)據(jù)庫、標準、網(wǎng)站信息等的使用。

4.不限制使用用戶個數(shù),無下載量限制,軟件無用戶數(shù)或使用次數(shù)限制;可以進行資源管理,包括推薦資源,查詢,分類管理、設(shè)置;可以自行修改用戶的訪問權(quán)限和局域網(wǎng)IP范圍。

5.提供原廠開發(fā)的數(shù)字圖書館軟件系統(tǒng)一套,免費對數(shù)據(jù)庫及相關(guān)軟件系統(tǒng)的安裝、調(diào)試、培訓與維護。

6.平臺提供IP和用戶名兩種身份認證和權(quán)限管理方式,圖書館設(shè)有外網(wǎng)地址的情況下可以實現(xiàn)鏡像平臺的外網(wǎng)賬號訪問;具有強大的查詢檢索、圖書推薦、圖書排行、訪問量統(tǒng)計等功能,并支持頁面定制。

B、數(shù)字圖書館資源建設(shè)之地方報紙數(shù)字化及篇名識別加工

建設(shè)數(shù)據(jù)量:5000版

1、元數(shù)據(jù)加工標準

1.1規(guī)范性引用文件

下列文件對于本規(guī)則的應(yīng)用是必不可少的。

《中國文獻編目規(guī)則》(第二版)

《GB/T25100-2010 信息與文獻 都柏林核心元數(shù)據(jù)》

《信息資源的內(nèi)容形式和媒體類型標識》(GB/T3469-2013)

1.2著錄對象

以數(shù)字化文獻為著錄對象。一般以具有獨立名稱、并可獨立使用的一個數(shù)字資源為著錄單位。

報紙的著錄單位為一種報紙。

對于連續(xù)性資源的著錄對象是否發(fā)生改變,可依據(jù)題名、發(fā)行者、版本等的變化情況進行判斷,具體規(guī)則參照《中國文獻編目規(guī)則》(第二版)。

1.3著錄信息源

著錄信息源是資源本身。資源本身是著錄的首選來源。資源本身信息不足,可參考其他信息源。

報紙的著錄信息源是本題名下第一期或第一部分,若無法獲得本題名下第一期或第一部分,應(yīng)以可獲得的最早發(fā)行的一期或部分著錄。

1.4著錄用文字

題名、責任者等取自資源本身的信息一般按資源本身的文字著錄。

由編目員進行描述或標引的信息均采用簡體中文著錄。

有規(guī)范或規(guī)定編碼標準的要求按標準著錄,如:語種、中圖分類。

日期用阿拉伯數(shù)字著錄。

推薦采用ISBD著錄標識符。

一個著錄項中多個著錄內(nèi)容之間以半角分號分隔。

1.5元數(shù)據(jù)著錄簡表

必備項為:加工編號、正題名、中圖分類、主題詞或關(guān)鍵詞、內(nèi)容形式、媒體類型、格式、語種、適用對象、出版頻率、館藏范圍、CODI、數(shù)據(jù)提交單位、所屬任務(wù)年份,共計14項;有則必備項為:其它提名、附注、出版者名稱、出版地、開始日期、終止日期、關(guān)聯(lián)、時間范圍、空間范圍、ISSN、統(tǒng)一刊號、發(fā)布地址,共計12項。

2圖像數(shù)字化標準和命名規(guī)則

2.1圖像掃描加工

掃描前根據(jù)國際色彩協(xié)會(International Color Consortium,簡稱ICC)標準,做加工設(shè)備的基本色彩校正,及針對各類型文獻進行色彩校正;

逐版掃描;

黑白頁和灰度頁用灰度方式掃描

色彩位深:8 位

分辨率:300 dpi

檔案典藏級格式:TIFF 不壓縮

彩色頁用彩色方式掃描

色彩位深:24 位

分辨率:300 dpi

檔案典藏級格式:TIFF 不壓縮

糾偏處理。對出現(xiàn)偏斜的圖像進行糾偏處理,圖像歪斜度不可以超過一度,對方向不正確的圖像進行旋轉(zhuǎn)還原,以符合閱讀習慣;

去污處理。對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的黑邊等進行去污處理。

2.2圖像文件質(zhì)量要求

圖像文件放大到1:1狀態(tài),逐版檢查。檢查文件是否有彩點、彩線、太淡、太濃、黑邊、污點、歪斜、模糊(馬賽克等)或圖像內(nèi)容不完整等現(xiàn)象。若不符合圖像質(zhì)量要求應(yīng)進行圖像校正或重新掃描;

圖像文件真實反映原件,同種報紙圖像尺寸相同,不得有失真現(xiàn)象;按版次順序由小到大,符合閱讀習慣,不能有缺版、錯版、數(shù)據(jù)內(nèi)容缺失等現(xiàn)象(原件有缺失的除外);

圖像符合掃描規(guī)格要求和技術(shù)參數(shù);

所有文件保存位置以及文件命名正確,可以有效打開和顯示;

圖像綜合錯誤率不超過1‰。

2.3命名規(guī)則

注:檔案典藏級文件(TIFF格式)與其相應(yīng)的發(fā)布文件(雙層PDF格式和XML格式)命名規(guī)則相同,這里僅以TIFF格式文件為例,文件后綴名均為小寫。

2.3.1加工編號

加工編號是報紙數(shù)字化加工過程中一種報紙的唯一標識號,由11位數(shù)字和下劃線組成。文獻基本資料類型(1位)、文獻語種(1位)、任務(wù)年(2位)、機構(gòu)代碼(4位)、下劃線(1位)、單位內(nèi)部報紙種類編號(3位)。中文報紙的文獻基本類型為(2:報紙),文獻語種編碼為(1:中文)。

2.3.2文件命名規(guī)則

每期報紙按照實際版次命名,用三位數(shù)字表示,后綴名小寫tif。如第一版為001.tif,第2版為002.tif;則若報紙包含號外、增刊、副刊、特刊等特殊版面,且其不屬于報紙原有常規(guī)版次內(nèi)容,為獨立的另起版面,其文件的命名規(guī)則為:特殊版面種類拼音首字母(大寫)+版次(2位,如有實際印刷版次,按實際命名,如沒有則按01開始順序命名),如號外第一版H01.tif、增刊第一版Z01.tif、副刊第一版F01.tif、特刊第一版T01.tif;若報紙中存在通版(即打通同一面上兩個相鄰版而形成的版)情況,應(yīng)將這兩版整體掃描為一個圖像文件,并同時將其保存為這兩版的圖像,如當報紙中的第2版和第3版為通版時,通版圖像整體保存為一個文件,并且將這一圖像同時命名為002.tif和003.tif。

3雙層PDF標準

3.1雙層PDF加工

將處理完成后的圖像進行報紙篇目文字識別校對。采用圖在文上的模式進行雙層PDF輸出。

PDF文件根據(jù)圖像尺寸、顏色、數(shù)據(jù)存儲量、按JPEG2000有損壓縮,壓縮因子適度動態(tài)調(diào)整,在確保圖像清晰的情況下,盡量壓縮圖像文件所占空間至最小。

3.2PDF文件質(zhì)量要求

兼容adobe reader6.0及以上版本。

在保持圖像清晰可讀的基礎(chǔ)上盡可能減小存儲量。

PDF文字層所使用的字體以”已嵌入子集”方式嵌入PDF文件。

雙層PDF文件的圖像層和文字層的文字對位準確,反顯區(qū)域與文字區(qū)域相差1毫米以內(nèi)。

雙層PDF錯誤率不超過0.3‰。

4XML文件標準

文件應(yīng)著錄全面的報紙信息,記錄標題及篇目位置等信息,標題位置為引題、標題和副題的整體位置,遵守XML語法規(guī)則,按規(guī)范標簽進行制作XML,使用utf-8字符集,錯誤率小于0.3‰。

5數(shù)據(jù)庫標準

5.1數(shù)據(jù)庫命名

每種報紙單獨制作數(shù)據(jù)庫,其命名與報紙加工編號相同,如:21160000_001.mdb。

5.2數(shù)據(jù)庫制作

5.2.1報紙基本信息表(book)

5.2.2報紙版面篇目信息表(catalog)

5.2.3報紙結(jié)構(gòu)信息表(struct)

5.3 數(shù)據(jù)庫制作及要求

標引數(shù)據(jù)庫以MDB數(shù)據(jù)庫方式提交,后綴名mdb;

基本信息表的內(nèi)容應(yīng)與MARC數(shù)據(jù)相應(yīng)內(nèi)容保持一致;

版面篇目信息數(shù)據(jù)庫標引要求真實反映報紙原貌;

結(jié)構(gòu)信息表應(yīng)嚴格按文獻實際情況進行描述;

無法錄入的生僻字等用“〓”表示;

版面篇目信息表與XML文件的對應(yīng)元素項的內(nèi)容應(yīng)一致;

各種著錄、說明文件的文字、符號、版式、位置和文件名稱準確,其綜合錯誤率不超過0.3‰。

6說明文件

6.1數(shù)字化成品總清單

說明文件格式:Microsoft Excel

說明文件命名:地方文獻數(shù)據(jù)說明(說明文件的5張表需保存在同一個Excel文件的不同工作表中,每個工作表按下列表命名)。

6.1.1提交數(shù)據(jù)總體說明

6.1.2保存級對象數(shù)據(jù)硬盤存儲清單

6.1.3發(fā)布級PDF對象數(shù)據(jù)硬盤存儲清單

6.1.4發(fā)布級XML對象數(shù)據(jù)硬盤存儲清單

6.1.5每種文獻數(shù)據(jù)量統(tǒng)計表

6.2每個存儲介質(zhì)內(nèi)的說明文件(readme.txt)

7. 存儲規(guī)則

7.1 存儲介質(zhì)及命名

存儲介質(zhì)為硬盤,硬盤命名由8位組成:

文獻基本資料類型(1位)、文獻語種(1位)、加工年(2位)、機構(gòu)代碼(4位)。

7.2 數(shù)據(jù)存儲規(guī)則

存儲內(nèi)容包括:TIFF圖像、雙層PDF、XML、對應(yīng)數(shù)據(jù)庫、說明文件、介質(zhì)說明文件,書目數(shù)據(jù)文件各一份。

各類型對象數(shù)據(jù)按加工編號遞增順序依次放置在硬盤內(nèi),保存目錄及文件名由四級組成:

第一級目錄為加工編號的前8位,如21160000,同時將介質(zhì)說明文件并行保存(readme.txt);

第二級目錄為TIFF,PDF,XML同時將對應(yīng)數(shù)據(jù)庫、說明文件(21160000.xls)、書目數(shù)據(jù)文件(21160000.iso)并行保存;

第三級目錄為加工編號;

第四級目錄為相應(yīng)格式的對象數(shù)據(jù)文件;

第五級目錄為相應(yīng)格式的對象數(shù)據(jù)文件。

8加工成品數(shù)據(jù)的文獻管理平臺功能要求

1.該發(fā)布系統(tǒng)需具備完善的數(shù)字圖書館資源管理和發(fā)布軟件技術(shù)平臺,包括數(shù)字資源發(fā)布、檢索、閱讀、管理、采集、制作、下載以及用戶交互等功能。資源類型包括圖書、期刊、論文、報紙以及自建數(shù)據(jù)庫,并且實現(xiàn)在圖書,期刊,論文、報紙、自建庫的統(tǒng)一的檢索和獲取。平臺功能成熟,檢索方便快捷,具備多種途徑的單項檢索、組合條件檢索。

2.能夠兼容國家863計劃中國數(shù)字圖書館示范工程標準PDG格式的電子圖書文獻資源,技術(shù)上能夠做到整合到同一平臺中,同時支持轉(zhuǎn)換PDF、PDG、PNG、Word格式的文檔資料為網(wǎng)頁版閱讀方式,方便大多數(shù)用戶使用習慣。同時實現(xiàn)不同格式的文檔轉(zhuǎn)換,所有圖書均可實現(xiàn)文字圖像復(fù)制摘錄和圖書無損縮放。支持元數(shù)據(jù)檢索、目次檢索、全文檢索等多種檢索方式,友好統(tǒng)一的用戶界面,提供各種高級的檢索功能,具有突出的檢索性能。

3.該系統(tǒng)需具備獨立完善的管理平臺,管理功能全面,具備基本狀態(tài)、流量分析、用戶管理、排行管理、IP范圍管理、圖書管理、反饋需求管理、公告問題管理、頻道專題管理、頁面模板風格管理等功能;能實現(xiàn)自建特色庫,系統(tǒng)具有良好的開放性和兼容性,除電子圖書外還可以支持音頻、視頻、期刊、專題數(shù)據(jù)庫、標準、網(wǎng)站信息等的使用。

4.不限制使用用戶個數(shù),無下載量限制,軟件無用戶數(shù)或使用次數(shù)限制;可以進行資源管理,包括推薦資源,查詢,分類管理、設(shè)置;可以自行修改用戶的訪問權(quán)限和局域網(wǎng)IP范圍。

5.提供原廠開發(fā)的數(shù)字圖書館軟件系統(tǒng)一套,免費對數(shù)據(jù)庫及相關(guān)軟件系統(tǒng)的安裝、調(diào)試、培訓與維護。

6.平臺提供IP和用戶名兩種身份認證和權(quán)限管理方式,圖書館設(shè)有外網(wǎng)地址的情況下可以實現(xiàn)鏡像平臺的外網(wǎng)賬號訪問;具有強大的查詢檢索、圖書推薦、圖書排行、訪問量統(tǒng)計等功能,并支持頁面定制。

備注:成交供應(yīng)商需負責將加工數(shù)據(jù)與圖書館原有軟件平臺對接并將數(shù)據(jù)導入,配合省圖書館驗收合格。

同地區(qū)同業(yè)主性質(zhì)招標

同地區(qū)推薦招標

地區(qū)其他招標

宜兰县| 舟山市| 双峰县| 甘谷县| 万源市| 松江区| 望奎县| 新晃| 毕节市| 东兴市| 巴里| 九龙城区| 雷州市| 威远县| 临颍县| 绥宁县| 张掖市| 宽甸| 通化市| 乡宁县| 军事| 尖扎县| 莎车县| 长治市| 克山县| 象山县| 军事| 博罗县| 光山县| 天津市| 华亭县| 含山县| 灌南县| 若尔盖县| 巴彦淖尔市| 兴安盟| 禹城市| 策勒县| 博客| 新闻| 加查县|