學術圖書館科研數據管理體系研究論文
[摘要]分析了數據生命周期理論與模型,研究了學術圖書館科研數據管理的主要內容,構建了基于數據生命周期模型的學術圖書館科研數據管理體系,提出了基于數據生命周期的學術圖書館科研數據服務保障機制。
[關鍵詞]數據生命周期模型;學術圖書館;科研數據;管理體系
隨著移動互聯網技術的發展,數字化資源以驚人的速度不斷增長。根據IDC發布的全球數據研究報告,預計到2020年全球數據總量將超過40ZB。E-Science時代海量科研數據的產生與應用,迫切需要相關學術機構結合其特點,通過數據采集、組織、存檔和研究,建立完善的管理機制,保障這些科研數據的合理利用。學術圖書館作為研究型文獻管理機構,長期以來一直通過管理文獻資源的方式輔助科研活動,在助力科研創新方面也扮演著重要角色。數據生命周期是從數據生成、加工、發布到利用的循環過程,表現了基于科研全過程的數據管理[1]。面對E-Science背景下科研范式的發展,以及用戶對科研數據組織、存儲和利用的新需求,學術圖書館積極探索科研數據管理內容,建設基于數據生命周期的科研數據管理體系,發揮在數據增值服務方面的作用,有助于提升科研數據服務能力。
1數據生命周期理論與模型分析
1.1數據生命周期理論概述生命周期的概念最早被應用于生物領域,此后經過不斷演化被應用于多個領域。國外學者通過研究數據信息的生命周期,探討了數據生命周期的內涵,指出它代表一種數據在特定環境下,經過加工、存儲和管理,實現資源發掘和利用的過程。具體而言,數據生命周期就是對數字化資源進行加工處理和長期保存,并在科研項目、決策制定中實現再利用的活動[2]。通過總結各流派的相關理論,可知科研活動是數據生命周期的來源,而一個完整的數據生命周期涉及到生成、加工、知識抽取等多個層次。從內容層面分析,數據生命周期包括數據初加工、再加工和獲取附加值等環節,涉及到基于數據加工的一系列知識抽取活動。1.2數據生命周期的作用由于科研周期與數據生命周期存在關聯,因此通過宏觀分析數據生命周期,就可以大致了解科研過程中科研人員的數據需求。E-Science時代科學研究與基礎信息設施的發展,逐漸向數據密集型方向轉變,科研創新更加依賴對科研數據的再利用。如何幫助科研人員提高科研數據利用率,促進科研數據的開放共享,是學術機構關注的問題[3]。然而對于科研數據的研究與管理,涉及到不同利益主體之間的協調作用,是一個長期而復雜的系統。數據生命周期為科研數據管理提供了基本框架,可以發現科研數據演變階段研究者的需求,描述復雜的數據管理和流通過程,明確不同利益相關者的關系。此外,數據生命周期來源于科研周期,在研究數據生命周期的基礎上構建模型,也可以準確映射科研活動全過程。1.3數據生命周期模型數據生命周期為不同利益相關者提供了價值評估工具,也為科研數據服務實踐提供了途徑。為方便分析和利用,澳大利亞、英國等研究機構結合實踐經驗,構建了多個數據生命周期理論模型,如DDI3.0模型、I2S2模型、DataONE模型等。常用的數據生命周期模型大致分為矩陣狀、鏈狀、環狀3種,在應用場景和構成要素方面存在差異[4]。其中DDI3.0為鏈狀模型,不同環節呈一定的次序排列。I2S2矩陣模型屬于數據生命周期模型的子集,也是對鏈狀模型的深化。美國國家科學基金(NSF)為滿足科研開發需求,闡釋數據存儲和管理實踐中彼此間的關系,提出了首尾相接的環狀DataONE模型,體現了數據生命周期的循環過程(如圖1)。
2學術圖書館科研數據管理的主要內容
科研數據包含了科研活動過程中產生的所有能夠存儲的數字資源,以及能夠轉換為數字形式的數據,如遙感勘測數據、仿真數據等。學術圖書館開展科研數據管理,不僅能夠避免科研數據丟失,實現科研數據的長期存儲和共享,也是滿足科研人員動態信息需求和促進圖書館發展的必要措施。2.1基礎設施建設目前學術圖書館獨立構建數據倉儲進行科研數據管理的案例并不多見,一方面與圖書館在資金、技術方面存在不足有關[5]。另外,面對E-Science時代學術資源開放、共享的趨勢,圖書館領域更加推崇協同合作,營造科研數據管理的硬件環境,采取資源互補、技術共享的方式共同建設機構倉儲。學術圖書館也可以與科研項目機構合作,借助外部設備和項目的支持,構建滿足不同學科需求的數據倉儲,使科研數據管理跨越單個機構的限制,幫助科研人員獲取更多有用資源。例如,澳洲國立大學圖書館與其他院校、機構知識庫合作,共同搭建科研數據管理的硬件環境,可以為大量科研項目提供數據存儲服務。2.2科研數據集成服務科研數據產生于數據生命周期的任意階段,與科研活動、科學文獻等都存在關聯,只有通過關聯分析發現內在規律,才能獲取更多有價值的信息。學術圖書館是科學文獻存儲中心,在數據集成方面具有豐富的經驗。隨著數字化技術的應用,很多學術圖書館已經可以利用智能化工具,為科研人員提供數據關聯組織和個性化推薦服務。科研數據作為具有極大應用價值的信息,必然要求圖書館通過科研數據關聯集成,將某一類型或某一領域的數據集和科學文獻結合起來,幫助科研人員發現不同數據的潛在聯系,進一步利用好各類資源。此外,圖書館利用數據挖掘技術處理科學文獻,如學術專著、會議紀要、發明專利等,以數據生命周期模型為紐帶,將原始數據與再生數據關聯起來,實現多學科資源的匯聚,也方便科研人員迅速獲取有價值信息。2.3科研數據存儲服務在開放獲取運動的推動下,很多國家對于信息機構的科研數據都要求開放共享[6]。在這樣的背景下,學術圖書館作為長期提供科研數據服務的場所,自然要求順應開放獲取的發展趨勢。在西方一些發達國家,很多學術圖書館正在嘗試開展科研數據開放存儲服務,而科研人員也樂于借助圖書館存儲科研信息或成果。在科研數據存檔方面,學術圖書館構建專門的機構知識庫,通過IR拓展的方式為科研數據管理提供支持,也可以建設科研數據檔案庫,引進專門的軟硬件設施開展科研數據服務。由于E-Science背景下科研人員的數據管理需求日益增長,學術圖書館必須盡快拓展科研數據存儲空間,并且通過尋求政府部門、基金會的支持,以解決新增業務帶來的成本增加等問題。
3基于數據生命周期模型的學術圖書館科研數據管理體系構建
學術圖書館科研數據管理涉及多個環節和利益主體,具有動態性和復雜性特征。筆者在分析國內外科研數據管理成果與掌握科研人員數據管理需求的基礎上,將人力資源、技術平臺、服務內容作為重點,構建了基于數據生命周期模型的科研數據管理體系(見圖2)。3.1調研科研數據管理需求縱觀國內外圖書館科研數據管理體系的設計,均是建立在充分調研圖書館用戶科研數據管理需求的基礎上的。學術圖書館掌握科研人員的實際需求,是設計科研數據管理體系的出發點,也是完善科研數據管理流程、保障科研數據管理效果的基礎。一方面,學術圖書館可以采用問卷調查的形式,了解科研人員如何開展數據存儲、備份,是否存在成熟的元數據等。問卷調查適用于規模較大的需求分析,在調研準備階段需要做好宣傳工作,對問卷的設計注重問題的`選擇和答題時間控制,避免相同性質的問題重復出現,并做好問卷整理、統計工作。另一方面,學術圖書館也可以采用直接訪談的方式,了解科研人員對科研數據管理的認識,并通過小組討論的形式分析科研數據管理的需求動向。3.2建設完善的技術平臺技術平臺包括與科研數據管理相關的一系列軟硬件系統、存儲設備和服務器等,為學術圖書館開展科研數據管理活動提供了保障[7]。技術平臺的構建可以采取學術圖書館與其他機構共建的方式,如檔案館、科研單位等,發揮各自優勢,協作搜集與科研數據管理相關的工具、設備,整合不同類型的數據資源,如資源鏈接、元數據標準等,解決整個數據生命周期中存在的技術難題,保障技術平臺的完整性、可靠性。例如,伊利諾伊大學與校外云服務公司共同構建科研數據存儲庫,可為科研人員提供數據保存服務。
共2頁: 上一頁12下一頁
摘 要:學術圖書館也可以結合自身優勢與發展需求,明確數據管理政策機制,自行購買或引進專業化工具設備,解決數據信息安全控制問題,通過網頁鏈接、社交平臺等整合資源,建設滿足科研人員需求的技術平臺。3.3人員配置與服
關鍵詞:圖書館學術論文
學術圖書館也可以結合自身優勢與發展需求,明確數據管理政策機制,自行購買或引進專業化工具設備,解決數據信息安全控制問題,通過網頁鏈接、社交平臺等整合資源,建設滿足科研人員需求的技術平臺。3.3人員配置與服務內容學術圖書館人力資源的合理配置,通過設立專門的科研數據管理團隊,保障科研數據服務順利開展。具體實踐中可以采取對外招聘的方式,吸引專業人才參與科研數據管理工作,也可以通過內部培訓的方式提高圖書館員的科研數據管理技能,彌補在科研數據管理方面的缺陷。同時要求圖書館員結合數據生命周期制定科研數據管理計劃,提供與科研數據管理密切相關的設施、工具和服務內容,具體包括數據引用、數據出版、數據加工等。開展科研數據服務的方式包括參考咨詢、在線交流、教育培訓等,并要求服務人員做好數據備份和數據加密工作,避免出現知識版權糾紛,提升數據使用安全性。
4基于數據生命周期的學術圖書館科研數據服務保障機制
學術圖書館是科學研究與教學資源的聚集地,具備提供、存儲信息資源和促進資源共享的職能。在充分利用科研數據收集、管理的相關成果提供服務的同時,也應依據數據生命周期構建相應的保障機制,為科研數據管理與服務提供支撐。4.1規范數據管理政策學術圖書館作為科研數據管理服務機構,需要注重協調多方利益,明確不同主體的權責,并制定科學的數據管理規范,保障科研數據管理效率。在科研數據服務實踐中,圖書館應結合數據生命周期模型探索合適的數據管理政策,如開放獲取政策、科研數據使用流程等,為科研數據管理工作提供依據,并規范研究人員的數據利用行為。謝菲爾德大學圖書館為促進科研數據共享,發布了關于科研數據開放獲取的政策,開展了數據管理咨詢、數據管理培訓等服務。學術圖書館要想實現科研數據共享,需要結合不同類型科研數據的特點,采取學術交流、主題講座等方式,分析科研數據的開放獲取條件,探索如何解決科研數據的存儲、再利用問題,以及如何提升科研人員的共享意識等。4.2引入數據處理系統學術圖書館引入數據處理系統對原始科研數據進行加工處理,實現數據價值擴展,是保障科研數據服務效果的必要方式。數據密集型科研活動的完整生命周期包括數據采集、組織、管理、分析等環節,而科研數據管理涵蓋元數據構建、數據映射、語義描述等活動。因此,對科研數據的加工處理,首先需要借助專業數據分析軟件研究外部數據集,為數據挖掘和語義描述奠定基礎,然后對原始數據進行初加工與深加工。其中數據初加工的目的,就在于實現采集數據向長期存儲與利用的過渡,再加工的目的在于研究外部數據集與已有數據的關系,通過添加語義注釋、數據融合等方式,實現數據補充和優化,保障數據的完整性和可操作性。數據挖掘是科研數據管理和服務的基礎,未來學術圖書館在科研數據管理方面將引進更多智能化工具,融合數據關聯分析更好地提升服務效率。4.3開展科研數據素養教育開展數據素養教育是推廣科研數據服務的基礎,學術圖書館應從科研生命周期出發,聯合不同信息機構和組織,以圖書館為主導形成跨機構協同機制,共同開展科研數據素養教育工作。例如,康奈爾大學圖書館通過多方合作,協同創建與實施數據管理計劃,并能夠提供數據生命周期任意階段的數據管理服務。同時學術圖書館應聯合科研機構、高校、信息化中心等,共同建設科研數據素養教育平臺,設計完善的功能模塊,推出優質科研數據教育資源,保障圖書館用戶獲取數據的高效、準確性。在科研數據素養教育課程設計方面,可以聘請專業教師參與平臺整體規劃,實現專業課程教學與科研數據素養教育融合,全面提升圖書館用戶的數據意識。
5結語
當前學術交流模式的變革和大數據的廣泛應用,使科學研究活動呈現數據密集化的趨勢。隨著國外圖書館相繼制定科研數據管理規范和共享政策,更是掀起世界范圍內科研數據研究的浪潮。學術圖書館作為科研項目的支持機構,應積極承擔科研數據管理任務,構建支持數據驅動的技術平臺,是應對全新科研環境的必然選擇。
參考文獻:
[1]劉桂鋒,盧章平,阮煉.美國高校圖書館研究數據管理服務內容研究[J].圖書館論壇,2015(8):137-144.
[2]徐坤,曹錦丹.高校圖書館參與科學數據管理研究[J].圖書館論壇,2014(5):92-98.
[3]陳麗君.約翰霍普金斯大學科學數據管理服務實踐與啟示[J].現代情報,2016(4):110-114.
[4]王秀華.澳大利亞國立大學圖書館數據管理服務及啟示[J].河南圖書館學刊,2015(4):95-98.
[5]武琳,林明春.牛津大學科學數據管理經驗與啟示[J].圖書館學研究,2015(24):48-53.
[6]黃如花,賴彤.利益相關者視角下圖書館參與科學數據管理的分析[J].圖書情報工作,2016(3):21-25.
[7]熊文龍,李瑞婻.基于科學數據管理的圖書館數據服務研究[J].圖書情報工作,2014(22):48-53.
【學術圖書館科研數據管理體系研究論文】相關文章:
數字圖書館中XML數據安全的研究論文04-14
有關科研誠信的學術論文05-19
基于數據挖掘的數字圖書館檢索技術研究論文04-16
數字圖書館中大數據存儲的應用研究論文04-13
科技學科研究論文03-30
地鐵節能管理體系的研究論文06-29
施工庫存管理體系研究論文10-23
大數據環境下的數據安全研究論文04-14