- 相關推薦
大數(shù)據(jù)環(huán)境下關于情報學發(fā)展的思考
摘要:文章從情報學學科體系的角度出發(fā),從理論情報學、應用情報學、技術情報學、管理情報學四個方面展開思考,分析了大數(shù)據(jù)環(huán)境下情報學的發(fā)展趨勢。
關鍵詞:大數(shù)據(jù)時代 ;情報學;學科發(fā)展 ;大數(shù)據(jù)
大數(shù)據(jù)趨勢產(chǎn)生的深層原因是海量數(shù)據(jù)的存在和越來越多的事物是以數(shù)據(jù)形式存在的。隨著計算機技術全面融入社會生活,我們的工作、生活,甚至國家經(jīng)濟的發(fā)展都受到了大數(shù)據(jù)的影響,現(xiàn)在人們已經(jīng)意識到了大數(shù)據(jù)的重要性。在大數(shù)據(jù)時代因素的推動下,情報學的理論研究、研究方法以及情報學技術等都將做出新的改變,趨勢預測性情報的分量將繼續(xù)加重,情報產(chǎn)生中的跨界合作將增強,但現(xiàn)在我們對大數(shù)據(jù)環(huán)境下情報學的發(fā)展研究還遠遠不夠。
一、大數(shù)據(jù)的內涵及基本特征
1.1 大數(shù)據(jù)的內涵
按照維基百科的定義:大數(shù)據(jù)是指所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息集合。研究機構Gartner的定義:大數(shù)據(jù)是指需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。麥肯錫的定義:大數(shù)據(jù)是指無法在一定時間內用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內容進行采集、存儲、管理和分析的數(shù)據(jù)集合。
現(xiàn)在越來越多的領域開始關注和研究大數(shù)據(jù),這是因為大數(shù)據(jù)涉及不同的學科領域,人們從不同的角度、不同的科學領域出發(fā),對大數(shù)據(jù)的定義進行了詮釋。到目前為止,大數(shù)據(jù)尚未形成統(tǒng)一明確的定義。筆者認為,大數(shù)據(jù)的“大”不單單是指數(shù)據(jù)的量很大,還指數(shù)據(jù)無時無刻不在急劇增長,數(shù)據(jù)的形式紛繁多樣,另外,數(shù)據(jù)的覆蓋面很廣泛,數(shù)據(jù)之間交互頻繁,數(shù)據(jù)之間相關關系復雜,這些都是大數(shù)據(jù)“大”的表現(xiàn)。
1.2 大數(shù)據(jù)的基本特征
業(yè)界有人將大數(shù)據(jù)的特征歸納為“4V”,即數(shù)據(jù)種類繁多(Variety),數(shù)據(jù)體量巨大(Volume),數(shù)據(jù)生成和處理速度快或理解為流動速度快(Velocity),至于第四個“V”,有人的理解是價值密度低或者理解為數(shù)據(jù)的價值日益突現(xiàn)(Value),也有人認為大數(shù)據(jù)具有真實性(Veracity)的特征。筆者更贊同的是Volume、Velocity、Variety、Value四個特征。雖然業(yè)界也有很多人贊同上述四個特征,但是對大數(shù)據(jù)特征含義的理解卻不盡相同。筆者認為,大數(shù)據(jù)具有以下特征。
1.2.1 數(shù)據(jù)的體量巨大。據(jù)麥肯錫全球研究院(MGI)估計,2010年,企業(yè)的磁盤中存儲了超過7EB字節(jié)的新數(shù)據(jù);用戶在個人PC機和筆記本等設備上的新數(shù)據(jù)存儲量也超過了6EB字節(jié)。2011年全球的數(shù)據(jù)量達到18Z。體量巨大是大數(shù)據(jù)的首要特征。
1.2.2 數(shù)據(jù)生成速度快,并且數(shù)據(jù)實時變化迅速。在這個信息化的時代,數(shù)據(jù)時刻在產(chǎn)生,比如銀行交易、淘寶購物、購買車票、打電話、檢索資料等,這些行為都可以以數(shù)據(jù)的形式呈現(xiàn),而且數(shù)據(jù)呈指數(shù)級增長。此外,數(shù)據(jù)是實時變化的,人們對數(shù)據(jù)的處理速度也提出了更高的要求。
1.2.3 數(shù)據(jù)種類的多樣性,F(xiàn)在大數(shù)據(jù)涉及的領域非常廣泛,數(shù)據(jù)的種類也趨于多樣化,數(shù)據(jù)會以數(shù)據(jù)文本、數(shù)據(jù)庫、圖片、動畫、音頻、視頻,甚至是以日志文件、網(wǎng)頁、電子郵件等多種形式呈現(xiàn)在人們的面前。隨著信息技術的不斷發(fā)展,新的數(shù)據(jù)來源和數(shù)據(jù)形式也在不斷地出現(xiàn)。
1.2.4 數(shù)據(jù)本身的價值密度低。大數(shù)據(jù)時代,各種數(shù)據(jù)的生產(chǎn)速度非常快,研究員要在冗余的信息中發(fā)現(xiàn)其價值并不容易。
二、大數(shù)據(jù)時代情報學發(fā)展所面臨的機遇與挑戰(zhàn)
2.1 大數(shù)據(jù)時代情報學發(fā)展所面臨的機遇
2.1.1 為情報學研究提供豐富的數(shù)據(jù)資源支持。情報學中的很多研究方法都是建立在大量數(shù)據(jù)的基礎之上,在這個網(wǎng)絡化和信息化的時代,人們時時刻刻都在以各種各樣的方式生產(chǎn)著不同類型的數(shù)據(jù),如前文提到的圖片、動畫、音頻、視頻、日志文件、網(wǎng)頁、電子郵件。大數(shù)據(jù)時代的到來為情報學的研究提供了豐富的數(shù)據(jù)資源。
2.1.2 完善情報學學科技術。大數(shù)據(jù)時代將繼續(xù)催生很多新型的產(chǎn)業(yè),基于大數(shù)據(jù)的數(shù)據(jù)信息收集、存儲、處理、分析、挖掘技術都是這個時代的產(chǎn)物,例如云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、文本挖掘、意見挖掘、中文分詞和NLP自然語言處理、神經(jīng)網(wǎng)絡算法、網(wǎng)絡分析SNA、數(shù)據(jù)可視化等。這些技術也為情報學的學科技術研究打下了基礎,甚至很多技術都可以直接被用到情報學研究中,如云存儲技術、云計算技術等,在大數(shù)據(jù)時代,這些計算機互聯(lián)網(wǎng)技術都可以為情報學研究所用,它們很好地完善了情報學學科技術。
2.1.3 大數(shù)據(jù)將助力情報學新的研究范式和方法論。在大數(shù)據(jù)時代,人們所面臨的數(shù)據(jù)不僅僅體量巨大、類型多樣化,而且它們還在以驚人的速度生長并發(fā)生著實時的變化,這些都對情報學的研究方法提出了新的要求,因此對情報學研究方法而言,唯有創(chuàng)新才有出路。以前,人們通過研究獲得準確的情報并供人們使用,而在大數(shù)據(jù)時代,情報學將在研究方法上做出改變:情報學的研究方法可以轉向研究數(shù)據(jù)之間的相關性,并根據(jù)數(shù)據(jù)之間的相關性得出預測性情報,以供人們決策使用。
2.1.4 擴展情報學的學科研究和應用領域。大數(shù)據(jù)時代,在多種因素的影響下,情報學的研究內容和范圍不斷擴展。在這個信息化的時代,情報學的發(fā)展離不開信息技術和網(wǎng)絡技術的支持,情報的獲取、存儲和處理都會涉及與其他學科的交叉合作。比如,在大數(shù)據(jù)時代,人們的隱私急需得到保護,因此,信息政策和法律法規(guī)必將是社會科學研究的一個重要方向,這也將是情報學與其他學科跨界合作的新領域。
2.2 大數(shù)據(jù)時代情報學發(fā)展所面臨的挑戰(zhàn)
2.2.1 價值密度低,獲取有效信息難度加大。數(shù)據(jù)信息是情報學研究的重要基礎,但在大數(shù)據(jù)時代,一方面數(shù)據(jù)的體量巨大,要想從中獲取對所研究主題有用的數(shù)據(jù)信息不是一件易事;另一方面數(shù)據(jù)的種類多樣,不僅包括部分結構化數(shù)據(jù),還包括圖片、音頻、視頻等多種形式的非結構化數(shù)據(jù)。此外,在大數(shù)據(jù)時代,數(shù)據(jù)信息是實時變化的,這些都加大了情報工作人員獲取有效信息的難度,這是情報學發(fā)展中應該重視的一點。
2.2.2 情報學學科研究技術有待進一步開發(fā)。在這個信息技術高速發(fā)展的時代,情報學技術的發(fā)展形勢不容樂觀。由于情報學知識結構的限制,情報學很難培育自己的情報網(wǎng)絡技術,情報學很多技術都是采用拿來主義,把其他領域的技術直接運用到自己的學科研究中,但是在大數(shù)據(jù)時代,為了保證大數(shù)據(jù)的價值,必須對數(shù)據(jù)進行快速有效的處理,而我們現(xiàn)有的情報采集、分析、挖掘、處理等技術已經(jīng)不再適應現(xiàn)在巨量、多樣化、實時變化的大數(shù)據(jù)環(huán)境。
2.2.3 情報學科呈現(xiàn)泛化發(fā)展趨勢。隨著社會的發(fā)展,情報學的發(fā)展環(huán)境也在發(fā)生著巨大的變化,情報學是一門綜合性的學科,在情報學的發(fā)展過程中,會出現(xiàn)其研究內容與其他學科交叉的現(xiàn)象。一方面,這種現(xiàn)象使情報學可以從其他學科獲取理論、技術等多方面的支持,在一定程度上促進情報學的學科發(fā)展;另一方面,在信息和網(wǎng)絡技術高速發(fā)展的大數(shù)據(jù)時代,這種與其他學科的“跨界研究”將會使情報學的學科泛化趨勢更加明顯,從而會導致“過界研究”,處理好“跨界研究”和“過界研究”的關系,將成為文獻信息工作者面臨的一個重要任務。
2.2.4 數(shù)據(jù)信息的管理問題將是一大挑戰(zhàn)。大數(shù)據(jù)時代,傳統(tǒng)的數(shù)據(jù)管理方式不再適用,在數(shù)據(jù)來源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等方面都會帶來革命性的變化,如果在情報學研究中對數(shù)據(jù)信息管理不當,甚至可能帶來情報安全危機,因此數(shù)據(jù)信息的管理問題也將是對情報學的一大挑戰(zhàn),相應的情報道德規(guī)范、情報政策、信息法律法規(guī)等是必要的。此外,反競爭情報的研究分量也將加重。
三、大數(shù)據(jù)環(huán)境下情報學的發(fā)展展望
情報學這一學科的發(fā)展離不開情報學的相關理論、應用、技術及情報學管理這幾方面的內容,情報學學科體系主要包括理論情報學、應用情報學、技術情報學、管理情報學四個方面,下面筆者將從情報學學科體系角度對大數(shù)據(jù)環(huán)境下情報學的發(fā)展進行探討。
3.1 理論情報學的發(fā)展
3.1.1 就情報學內涵而言,在大數(shù)據(jù)環(huán)境下,情報學的內涵將更加豐富。一個學科在發(fā)展過程中往往會受到不同的環(huán)境、技術等因素的影響,在大數(shù)據(jù)時代,數(shù)據(jù)信息類型呈現(xiàn)出多樣化的特征,情報學的研究對象也相應地從單一的、結構化的文獻信息轉向了復雜多樣的非結構化的數(shù)據(jù),因此,大數(shù)據(jù)將在一定程度上豐富情報學的內涵。
3.1.2 就情報學方法論而言,情報學的學科方法可以充分發(fā)揮大數(shù)據(jù)的優(yōu)勢,發(fā)現(xiàn)和利用數(shù)據(jù)信息的相關關系。在大數(shù)據(jù)時代,數(shù)據(jù)信息體量巨大,并且很多數(shù)據(jù)都是以碎片化的形式存在,情報學可以通過利用數(shù)據(jù)之間的相關關系拓展出新的情報學研究方法。以情報學研究方法中的文獻計量學方法為例,很多學者利用這個方法對某個數(shù)據(jù)庫中某一學科領域的文章發(fā)表情況或者文章內容進行統(tǒng)計分析研究,假設我們把某個數(shù)據(jù)擴大到某一學科領域相關的所有數(shù)據(jù),或許我們會有新的發(fā)現(xiàn)。
3.1.3 情報學學科理論研究泛化。情報學是一門綜合性的學科,在情報學的發(fā)展研究中,很多內容會涉及計算機和網(wǎng)絡技術,甚至社會化媒體對情報學的發(fā)展都有很大的影響,在這種情況下,企業(yè)情報學、經(jīng)濟情報學、軍事情報學、情報行為學等這樣的情報學分支和交叉學科應運而生,這都是情報學學科泛化的表現(xiàn),大數(shù)據(jù)將帶來新的研究領域、技術和方法,情報學學科理論研究也將繼續(xù)呈現(xiàn)泛化趨勢。
3.2 應用情報學的發(fā)展
3.2.1 情報分析預測與情報甄別的分量加重。預測是大數(shù)據(jù)的核心,在大數(shù)據(jù)的環(huán)境下,情報學可以充分利用大數(shù)據(jù)帶來的新技術。一方面,大數(shù)據(jù)時代的數(shù)據(jù)價值密度低,信息冗余量大,這對情報學的情報甄別是巨大的挑戰(zhàn);另一方面,可以從多角度發(fā)現(xiàn)并挖掘數(shù)據(jù)之間的線性關系和非線性相關關系,并在此基礎上進行情報分析預測,為研究和決策服務。
3.2.2 重視情報用戶的需求,向咨詢業(yè)進軍。情報是可以直接使用或者直接用于決策的,情報應用中更應該以用戶為中心,情報用戶的需求不是簡單的信息收集匯總或是信息堆砌,而是經(jīng)過深層次的加工處理,直接為用戶提供可供用戶做決策使用的成熟的、智能的知識,情報學應該向咨詢業(yè)進軍。
3.3 技術情報學的發(fā)展
3.3.1 大數(shù)據(jù)時代的數(shù)據(jù)信息數(shù)據(jù)量大。大數(shù)據(jù)時代的數(shù)據(jù)信息數(shù)據(jù)量巨大、來源廣泛、種類繁多、實時變化,并表現(xiàn)出碎片化的特征,這給情報的存儲和采集技術提出了要求,情報的存儲技術將在容量大的前提下,增加存儲數(shù)據(jù)的類型,開發(fā)新型的數(shù)據(jù)采集技術、數(shù)據(jù)挖掘技術及多媒體檢索技術。
3.3.2 大數(shù)據(jù)環(huán)境下更注重數(shù)據(jù)之間的相關關系。情報學在這方面的研究技術還相當薄弱,研究大數(shù)據(jù)之間相關關系的數(shù)據(jù)模型和情報分析技術有待開發(fā)。
3.4 管理情報學的發(fā)展
3.4.1 大數(shù)據(jù)時代個人隱私有被二次利用的危險。在經(jīng)濟利益的誘惑下,情報學研究也會涉及個人隱私,為了規(guī)范情報的管理,情報學學科發(fā)展中有必要從情報倫理和情報政策與法規(guī)兩個方面規(guī)范情報的管理與研究。情報道德規(guī)范、情報職業(yè)規(guī)范、情報素養(yǎng)以及相關的情報政策、信息法律法規(guī)都將得到人們的重視,并相繼出臺或完善。
3.4.2 情報學的發(fā)展離不開人才支持。情報學是一門綜合性的學科,從目前形勢來看,情報學相對比較缺乏技術上的人才。在大數(shù)據(jù)環(huán)境下,情報學一定要抓住契機,注重人才在學科發(fā)展中的作用。
四、結語
大數(shù)據(jù)將廣泛影響到我們的生活,它將重塑我們的生活、工作以及思維方式,目前,大數(shù)據(jù)分析思想已經(jīng)推廣到了多個學科領域,大數(shù)據(jù)也為情報學的發(fā)展開辟了一條嶄新的道路。雖然大數(shù)據(jù)與其他新技術一樣,必然要經(jīng)歷技術成熟度曲線,但是情報學的發(fā)展不能過度依賴大數(shù)據(jù),成為大數(shù)據(jù)的奴隸,而是應該讓大數(shù)據(jù)為情報學發(fā)展所用。總之,我們應該勇于面對、勇于創(chuàng)新,迎接大數(shù)據(jù)帶來的挑戰(zhàn)。
參考文獻:
[1] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學報:增刊,2013:142-146.
[2] 朱東華,張嶷,汪雪鋒,等.大數(shù)據(jù)環(huán)境下技術創(chuàng)新管理方法研究[J].科學學與科學技術管理,2013(4):172-180.
[3] 黃曉斌,鐘輝新.大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[J].圖書與情報,2012(6):9-14.
[4] 宗威,吳鋒.大數(shù)據(jù)時代下數(shù)據(jù)質量的挑戰(zhàn)[J].西安交通大學學報:社會科學版,2013(5):38-43.
[5] 彭蘭.“大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1):6-10.
[6] 何非,何克清.大數(shù)據(jù)及其科學問題與方法的探討[J].武漢大學學報:理論版,2014(1):3-12.
[7] 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(8):13-18.
[8] 夏蓓麗.“‘2008’網(wǎng)絡環(huán)境下的情報學發(fā)展研討會”綜述[J].社會科學,2008(12):180-181.
[9] 江俞蓉,張?zhí)烀?大數(shù)據(jù)時代情報學面臨的挑戰(zhàn)和機遇[J].現(xiàn)代情報,2013(8):58-60.
[10] 王知津,李贊梅,周鵬.二十年以來我國情報學學科體系研究進展[J].圖書館,2012(1):50-54.
[11] 包昌火,王秀玲,李艷.中國情報研究發(fā)展紀實[J].情報理論與實踐,2010(1):1-3.
【大數(shù)據(jù)環(huán)境下情報學發(fā)展的思考】相關文章:
數(shù)字時代情報學發(fā)展展望(筆談)--在數(shù)字環(huán)境下實現(xiàn)知識的組織和03-12
局域網(wǎng)數(shù)據(jù)庫環(huán)境下數(shù)據(jù)采集及處理12-24
在網(wǎng)絡環(huán)境下中學美術教學評價的思考與實驗11-20
對書目數(shù)據(jù)規(guī)范控制問題的思考03-22
對中式快餐發(fā)展的思考12-07
產(chǎn)業(yè)融合下的我國信息產(chǎn)業(yè)發(fā)展戰(zhàn)略思考03-20
全球化背景下漢語言文學發(fā)展思考12-10