大數據對很多人來說意義重大,但它的影響有多廣?想象壹下大數據的這些特點,以及把它們放在壹起的大師們。
不再只是壹個流行詞。
大數據,不管妳怎麽定義,都被大加贊揚,也被惡意中傷。它對許多人來說意味著許多事情:它是科學家和零售店主的壹種福利,也是壹種應對大量隱私和安全威脅的可用技術。
無論它是救世主還是騙局,甚至是兩者的結合,大數據仍然是權威人士、先知、營銷人員和安全愛好者的熱門話題。它的非官方定義也在逐漸演變。那是什麽?維基百科的定義開了壹個好頭:“任何數據的收集都是如此龐大和復雜,以至於很難使用數據管理工具或傳統的數據處理軟件。”
然而,當數據共享設備的數量呈幾何級數增長時,管理大量不同的高速(經典3V定義)數據集的挑戰正在發生變化。這些設備統稱為物聯網(IoT),包括機器傳感器和面向消費者的設備(如互聯恒溫器)、燈泡、冰箱和可穿戴健康監測器。IDC預測,IoT(物聯網)市場將在未來幾年爆發式增長,從2013年底的965438+億安裝設備增長到2020年的2810億。
對大數據的有用洞察可以幫助企業獲得許多潛在的好處,不僅可以銷售更多的產品和服務,還可以更好地管理健康,防止假藥泛濫,追蹤恐怖分子,甚至跟蹤妳的電話記錄。所以,我們知道大數據本身沒有好壞之分。重要的是妳如何使用它。
具有諷刺意味的是,無論大數據在提升人類體驗方面的潛力有多大,通常都很難對其進行收集、過濾、分析和解釋,以獲得那些寶貴的思想和見解。這張幻燈片審視了大數據面臨的挑戰及其應對能力。確鑿的事實會讓妳大吃壹驚。我們應該有怎樣的期待?嗯,看來Hadoop這個領先的大數據平臺的前途是光明的。數據科學家和相關的大數據專家在未來壹年應該會獲得高薪工作。
業內人士曾預言,“大數據”這個流行詞匯將逐漸淡出。Hortonworks總裁赫伯·庫尼茨(Herb Cunitz)在2012年2月的壹篇博客中寫道:“畢竟,這壹切都歸結於數據。大數據和所有關於這個空間的預測都將崩潰,分析師和所有密切關註的人(包括許多“大”供應商)將導致“數據管理”。
庫尼茨可能過早地預見了“大數據”的終結,但他準確地指出,這壹切終究要歸結到數據。只會改變管理工具。現在,請深入研究我們的幻燈片,並觀看壹些展出的統計分析和研究報告。
有多少數據被忽略?
根據Forrester最近的壹項研究,大多數公司預計他們已經分析了大約12%的現有數據。這是好是壞?好吧,這些公司可能錯過了隱藏在他們忽略的88%數據中的洞察和思考。也許他們明智地避免了耗盡資源和試圖煮沸海水的策略。Forrester認為,分析工具的缺乏和“強制性”的數據孤島是公司忽略自己大部分數據的兩個原因,原因還包括壹個簡單的事實:公司往往很難判斷哪些信息是有價值的,哪些信息最好忽略。
大數據爆炸
瘋狂的大數據對於有壹定技能的技術工人來說是個好消息。根據Dice的說法,壹個面向技術和工程專業人士的網站對數據專家的需求正在飆升。根據該網站4月份的報告,NoSQL專家的職位數量比上壹年增加了54%,而“大數據人才”的職位數量增加了46%。類似的Hadoop和Python人才崗位分別增加了43%和16%。當然,這和數據安全專家的招聘啟事比起來不算什麽。根據壹個令人印象深刻的統計,後者在過去的壹年裏飆升了162%。
大數據有多大?
數字世界的體量將在短短六年內從今天的3.2ZB增加到40ZB(1ZB大致相當於1億TB)。Hortonworks首席執行官Rob Bearden在加州聖何塞舉行的Hadoop Summit 2014主題演講中表示:“我們非常興奮地看到,我們周圍的數據量正在爆炸式增長,從現在到2020年,企業數據量將增長50倍。最重要的是,這些數據中有85%來自新的數據源。”比爾登指出,這些來源包括移動設備、社交媒體和聯網機器產生的數據,這對世界各地的企業來說既是挑戰也是機遇。