文摘:別被大數據迷住了眼睛

2013/5/22 0:00:00       來源:        作者:出處:中國計算機報 作者:記者 程彥博       瀏覽量:  1


文摘:別被大數據迷住了眼睛


出處:中國計算機報 作者:記者 程彥博


  不消說,大數據是現在IT領域最熱的詞匯,而且,它的熱度已經超出了IT領域。

大數據,將改變企業的營銷方式,精確分析客戶行為;將改變企業的運營管理方式,輔助企業決策,預測風險,提升效率……

且慢。在為大數據樹碑立傳之前,需要先考察一下大數據所謂何物。

IT領域從來都不缺概念,無論是3V還是4V的大數據屬性,新概念一出,就會有人想當然地、在沒有經過深入的思考和考證之前,表現出對新概念的認同。

不可否認,移動互聯網、社交網絡、物聯網讓人類社會的數據量大幅增長,然而,這就是大數據嗎?在大數據的概念出現之前,就沒有客戶分析,沒有輔助決策、風險預測嗎?在大數據的概念出現之前,相對于我們的數據處理和分析能力,我們所擁有的數據就是“小數據”嗎?

顯然,答案是否定的。

數據挖掘和數據分析并不是新的學科,我們在這一領域擁有很多成熟的技術。筆者以為,今天所講的大數據,正是對數據挖掘和分析的不斷完善和提高,將更多的非結構化、半結構化和流數據引入數據挖掘和分析的領域,而不是另起爐灶,并為其賦予一個似是而非、含混不清的名詞——大數據。

大數據能夠被熱烈地討論,是因為其在精神層面上滿足了人們對未知事物的好奇心,在物質層面上有Hadoop、NoSQL這樣實實在在的技術作為支持。實際上,如果能夠厘清大數據的概念,把大數據定位為對傳統數據挖掘和分析的提升,那么就可以很容易地認識到,Hadoop、NoSQL并不是大數據的全部。

Teradata的CTO寶立明就認為,Hadoop是一個非常好的、價格低廉的非結構化數據存儲和管理工具。然而就像任何事情都有兩面性一樣,Hadoop在一些數據結構穩定、需要進行整合分析的場景中并不適用,或者說有其他更好的方式,并且Hadoop的開源特性會帶來更高的部署成本。

歸根結底,我們不應該被大數據風暴迷了眼睛。我們討論大數據,依然是希望通過對大數據的挖掘和分析來發現數據的價值。要最終挖掘出數據價值,既要運用新的技術,也不能拋棄傳統的數據挖掘和分析的技術與方法,不要對新技術盲目崇拜或者盲目排斥,而應該對其進行評估,以最優的方式將新技術與傳統方式結合起來,這樣才能最大限度地獲得數據的價值。

就像寶立明說的那樣,要盡量擯棄炒作給大數據帶來的影響,讓大數據回到正確的軌道上。

(責任編輯:孫悅)
 

99亚洲伊人久久精品影院