網絡信息時代的高速發(fā)展,科技發(fā)達,信息通達,人與人之間的交流越來越密切,生活也越來越便捷了。大數(shù)據是互聯(lián)網科技發(fā)展到今天的必然產物。在以云技術為代表的革新下,那些原本很難收集和使用的數(shù)據開始容易被收集使用了,在各行各業(yè)的不斷革新下,大數(shù)據逐步變?yōu)楝F(xiàn)實并創(chuàng)造著更多的價值。
近年來,有人講大數(shù)據,有人講云計算,有人講人工智能,當一件事情幾個方向都在都在談的時候,意味著一個時代的來臨。那么,如何系統(tǒng)化地認識大數(shù)據呢?本文將從三大層面來展開,"解構"大數(shù)據。
第一層:理論
理論是認知的必經途徑,也是被廣泛認同和傳播的基線。大數(shù)據的定義及特征是對大數(shù)據的整體描繪與定性;我們先從其定義與特征出發(fā),來具體認知大數(shù)據。
定義:大數(shù)據(bigdata),指在一定時間范圍內無法用常規(guī)軟件或工具進行捕捉抓取、管理和處理的數(shù)據集,而是需要新處理模式才能更具有強的決策力、洞察力和流程優(yōu)化能力等的海量、多樣化和高增長率的信息資產。
特征:業(yè)界(IBM最早定義)將大數(shù)據的特征歸納為4個"V"(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,海量數(shù)據量。第二,數(shù)據類型繁多。第三,價值密度低,商業(yè)價值高。第四,速度快。第四點也是和傳統(tǒng)的數(shù)據挖掘技術有不同本質。
第二層:技術
技術是大數(shù)據價值體現(xiàn)的手段和前進的基石。那么,現(xiàn)階段和大數(shù)據相關的技術有哪些呢?這里將分別從云計算、分布式處理技術、存儲技術和感知技術來說明大數(shù)據從采集、處理、存儲到形成結果的全部過程。
云技術
在人工智能時代,互聯(lián)網是基礎設施,云計算是公共服務,那么大數(shù)據則是生產資料。大數(shù)據,離不開云計算,實時的大數(shù)據集分析需要分布式處理框架來向數(shù)以萬計的電腦分配工作。再或者,我們可以打個比方來說:如果云計算充當了工業(yè)革命時期發(fā)動機的角色,那么大數(shù)據則是電。
分布式處理技術
分布式處理系統(tǒng)可以用用通信網絡將具有不同功能的或不同地點的,擁有不同數(shù)據的N臺計算機連接起來,分布式處理系統(tǒng)的定義是指:在控制系統(tǒng)的統(tǒng)一管理控制下,協(xié)調地完成信息處理任務。
存儲技術
大數(shù)據可以抽象的分為大數(shù)據存儲和大數(shù)據分析,這兩者的關系是:大數(shù)據存儲的目的是支撐大數(shù)據分析。大數(shù)據存儲與大數(shù)據分析,其實還是倆種不同定義。大數(shù)據存儲致力于研發(fā)可以擴展至PB甚至EB級別的數(shù)據存儲平臺;大數(shù)據分析關注在最短時間內處理大量不同類型的數(shù)據集。
感知技術
大數(shù)據的采集和感知技術的發(fā)展是緊密聯(lián)系的。以傳感器技術,指紋識別技術,RFID技術,坐標定位技術等為基礎的感知能力提升同樣是物聯(lián)網發(fā)展的基石。這些感知被逐漸捕獲的過程就是被數(shù)據化的過程。
第三層:實踐
實踐是大數(shù)據的最終價值體現(xiàn),具體來說,現(xiàn)在城市都在走向智能和智慧,比如,智能電網、智慧交通、智慧醫(yī)療、智慧環(huán)保、智慧城市,這些都依托于大數(shù)據,可以說大數(shù)據是智慧的核心能源。如在輿情監(jiān)控方面,通過搜索網絡關鍵詞以及語義智能分析,可以提高輿情分析全面性、及時性。在管理交通方面,實時挖掘道路交通信息,可有效緩解交通擁堵,并快速響應突發(fā)狀況,為城市交通的有效運轉提供科學依據。
此文為新浪財經頭條(產經頭條)原創(chuàng)內容,特此聲明
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯(lián)系:010-65363056。
延伸閱讀