四虎国产精品永久地址998_chinesexxx少妇露脸_日本丁香久久综合国产精品_一区二区久久久久_四虎av影视_久久久久国产一区二区三区不卡

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 當今大數據存在四大特征

當今大數據存在四大特征

2017-02-17 17:07:29 | 來源:中培企業IT培訓網

當今的大數據不僅僅是外行人嚴重的時髦名詞,更是專業領域當中的一個創造時代的技術和資源。對世界各國來說,大數據帶來的意義將是戰略性的,這也是很多國家的政府獎大數據作為戰略資源的重要原因。中培偉業《大數據分析與可視化》培訓專家謝老師認為,當前的大數據存在四大特征:

特征一:數據體量巨大(Volume)。

     有科學家計算過:目前互聯網一天所產生的信息,一天大概能發出2940億件郵件、200萬個帖子,這些信息用來制作DVD的話,可以制作1.68億張。不過隨著云計算和移動互聯網越來越普及,互聯網所能生產的信息也快速增長中。

人們通常將10TB以上的數據量稱為大數據,不過企業通常將各類數據集混合在一起,因而會有產生以PB為單位的數據量。1PB相當于2091500G的計算機容量。如圖。而有些大型企業的數據量可能接近或者超過EB量。

現在介紹下最小的數據單位,即字節,個二進制位就是一個字節。數據單位常見有KBMBGBTBPBEBZBYBBB等,我們最為熟悉的可能是GBKB,尤其是手機移動流量多少,通常會用這兩個單位來表示。按照這些排列的順序,兩個不同的單位,后者都是前者的1024倍,從我們目前常用的GB和絕大多數人所知道的最大內存大為TB來看,我們就可以看到當今的大數據的體量達到了何種程度。

特征二:數據類型繁多(Variety)。

     隨著大數據的不斷發展,大數據的種類和格式越來越豐富,而且越來越難以處理。以往,大多數據可以以文本的方式存儲起來,這類數據被稱為是結構化數據。而如今非結構化的數據逐漸增多,如視頻、音頻、電子郵件、地理位置信息、圖片等。

特征三:價值密度低(Value)。

     密度定律告訴我們,當物體質量一定時,其體積越大則密度越小。而在大數據中,大數據所創造的價值密度與數據總量是成反比的,當然,物體密度是一定的,不隨著物體質量、物體體積變化而變化。

以監視視頻為例,在長達兩小時的視頻內容中,有價值的數據可能只存在三四秒的時間。而大數據運用就是將這些有價值的信息挖掘出來,進行“提純”。

價值密度低導致數據分析專家的工作量大為增加,他們不得不收集可能多的數據,以免錯過有用信息。價值密度低,不代表大數據本身的價值低,事實上,大數據具有非常高的價值,且對各領域產生深遠而持久的影響。

特征四:處理速度快(Velocity)。

     如果沒有較快的處理速度,人們便無法發揮大數據的作用,這就像一個人面對著幾十桌美味佳肴,但他再怎么吃,也吃不完。而根據研究發現,目前全球數據量增長速度遠遠超過計算機處理速度的增長,更是遠遠超過人大腦信息的處理能力的增長。

在正常的傳輸渠道下,如果要存儲并分析1PB的數據,網速設為1G/s,計算機即使24日夜不停地運行,要將數據存入電腦中也得需要十多天,由此可知,速度的重要性。企業每天都產生巨額數據,如果在24小時里無法存儲完畢,將不可避免地導致一些信息被浪費掉。

具專業機構的分析報告指出,預測到2020年,全球數據量將達到讓人震驚的體量,如果沒有相應的速度來應對,那簡直就是一場災難。如果處理不好自己的大數據,企業也將無法從大數據中獲得任何好處。

云計算的誕生為大數據處理的速度插上了騰飛的翅膀,現在一個2G的電影可能不到一秒鐘就傳輸完畢,即使是1PB的數據量,20分鐘內也可以傳輸完畢。

大數據呈現的這四大特征,能夠幫組我們更好地了解大數據,最終運用大數據,這些特征也是人們檢驗一個數據集合是否為大數據的重要手段。

標簽: 大數據分析
主站蜘蛛池模板: 安塞县| 安福县| 新乡县| 潞城市| 上高县| 桐梓县| 县级市| 夏河县| 井陉县| 丰台区| 肥东县| 九台市| 西吉县| 台湾省| 榕江县| 鄂尔多斯市| 定远县| 桂平市| 凉城县| 西平县| 桑日县| 巍山| 邢台市| 华池县| 观塘区| 通榆县| 石家庄市| 舒兰市| 纳雍县| 上思县| 长丰县| 兴业县| 伊宁市| 于都县| 塘沽区| 天祝| 杭锦后旗| 旌德县| 奈曼旗| 彭阳县| 佛坪县|