亚洲人成无码网站在线观看,狠狠亚洲婷婷综合色香五月排名,国产麻豆一精品一av一免费

中國大數(shù)據(jù)應用行業(yè)市場調(diào)研分析報告（部分內(nèi)容）

2021-08-16 閱讀：2016

一、大數(shù)據(jù)的生態(tài)系統(tǒng)

1、大數(shù)據(jù)的高效深度分析需要專用化的系統(tǒng)

在應用數(shù)據(jù)快速增長的背景下，為了降低成本獲得更好的能效，大數(shù)據(jù)系統(tǒng)需要逐漸擺脫傳統(tǒng)的通用技術(shù)體系，趨向?qū)Ｓ没募軜?gòu)和處理技術(shù)。這方面，國內(nèi)百度、阿里巴巴和騰訊三大互聯(lián)網(wǎng)巨頭做出了嘗試并取得了很好的效果。眾所周知，百度的大數(shù)據(jù)典型應用是中文搜索，阿里巴巴的大數(shù)據(jù)典型應用是基于交易日志分析的數(shù)據(jù)服務，騰訊的大數(shù)據(jù)典型應用是圖片數(shù)據(jù)存儲和基于用戶行為的廣告實時推薦。百度2013年底成立專門的大數(shù)據(jù)部門，旨在深度挖掘大數(shù)據(jù)的價值。阿里巴巴已將不同業(yè)務部門的大數(shù)據(jù)技術(shù)整合在一起為數(shù)據(jù)產(chǎn)品提供統(tǒng)一的服務。騰訊的數(shù)據(jù)平臺部正在將全公司的數(shù)據(jù)納入統(tǒng)一管理平臺。阿里巴巴在技術(shù)上與開源社區(qū)結(jié)合得最為緊密；騰訊大數(shù)據(jù)目前正在向開源技術(shù)靠攏；百度在技術(shù)層面偏好自行研發(fā)，包括軟硬件定制化方案也是最先投入實用。技術(shù)上，他們的共同之處是，不再依賴傳統(tǒng)的IOE，而基于開源系統(tǒng)（如Hadoop等）開發(fā)面向典型應用的大規(guī)模、高通量、低成本、強擴展的專用化系統(tǒng)。

2、大數(shù)據(jù)處理架構(gòu)多樣化模式并存

當前，克隆了Google的GFS和MapReduce的ApacheHadoop自2008年以來逐漸被互聯(lián)網(wǎng)企業(yè)所廣泛接納，并成為大數(shù)據(jù)處理領域的事實標準。但2013年出現(xiàn)的Spark作為一匹黑馬終結(jié)了這一神話，大數(shù)據(jù)技術(shù)不再一家獨大。由于應用不同導致Hadoop一套軟件系統(tǒng)不可能滿足所有需求，在全面兼容Hadoop的基礎上，Spark通過更多的利用內(nèi)存處理大幅提高系統(tǒng)性能。此外，Scribe、Flume、Kafka、Storm、Drill、Impala、TEZ/Stinger、Presto、Spark/Shark等的出現(xiàn)并不是取代Hadoop，而是擴大了大數(shù)據(jù)技術(shù)的生態(tài)環(huán)境，促使生態(tài)環(huán)境向良性化和完整化發(fā)展。今后在非易失存儲層面、網(wǎng)絡通信層面、易失存儲層面和計算框架層面還會出現(xiàn)更多、更好和更專用化的軟件系統(tǒng)。

3、實時計算逐步受到業(yè)界關注

Google于2010年推出了Dremel，引領業(yè)界向?qū)崟r計算邁進。實時計算是針對MapReduce這種批量計算的性能問題提出的，可分為流式計算和交互式分析計算兩種模式。在大數(shù)據(jù)背景下，流式計算源于服務器日志的實時采集，如Facebook開源的Scribe是分布式日志收集系統(tǒng)，ApacheFlume是類似的系統(tǒng)。ApacheKafka是高吞吐率的分布式消息系統(tǒng)，特點是高通量和容錯。Storm是容錯的分布式實時計算系統(tǒng)，可以可靠的處理流式數(shù)據(jù)并進行實時處理，單機性能可達到百萬記錄每秒。Storm可集成ApacheKafka作為其隊列系統(tǒng)。作為批量計算的補充，交互式分析計算的目標是將PB級數(shù)據(jù)的處理時間縮短到秒級。ApacheDrill是開源的Dremel實現(xiàn)，雖已有應用但尚不成熟。由Cloudera主導的Impala也參照Dremel實現(xiàn)，同時還參考了MPP的設計思想，目前已經(jīng)接近實用階段。Hortonworks主導開發(fā)了TEZ/Stinger，TEZ是運行在YARN（Hadoop2.0的資源管理框架）上的DAG計算框架，而Stinger是下一代的Hive。2013年底，由Facebook開源的Presto分布式SQL查詢引擎可對250PB以上的數(shù)據(jù)進行交互式分析，比Hive的性能高出10倍。類似的Shark是Spark上的SQL執(zhí)行引擎，得益于Shark的列存儲和Spark的內(nèi)存處理等特性，Shark號稱可以比Hive的性能提高100倍。

二、大數(shù)據(jù)產(chǎn)業(yè)的概念

大數(shù)據(jù)產(chǎn)業(yè)是指一切與大數(shù)據(jù)的產(chǎn)生與集聚、組織與管理、分析與發(fā)現(xiàn)、應用與服務相關的所有活動的集合。主要包括三個方面：（1）用以搭建大數(shù)據(jù)平臺、實現(xiàn)大數(shù)據(jù)組織與管理、分析與發(fā)現(xiàn)的相關IT基礎設施與軟件的銷售和租賃活動。（2）大數(shù)據(jù)平臺的運維與管理服務，系統(tǒng)集成、數(shù)據(jù)安全、云存儲等解決方案與相關咨詢服務。（3）與大數(shù)據(jù)應用相關的數(shù)據(jù)出售與租賃服務、分析與預測服務、決策支持服務、數(shù)據(jù)共享平臺、數(shù)據(jù)分析平臺等。大數(shù)據(jù)產(chǎn)業(yè)鏈按照數(shù)據(jù)價值實現(xiàn)流程包括數(shù)據(jù)生產(chǎn)與集聚層、數(shù)據(jù)組織與管理層、數(shù)據(jù)分析與發(fā)現(xiàn)層、數(shù)據(jù)應用與服務層。

上一篇：MAXHUB聯(lián)合長圖科技展示創(chuàng)新方案

下一篇：大數(shù)據(jù)應用行業(yè)市場調(diào)研分析報告（部分內(nèi)容）

色综合久久天天综线观看-色综合久久天天综合绕观看-色综合久久天天综合观看-色综合久久天天综合-色综合久久手机在线-色综合久久久久综合体桃花网