• <ul id="mayc0"></ul>
    <ul id="mayc0"><center id="mayc0"></center></ul>
    <strike id="mayc0"><input id="mayc0"></input></strike>
    <ul id="mayc0"></ul>
  • 始創于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業
    • 60秒人工響應
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補償
    您的位置: 網站首頁 > 幫助中心>文章內容

    數據分析不使用Hadoop的五大理由

    發布時間:  2012/8/18 19:48:20

    我一度是Hadoop的忠實擁護者。我喜歡它可以輕而易舉地處理PB級別的數據,喜歡它可以將運算擴展到數千個節點的分布式計算能力,也喜歡它存儲和加載數據的靈活性。但在經歷過一系列的探索與使用之后,我對Hadoop非常失望。

    下面就是我為什么不使用Hadoop做數據分析的見解。

    Hadoop只是一個框架,而非一種完備的解決方案。人們期望Hadoop可以圓滿地解決大數據分析問題,但事實是,對于簡單的問題Hadoop尚可,對于復雜的問題,依然需要我們自己開發Map/Reduce代碼。這樣看起來,Hadoop與使用J2EE編程環境開發商業分析解決方案的方式別無二致!

    Pig和Hive都非常不錯,但卻受到架構的局限。Pig和Hive都是設計精巧的工具,它們可以讓人迅速上手,提高生產力。但它們畢竟只是一種工具,用于將常規的SQL或文本轉化成Hadoop環境上的Map/Reduce查詢。Pig和Hive受限于Map/Reduce框架的運作性能,尤其是在節點通信的情況下(如排序和連接),效率更為低下。

    沒有軟件成本,部署相對容易,但維護和開發的代價極大。Hadoop非常受歡迎的理由在于,我們可以自由的下載、安裝并運行。由于它是一個開源項目,所以沒有軟件成本,這使得它成為一種非常吸引人的解決方案,用于替代Oracle和Teradata.但是一旦進入維護和開發階段,Hadoop的真實成本就會凸顯出來。

    擅長大數據分析,卻在某些特定領域表現不佳。Hadoop非常擅長大數據分析,以及將原始數據轉化成應用(如搜索或文本挖掘)所需的有用數據。但如果我們并不很清楚要分析的問題,而是想以模式匹配的方式探索數據,Hadoop很快會變得一塌糊涂。當然,Hadoop是非常靈活的,但需要你花費較長的時間周期去編寫Map/Reduce代碼。

    并行處理的性能極佳,但不排除特例。Hadoop可以將數千個節點投入計算,非常具有性能潛力。但并非所有的工作都可以進行并行處理,如用戶交互進行的數據分析。如果你設計的應用沒有專門為 Hadoop集群進行優化,那么性能并不理想,因為每個Map/Reduce任務都要等待之前的工作完成。

    綜上所述,Hadoop的確是一個令人震驚的計算框架,它可以進行大規模的數據分析。另一方面,這也意味著數據分析工作必須建立在大量的編程工作之上。


    本文出自:億恩科技【www.vbseamall.com】

    服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線