• <ul id="mayc0"></ul>
    <ul id="mayc0"><center id="mayc0"></center></ul>
    <strike id="mayc0"><input id="mayc0"></input></strike>
    <ul id="mayc0"></ul>
  • 始創于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業
    • 60秒人工響應
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補償
    您的位置: 網站首頁 > 幫助中心>文章內容

    詳聊Google云計算的基礎架構

    發布時間:  2012/9/15 16:27:43

    GFS是 google自己設計的分布式文件系統,是大量安裝有Linux操作系統的普通PC構成的集群系統。整個集群系統由一臺Master(通常有幾臺備份)和若干臺TrunkServer構成。GFS中文件備份成固定大小的Trunk分別存儲在不同的TrunkServer上,每個Trunk有多份拷貝,也存儲在不同的TrunkServer上。Master負責維護GFS中的 Metadata,即文件名及其Trunk信息。客戶端先從Master上得到文件的Metadata,根據要讀取的數據在文件中的位置與相應的 TrunkServer通信。本文介紹Google云計算的基礎架構。

    據介紹,google的每一份數據至少放在三個不同位置的機器上,所以可靠性是可以高度保證的;而且操作GFS和操作本地磁盤一樣簡單易行。

    目前Google擁有超過200個的GFS集群,其中有些集群的計算機數量超過5000臺。Google現在擁有數以萬計的連接池從GFS集群中獲取數據,集群的數據存儲規模可以達到5個PB,并且集群中的數據讀寫吞吐量可達到每秒40G。

    MapReduce是一個編程模式,它是與處理/產生海量數據集的實現相關。用戶指定一個map函數,通過這個map函數處理key/value(鍵/值)對,并且產生一系列的中間key/value對,并且使用reduce函數來合并所有的具有相同key值的中間鍵值對中的值部分。MapReduce的主要貢獻在于提供了一個簡單強大的接口,通過這個接口,可以把大尺度的計算自動的并發和分布執行。

    常見的應用例子:在很大的文檔集合中通機每一個單詞出現的次數.map函數檢查每一個單詞,并且對每一個單詞增加1到其對應的計數器;reduce函數把特定單詞的所有出現的次數進行合并。其他例子:

    URL訪問頻率統計:map函數處理webpag請求和應答(URL,1)的log。Reduce函數把所有相同的URL的值合并,并且輸出一個成對的(URL,總個數)。

    逆向Web-Link,map函數輸出所有包含指向target URL的source網頁,用(target,source)這樣的結構對輸出。Reduce函數局和所有關聯相同target URL的source列表,并且輸出一個(target,list(source))這樣的結構。

    分布式排序:map函數從每條記錄中抽取關鍵字,并且產生(key,record)對。reduce函數原樣輸出所有的關鍵字對。

    BigTable:一種用于管理超大規模結構化數據的分布式存儲系統,可以管理分布在數以千計服務器上的以PB計的數據。Bigtable API將包括用于創建、編輯表和列,改變群集、表、列元數據的函數。BT不支持完全的關系數據模型,而是為客戶提供了簡單的數據模型,讓客戶來動態控制數據的分布和格式。BT只能支持大部分SQL。

    Google App Engine

    Google App Engine是一個開發、托管網絡應用程序的平臺,使用Google管理的數據中心。它在2008年4月發布了第一個beta版本。Google App Engine使用了云計算技術,它跨越多個服務器和數據中心來虛擬化應用程序。當前,Google App Engine支持的編程語言是Python和Java. http://appengine.google.com

    Hadoop
    ◆Hadoop(http://hadoop.apache.org)是apache下面的一個分布式并行計算框架,是從lunece中抽取出來的一個框架。Hadoop主要是由HDFS、MapReduce和Hbase組成。
    ◆HDFS是Google File System(GFS)的開源實現。
    ◆MapReduce是Google MapReduce的開源實現。
    ◆HBase是Google BigTable的開源實現

    Google的上述分布式框架很有創造性,而且有極大的擴展性,使得Google在系統吞吐量上有很大的競爭力,但是用C++寫的。因此Apache基金會用Java實現了一個開源版本hadoop,支持Fedora、Ubuntu等Linux平臺。以上介紹Google云計算的基礎架構。
    聯系QQ:916656313(億恩-雨軒)   聯系電話:15378720700


    本文出自:億恩科技【www.vbseamall.com】

    服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線