如何壯大Hadoop?十大帥哥專家激情獻策 |
發布時間: 2012/8/2 9:16:44 |
2010年Hadoop中國云計算大會于9月4日在北京文津國際酒店成功舉行,這場技術盛宴的主要目的就是促進Hadoop在中國的發展。大會日程的最后階段是圓桌會議,來自IBM 、facebook、yahoo、中科院計算所、百度、江南所等十大技術專家聚為一堂,對如何為Hadoop做貢獻、如何壯大Hadoop的話題進行了如火如荼的討論。
如何如何壯大Hadoop?這不是一個三言兩語就能回答的問題,也是許多公司、企業、研究單位和個人一直在探討的問題,是靠開源社區?還是靠公司的研發團隊?或者是研究單位的力量?各個單位或個人又該如何貢獻自身的最大力量?就像主持人韓軼平所說的,我們剛開始接觸Hadoop的時候是獲取,獲取到一定程度以后是貢獻了,至于如何為Hadoop做貢獻,九位嘉賓也十分踴躍地表達了自己的觀點。 企業:試用/反饋模式促進Hadoop發展 百度王守彥首先表達了自己的觀點,他指出,要發展Hadoop還需要用戶去試用基于Hadoop的產品,并將試用的結果進行反饋,這樣才能促進Hadoop事業的進一步發展。他在談話中提到,百度當日發布的項目實際上是對Hadoop計算層進行重寫,這是對Hadoop性能的提升是很有幫助的,同時他希望有更多的人來試用他們的產品,并給他們的開發人員一些反饋,共同促進Hadoop的發展。 個人:如何把比較小的feature commit到Hadoop里面去? 在主持人問到具體如何把比較小的feature Commit到Hadoop里面去的時候,Facebook軟件工程師陳俊仰指出,首先就是要敢于發表自己的意見,更重要的是需要圓潤一點,用討論的語氣跟大家商量。之所以需要圓潤一點是因為各家公司的立場不同。比如說Yahoo,他們投入了許多的成本,當然不希望里面的東西被換掉,而facebook使用的環境變化很大,所以會比較積極地去之時Hadoop的變化,還有像Cloudera這樣企業,他需要各種各樣的feature,因為他們有很多客戶,總之,各家企業的立場不同,想法也就不同,所以我們在commit的時候一定要注意圓潤一些。 研究單位:取之于開源用之于開源 談過了互聯網企業、個人等如何貢獻與開源之后,主持人又問到了作為研究單位應該如何促進Hadoop的發展,中科院計算所查禮表示,科研院所包括高校這種研究單位可以在開源的基礎上,取之于開源用之于開源。 他指出,研究單位可以從開源中獲取,并通過修改滿足自己的要求,再回饋于社區,這樣才能保證社區的良性的循環。查理還分享了他們的一個案例,中科院在08年的時候需要一套分布式存儲的東西,經過調查發現HDFS比較適合他們的需求,并且利用開源的東西與完全自主開發相比,能節省時間、人力資源,于是他們選擇了利用開源的基礎和社區的力量,很快做成了他們想要的東西,并且已經將成果貢獻到開源社區里去了。 同時還有其他嘉賓補充道:不管是學校還是研究單位還是企業,第一,就是要用開源,并將其推廣,作為一個標準,那是對一個開源軟件最好的鼓勵和動力;第二,把自己做的東西貢獻給大家。 技術交流促Hadoop發展:技術大會、深入的技術交流、社區交流 如何促進Hadoop在中國社區的發展?話筒交給了Yahoo北京研發中心的首席架構師兼技術總監鄭皓,他表示,yahoo從Hadoop In China兩年前第一次舉辦開始,一直與計算所合作,并且,不管是在活動還是社區,積極技術上,Yahoo都會繼續支持Hadoop在中國的推廣。 同時,會在接下來的一個周一舉辦一個Hadoop研發和應用發面體會的分享,幫助國內的開發人員解答Hahoop的Contribution方面的疑難,比如Check in等過程。 IBM王遠紅也在表示了自己的觀點,他說,要想壯大Hadoop,還是要加強更深入的技術交流,比如說IBM與百度、IBM與yahoo等等,這樣對進一步減少使用Hadoop的風險是很有好處的。他還談到,社區交流也是一個很重要的方面,無論是高校、公司都可以參與進去,多回答問題,壯大整個社區。 與傳統企業共促Hadoop發展 針對如何壯大Hadoop的問題,IBM中國開發中心信息管理極限分析開發部門經理王遠紅指出,現在Hadoop主要是在互聯網公司比較熱門,但是作為傳統企業,如金融公司等,他們有大量的Lagancy的數據,怎么來用Hadoop做大規模的數據處理,去挖掘一些數據作分析,也是很重要的,但是他們有沒有internet企業那么gressive,所以就希望會有企業提供Hadoop的服務,或者是開發更多的基于Hadoop的服務、應用。他表示IBM就在做基于Hadoop的產品,用戶購買了Hadoop的產品以后,遇到的問題會被提到一個很高的Priority,得到企業級的支持,這與社區的支持是有區別的。 編者按:個人認為開源的社會價值是不可否認的,因此,促進開源事業的發展是一個值得關注的話題。Hadoop是一個由Apache基金會開發的分布式系統基礎架構,名字起源于作者兒子的一只吃飽了的大象的名字。Hadoop從發展之初到現在,逐步完善的過程凝結了無數開源開發者對技術的癡迷和貢獻精神。開源的事業,包括Hadoop在內,是整個IT業界的事業,大家在索取的同時不要忘了貢獻,只有這有這樣,開源事業才能壯大起來!
本文出自:億恩科技【www.vbseamall.com】 |