Impala打開分布式技術(shù)的大門 天云數(shù)據(jù)Hubble趕超

在數(shù)據(jù)體量121億條賬戶下進行資金查詢測試丰歌,天云數(shù)據(jù)Hubble的性能是Impala的231%倍姨蟋。


Impala,一種棲息在非洲南部的高角羚立帖,行動敏捷奔跑迅速眼溶,以其優(yōu)雅的姿勢和杰出的跳躍能力而出名。受驚的時候可以跳起?3米高晓勇,9米遠堂飞。



Cloudera研發(fā)這頭高角羚(Impala)的初衷也很明了——提高Hive SQL查詢的速度灌旧。就官方測試性能開看,Impala比Hive快10到100倍绰筛,其SQL查詢比SparkSQL還要更加快速节榜。Impala號稱是當前大數(shù)據(jù)領(lǐng)域最快的查詢SQL工具,也因其更快的速度被市場所熟知别智。其面對即席查詢(Ad-Hoc Query)類請求的穩(wěn)定性和速度在工業(yè)界得到過廣泛的驗證宗苍。


我們所熟知阿里巴巴、百度薄榛、google讳窟、facebook,包括新一代的分布式計算敞恋、容器化丽啡、機器學習人工智能等技術(shù)框架都在使用Impala。Impala突破了單機技術(shù)的限制硬猫,打開了分布式技術(shù)的大門补箍,是技術(shù)架構(gòu)革命性創(chuàng)新的引領(lǐng)者。


眾所周知啸蜜,傳統(tǒng)技術(shù)機構(gòu)主要依賴于-IOE(?IBM的小型機坑雅、Oracle數(shù)據(jù)庫、EMC存儲設(shè)備)衬横,只能通過增加配置提升性能裹粤,系統(tǒng)無法橫向水平擴展。分布式存儲不僅解決了單機存儲的性能瓶頸蜂林,還支撐海量數(shù)據(jù)在線實時并發(fā)服務(wù)應(yīng)用遥诉。


傳統(tǒng)技術(shù)好比轎車,能承載多少人是固定的噪叙,想多承載人只能換成客車矮锈;但分布式存儲技術(shù)好比火車和高鐵,按節(jié)承載睁蕾,遇到春運可以增加車廂運輸客流量苞笨。


國產(chǎn)數(shù)據(jù)庫產(chǎn)品Hubble就是這高速列車,雖不是為速度而生惫霸,卻在速度上趕超Impala猫缭。


在數(shù)據(jù)體量121億條賬戶下進行資金查詢測試,?Hubble的性能是Impala的231%倍壹店。



之所以做這個測試猜丹,源于某證券用戶在使用Hubble進行數(shù)據(jù)查詢后,感嘆到:這也太快了硅卢,簡直比Impala還快射窒。


Hubble藏杖,人類天眼,位于地球的大氣層之上的光學望遠鏡脉顿。從1990年到2015年4月蝌麸,哈勃望遠鏡在地球軌道上運行了接近13萬7千圈,累計54億公里艾疟,執(zhí)行了120多萬次觀測任務(wù)来吩,觀察了超過38,000個天體蔽莱,增進了人類對宇宙的了解弟疆。“哈勃遺產(chǎn)場”是迄今最完整最全面的宇宙圖譜盗冷。


天云數(shù)據(jù)研發(fā)Hubble的初衷也非常明了怠苔,融合傳統(tǒng)數(shù)據(jù)庫形成支持混合負載交易的數(shù)據(jù)聯(lián)邦。在實際應(yīng)用中仪糖,hubble完成了‘去IOE’中最困難的部分柑司,在幾家大型商業(yè)銀行核心交易中成功替換Oracle,在銀行的聯(lián)機事務(wù)中解決A類核心系統(tǒng)減負問锅劝。一句話概述攒驰,Hubble讓生態(tài)合作伙伴無縫切入大數(shù)據(jù)服務(wù)領(lǐng)域。

?

在分布式的新世界里鸠天,數(shù)據(jù)從‘生產(chǎn)產(chǎn)物’變成了‘生產(chǎn)者’讼育,數(shù)據(jù)身份的轉(zhuǎn)換對技術(shù)帐姻、人才的需求都發(fā)生了改變稠集。很多企業(yè)想進入大數(shù)據(jù)服務(wù)領(lǐng)域,苦于人才難找饥瓷、技術(shù)不行剥纷、項目周期太長、運維成本太高呢铆。這就好比一個人想寫一本內(nèi)容涵蓋家庭裝修晦鞋、家庭布置、家庭關(guān)系處理的書棺克,雖然都跟家庭有關(guān)悠垛,但具體內(nèi)容卻是術(shù)業(yè)有專攻,需要大量時間學習這三個方向的內(nèi)容然后進行整合娜谊。但是在hubble的世界里只需調(diào)動這三個方向的專家确买,讓他們各自撰寫自己擅長的內(nèi)容,然后整合到一起纱皆,專業(yè)度更有保障湾趾,出書所需時間更短芭商。


為什么Hubble會在速度上如此有優(yōu)勢?


從?SQL?解析層上搀缠,Hubble?采用基于?AI?評估函數(shù)創(chuàng)建模型铛楣,在需要的時候直接調(diào)用完成目 標的預(yù)測并估算每組執(zhí)行計劃的代價。簡單來說艺普,就是用經(jīng)驗使用數(shù)據(jù)簸州,用數(shù)據(jù)更新經(jīng)驗, 雙管齊下速度更優(yōu)歧譬。


在數(shù)據(jù)存儲層上勿侯,Hubble?采用基于切片的列式存儲和?KV?存儲的混合部署模式。大數(shù)據(jù)環(huán)境下的Hbase缴罗、HP Vertica助琐、EMC Greenplum?等分布式數(shù)據(jù)庫采用的列式存儲。常規(guī)行式存儲下一張表的數(shù)據(jù)都是放在一起的面氓,查詢時所有數(shù)據(jù)都要被讀取兵钮。但列式存儲下數(shù)據(jù)被分開保存了,查詢時只有涉及到的列會被讀取舌界,從而對于大表數(shù)據(jù)效率更高掘譬。KV?存儲把不常變動的一些數(shù)據(jù)存儲在kvstore中,需要的時候直接憑借key拿出value?就好呻拌,方便快捷就是它應(yīng)對隨機IO訪問的優(yōu)勢葱轩。在大規(guī)模數(shù)據(jù)同時支持密集AP計算和TP并發(fā)場景下,基于數(shù)據(jù)切片的混布存儲策略可以彈性適應(yīng)IO特性藐握,需要進一步優(yōu)化時也可以快速做庫內(nèi)轉(zhuǎn)換靴拱,避免數(shù)據(jù)復制和冗余。


在數(shù)據(jù)計算上猾普,hubble是基于內(nèi)存的計算框架袜炕,輸出結(jié)果可以保存在內(nèi)存中,減少數(shù)據(jù)的落地初家,后續(xù)的執(zhí)行結(jié)果有依賴前面結(jié)果的可以直接從內(nèi)存中獲取得到偎窘,避免了磁盤的io操作,性能更高速度更快溜在。


據(jù)IDC預(yù)測陌知,2017-2022年,全球軟分布式存儲市場規(guī)模的平均增速為14.7%掖肋,而中國分布式存儲市場的平均增速為32.5%仆葡。有分析師樂觀地預(yù)測,未來3年培遵,在中國市場上浙芙,分布式存儲或?qū)⒄紦?jù)整個存儲市場的半壁江山登刺。

?

未來學家阿爾文·托夫勒說:“如今所有的國家都面對一個逃不了的規(guī)律—最快者生存∥撕簦“

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纸俭,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子南窗,更是在濱河造成了極大的恐慌揍很,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件万伤,死亡現(xiàn)場離奇詭異窒悔,居然都是意外死亡,警方通過查閱死者的電腦和手機敌买,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門简珠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人虹钮,你說我怎么就攤上這事聋庵。” “怎么了芙粱?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵祭玉,是天一觀的道長。 經(jīng)常有香客問我春畔,道長脱货,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任律姨,我火速辦了婚禮振峻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘线召。我一直安慰自己铺韧,他們只是感情好,可當我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布缓淹。 她就那樣靜靜地躺著,像睡著了一般塔逃。 火紅的嫁衣襯著肌膚如雪讯壶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天湾盗,我揣著相機與錄音伏蚊,去河邊找鬼。 笑死格粪,一個胖子當著我的面吹牛躏吊,可吹牛的內(nèi)容都是我干的氛改。 我是一名探鬼主播,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼比伏,長吁一口氣:“原來是場噩夢啊……” “哼胜卤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起赁项,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤葛躏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后悠菜,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體舰攒,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年悔醋,在試婚紗的時候發(fā)現(xiàn)自己被綠了摩窃。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡芬骄,死狀恐怖偶芍,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情德玫,我是刑警寧澤匪蟀,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站宰僧,受9級特大地震影響材彪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜琴儿,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一段化、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧造成,春花似錦显熏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至鼓鲁,卻和暖如春蕴轨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背骇吭。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工橙弱, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓棘脐,卻偏偏與公主長得像斜筐,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子蛀缝,可洞房花燭夜當晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容