(電子商務(wù)研究中心訊) 亞馬遜基于云的大數(shù)據(jù)分析數(shù)據(jù)庫服務(wù)Redshift現(xiàn)在已經(jīng)逐步開放,在考慮遷移到Redshift之前,本文是您應(yīng)該知道的
亞馬遜AWS最近將其低成本的大數(shù)據(jù)分析服務(wù)Redshift提供給數(shù)量有限的一些用戶。您可以將Redshift想象為一個基于公共云的大型關(guān)系型數(shù)據(jù)庫,為支持數(shù)據(jù)倉庫而設(shè)計。您也可以期望看到這樣的云服務(wù)將沖擊到數(shù)據(jù)倉儲供應(yīng)商巨頭們-譬如甲骨文、IBM、Teradata以及EMC等。
使用AWS管理控制臺或亞馬遜的Redshift API,企業(yè)可以提供一個單一2TB的數(shù)據(jù)庫,或者,他們可以選擇16個2TB的超大容量存儲(XL)節(jié)點或16TB的8個超大容量存儲(8XL)節(jié)點的集群。除了2TB或16TB的存儲空間,他們也有15GB或120GB的RAM。定價是合理的,XL節(jié)點每小時85美分,8XL節(jié)點為每小時6.80美元。
亞馬遜稱,Redshift可直接集成到亞馬遜的其它服務(wù),如S3和DynamoDB,非常適合運行各種相關(guān)的數(shù)據(jù)密集型應(yīng)用程序及應(yīng)對不斷增長的大數(shù)據(jù)趨勢。
與任何其他技術(shù)一樣,你必須要考慮Redshift好的方面和壞的方面。這里是一些明顯的好處:
·能夠提供龐大的數(shù)據(jù)庫,而不必通過昂貴和緩慢的采購過程獲得的硬件和軟件。亞馬遜相關(guān)負責人表示,“依賴柱狀數(shù)據(jù)存儲和先進的壓縮技術(shù),Redshift相比傳統(tǒng)的數(shù)據(jù)倉庫具有極高性價比優(yōu)勢。”
·可擴展的處理龐大的資料庫的能力,也許遠遠超出了PB級的范圍;
·使用彈性資源的潛力,經(jīng)營業(yè)務(wù)時,有足夠的速度返回實際相關(guān)的結(jié)果集;
·相對于長期使用自己的硬件和軟件的成本,可能節(jié)省大量的金錢。
而缺點則主要如下:
·停電的可能性,并不是說您的內(nèi)部數(shù)據(jù)倉庫永遠不會宕機,但任何故障將會成為公眾事件,并且給內(nèi)部使用云計算帶來失望;
·數(shù)據(jù)遷移和整合的成本,盡管亞馬遜聲明說“Redshift以十分之一的成本帶來相當于目前主流本地數(shù)據(jù)倉儲方案的十倍性能”,但在許多情況下,你仍將需要大量的帶寬來從內(nèi)部系統(tǒng)傳輸數(shù)據(jù)到云托管的Redshift,否則你會被USB驅(qū)動器通過聯(lián)邦快遞運送到亞馬遜AWS服務(wù)所困擾;
·缺乏最佳實踐,在公共云托管的數(shù)據(jù)倉庫,我們才剛剛起步,顯然還有很多的東西需要學習;
·成本上升的可能性,雖然很多企業(yè)會發(fā)現(xiàn)云托管的數(shù)據(jù)庫節(jié)約成本,如Redshift,但很多人會發(fā)現(xiàn),他們需要為云計算服務(wù)支付的費用比預(yù)期的要高得多-可能超過了內(nèi)部部署數(shù)據(jù)庫的成本。
據(jù)悉,亞馬遜Redshift服務(wù)首先在美國東部地區(qū)提供,未來幾個月將向其它地區(qū)提供服務(wù)。預(yù)計Redshift將會獲得成功,因為很多人會喜歡它。
最新的消息顯示,Redshift目前已經(jīng)獲得數(shù)據(jù)集成和數(shù)據(jù)治理專家Informatica的支持,后者日前宣布了“用于Amazon Redshift的Informatica云連接器”,可以快速并可靠地將數(shù)據(jù)移入Amazon Redshift,無論是從企業(yè)內(nèi)部部署的系統(tǒng),還是其他云應(yīng)用。
不過,在我們開始遷移之前,有必要打開我們的視野,做一次深呼吸,進行周密的規(guī)劃。(作者:雷霆出處:IT專家網(wǎng);編選:網(wǎng)經(jīng)社)