毫無疑問,當(dāng)前全球最大的大數(shù)據(jù)來源是Facebook,但其實(shí)任何規(guī)模的企業(yè)均可以從大數(shù)據(jù)技術(shù)以及大數(shù)據(jù)分析中獲益。例如全球時(shí)尚在線零售商GiltGroupe,就通過近五年的網(wǎng)站會(huì)員數(shù)據(jù)信息收集和分析工作,并制定有針對(duì)性的營銷活動(dòng),使得其銷售額達(dá)到五億美元;每一分鐘,Fab.com這家為設(shè)計(jì)師和客戶提供交流平臺(tái)的網(wǎng)站,都會(huì)結(jié)合用戶的購買歷史信息、會(huì)員信息發(fā)現(xiàn)趨勢,以驅(qū)動(dòng)業(yè)務(wù)決策。
那些傳統(tǒng)的實(shí)體公司可能都會(huì)面臨自己的挑戰(zhàn),但并非僅僅只是這些傳統(tǒng)實(shí)體企業(yè)缺乏數(shù)據(jù)信息。其實(shí),從群發(fā)的郵件、攝像機(jī)的視頻、銷售點(diǎn)系統(tǒng)、庫存系統(tǒng)和大多數(shù)企業(yè)的報(bào)告中,大多數(shù)企業(yè)均可以收集到足夠的數(shù)據(jù)信息來填充他們的大數(shù)據(jù)庫。將如此眾多的海量信息收集到一個(gè)單一的位置將是一個(gè)巨大的挑戰(zhàn)。
將磁盤或磁帶運(yùn)送到一個(gè)中央位置以便上傳到一個(gè)大數(shù)據(jù)庫的方案并非總是可行或可取的,而且在整個(gè)企業(yè)的網(wǎng)絡(luò)中傳輸這么多的數(shù)據(jù)信息往往也是不可能的。這不僅僅只是帶寬不足的問題。即使連接數(shù)百兆的網(wǎng)站,高速網(wǎng)絡(luò)的延遲和網(wǎng)絡(luò)質(zhì)量,也會(huì)極大地削弱實(shí)際吞吐量。例如,在100Mbps的連接情況下,端到端仍然會(huì)被限制在每流量5.24Mbps(假設(shè)有100毫秒的延遲,且無數(shù)據(jù)包丟失)。如果數(shù)據(jù)丟失哪怕只增加0.1%,吞吐量也會(huì)下降至每流量3.69Mbps。
訪問數(shù)據(jù)時(shí),網(wǎng)絡(luò)的限制問題也會(huì)帶來挑戰(zhàn)。對(duì)于大多數(shù)數(shù)據(jù)庫,用戶通常喜歡在他們的本地設(shè)備上復(fù)制數(shù)據(jù)和工作,而這又導(dǎo)致了需要在整個(gè)網(wǎng)絡(luò)上復(fù)制千兆以上的數(shù)據(jù)。運(yùn)用類似的做法實(shí)施大數(shù)據(jù)項(xiàng)目會(huì)導(dǎo)致網(wǎng)絡(luò)成本飆升,性能表現(xiàn)不佳和用戶挫折感增強(qiáng)。但是,企業(yè)不能限制本地用戶訪問大數(shù)據(jù);限制員工訪問和使用大數(shù)據(jù)是大數(shù)據(jù)項(xiàng)目失敗的一個(gè)重要限制原因。
網(wǎng)絡(luò)成本的膨脹是唯一影響大數(shù)據(jù)項(xiàng)目成本的因素。由于Hadoop的使用和其他開放源碼軟件包和擴(kuò)展存儲(chǔ)的使用,相對(duì)而言,較之傳統(tǒng)企業(yè)的數(shù)據(jù)倉庫,軟件和存儲(chǔ)的成本較低。但這些費(fèi)用往往不會(huì)影響行業(yè)內(nèi)地安全性、災(zāi)難恢復(fù)和可用性等監(jiān)管要求。
大部分企業(yè)未計(jì)算的還包括人力成本。鑒于今天的大數(shù)據(jù)市場的不成熟,據(jù)Gartner公司預(yù)計(jì),企業(yè)需要在人力成本方面花費(fèi)約20?25倍于供應(yīng)成本的咨詢和集成服務(wù)費(fèi)用。(相比之下,在成熟的市場,如商業(yè)智能系統(tǒng)市場,據(jù)Gartner公司預(yù)計(jì),其咨詢服務(wù)費(fèi)用僅為供應(yīng)成本的三倍左右。)盡管當(dāng)前人力成本很可能會(huì)持續(xù)上升。但企業(yè)仍然需要培訓(xùn)或聘請(qǐng)相關(guān)的人員來分析大數(shù)據(jù)?!皵?shù)據(jù)科學(xué)家”是結(jié)合了商業(yè)智能(BI)分析和統(tǒng)計(jì)學(xué)知識(shí)的專家,是那些發(fā)掘數(shù)據(jù)集以發(fā)現(xiàn)有價(jià)值的新見解,促進(jìn)企業(yè)業(yè)務(wù)流程自動(dòng)化和優(yōu)化的一類熱門人才的稱號(hào)。
云計(jì)算對(duì)于大數(shù)據(jù)來說是相當(dāng)完美的匹配。大數(shù)據(jù)所需要的存儲(chǔ)、計(jì)算、功率、復(fù)雜的數(shù)據(jù)庫的基礎(chǔ)設(shè)施和高端的數(shù)據(jù)處理能力均能夠被諸如亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)這樣良好的云服務(wù)產(chǎn)品來滿足。
AWS以極低的價(jià)格提供無限彈性云計(jì)算(EC2)、彈性塊存儲(chǔ)(EBS)和簡單存儲(chǔ)服務(wù)(S3)。它提供的DynamoDB是一款高度可用的分布式數(shù)據(jù)庫集群;而ElasticMapReduce是一個(gè)管理平臺(tái),支持基于Hadoop的分析棧。這些富有成本效益的資源和技術(shù)幫助企業(yè)在亞馬遜建立自己的分析,獲得更深入和更豐富的洞察。
但其面臨的挑戰(zhàn)仍然存在:如何將數(shù)據(jù)轉(zhuǎn)移到云或企業(yè)的數(shù)據(jù)中心。數(shù)據(jù)加速軟件解決了這個(gè)問題。通過在線路兩端運(yùn)行的實(shí)例,數(shù)據(jù)加速軟件可以提高吞吐量超過200倍。例如,移動(dòng)100GB的數(shù)據(jù),僅僅只需6.2分鐘,不再是22小時(shí)。數(shù)據(jù)加速通過優(yōu)化協(xié)議,以矯正延遲,復(fù)制數(shù)據(jù),以最大限度地利用帶寬。并且,在某些情況下,可以在傳遞過程中恢復(fù)丟失的數(shù)據(jù)包,而不需要重傳上傳,破壞吞吐量。因?yàn)閿?shù)據(jù)加速軟件可以按小時(shí)授權(quán),對(duì)于那些只需一次性轉(zhuǎn)移或不常轉(zhuǎn)移的大數(shù)據(jù)而言,成本可以非常低。
數(shù)據(jù)加速軟件是任何大規(guī)模的數(shù)據(jù)部署實(shí)現(xiàn)的關(guān)鍵一步。無論是部署在云中或在企業(yè)內(nèi)部,其都可以縮短時(shí)間,匯總數(shù)據(jù),極大地提高企業(yè)部署大數(shù)據(jù)項(xiàng)目的價(jià)值。
河南億恩科技股份有限公司(xuefeilisp.com)始創(chuàng)于2000年,專注服務(wù)器托管租用,是國家工信部認(rèn)定的綜合電信服務(wù)運(yùn)營商。億恩為近五十萬的用戶提供服務(wù)器托管、服務(wù)器租用、機(jī)柜租用、云服務(wù)器、網(wǎng)站建設(shè)、網(wǎng)站托管等網(wǎng)絡(luò)基礎(chǔ)服務(wù),另有網(wǎng)總管、名片俠網(wǎng)絡(luò)推廣服務(wù),使得客戶不斷的獲得更大的收益。
服務(wù)器/云主機(jī) 24小時(shí)售后服務(wù)電話:
0371-60135900
虛擬主機(jī)/智能建站 24小時(shí)售后服務(wù)電話:
0371-55621053
網(wǎng)絡(luò)版權(quán)侵權(quán)舉報(bào)電話:
0371-60135995
服務(wù)熱線:
0371-60135900