亚洲综合图片区自拍_思思91精品国产综合在线观看_一区二区三区欧美_欧美黑人又粗又大_亚洲人成精品久久久久桥本

大數(shù)據(jù)實時分析組件Storm

2023-02-03 12:12:57 來源:51CTO博客

一,實時分析概念


(資料圖)

1,離線分析

通常是需要一段時間的數(shù)據(jù)積累,到一定數(shù)量的數(shù)據(jù)后,開始離線分析,無論數(shù)據(jù)量多大,離線分析有開始,也有結(jié)束,最終得到一個處理的結(jié)果,這樣的分析過程,得到的結(jié)果是有較大的延遲的。

2,實時分析

通常數(shù)據(jù)不停的到來,隨著數(shù)據(jù)的到來,來進行增量的運算,立即得到新數(shù)據(jù)的處理結(jié)果,并沒有一個數(shù)據(jù)積累的過程,有開始,但沒有明確的結(jié)束時刻,數(shù)據(jù)實時的進行運算,基本沒有延遲。

二,Strore概述

Storm是一個開源的分布式實時計算系統(tǒng),可以簡單、可靠的處理大量的數(shù)據(jù)流。

Storm有很多使用場景:如實時分析,在線機器學(xué)習(xí),持續(xù)計算,分布式RPC,ETL等等。

Storm支持水平擴展,具有高容錯性,保證每個消息都會得到處理,而且處理速度很快。

Storm性能優(yōu)良,處理速度很快(在一個小集群中,每個結(jié)點每秒可以處理數(shù)以百萬計的消息)。

Storm的部署和運維都很便捷,而且更為重要的是可以使用任意編程語言來開發(fā)應(yīng)用。

三,Storm組件

Storm將實時運算的過程,拆分為若干簡單的步驟,再組裝在一起完成復(fù)雜計算任務(wù),由這些簡單步驟組裝起來的運算過程,稱之為一個Topology(拓撲)。

Topology由Spout(噴嘴)和Bolt(閥門)組成,Spout負責(zé)連接外部數(shù)據(jù)源,整個topology中以Strea(數(shù)據(jù)流)方式傳遞數(shù)據(jù),Stream數(shù)據(jù)流中傳遞的是一個個的tuple(元組)。

標(biāo)簽: 實時分析 處理速度 實時運算

上一篇:
下一篇: