該方案的數(shù)據(jù)流向如下:物聯(lián)網(wǎng)平臺(tái)將設(shè)備上報(bào)的數(shù)據(jù)通過規(guī)則引擎功能轉(zhuǎn)發(fā)至數(shù)據(jù)接入服務(wù)(DIS)。DIS使用對象存儲(chǔ)服務(wù)(OBS)作為中介,再將數(shù)據(jù)轉(zhuǎn)儲(chǔ)至MapReduce服務(wù)(MRS)。MRS從OBS獲取用戶定制的分析程序包,運(yùn)行程序分析數(shù)據(jù),并保存分析結(jié)果(可寫入持久化數(shù)據(jù)庫或?qū)懗晌募?shù)據(jù)可視化服務(wù)(DLV)讀取分析結(jié)果呈現(xiàn)為可視化報(bào)表。實(shí)現(xiàn)該方案,您需要進(jìn)行以下操作:在MRS中創(chuàng)建一個(gè)Hadoop分析集群。參考MRS的開發(fā)指南開發(fā)一個(gè)大數(shù)據(jù)分析程序,實(shí)現(xiàn)讀取JSON格式的數(shù)據(jù)分析并處理,然后寫入本地?cái)?shù)據(jù)庫或者寫成文件存到OBS。程序開發(fā)完成后需打包成JAR文件并上傳至OBS桶,若您沒有OBS桶請創(chuàng)建一個(gè)。創(chuàng)建一條DIS通道,然后為該通道創(chuàng)建一個(gè)轉(zhuǎn)儲(chǔ)任務(wù),將數(shù)據(jù)轉(zhuǎn)儲(chǔ)至MRS的集群。在設(shè)備接入服務(wù)中創(chuàng)建一條規(guī)則,將設(shè)備上報(bào)數(shù)據(jù)轉(zhuǎn)發(fā)至DIS的通道。將上報(bào)數(shù)據(jù)的設(shè)備接入物聯(lián)網(wǎng)平臺(tái)(設(shè)備接入服務(wù)),并控制其上報(bào)數(shù)據(jù)。在MRS中創(chuàng)建一個(gè)作業(yè),執(zhí)行OBS桶中的大數(shù)據(jù)分析程序。在DLV中創(chuàng)建數(shù)據(jù)連接從MRS數(shù)據(jù)庫或OBS中讀取數(shù)據(jù),再創(chuàng)建數(shù)據(jù)大屏將數(shù)據(jù)可視化展示。需要保證數(shù)據(jù)能持續(xù)穩(wěn)定寫入。南通設(shè)備物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)分析
大數(shù)據(jù)和分析將革新制造業(yè)生產(chǎn)制造商開始使用大數(shù)據(jù)和分析,并與物聯(lián)網(wǎng)相結(jié)合以作出決定,20年前,我們對此只能想象。例如,在汽車內(nèi)連接傳感器,并結(jié)合大數(shù)據(jù)和分析來預(yù)測,當(dāng)一輛汽車有可能出故障之前,實(shí)際上已經(jīng)發(fā)生。這一過程不僅會(huì)通知司機(jī),而且他們的車輛可能在服務(wù)之前出故障,這可以支持汽車制造商調(diào)查潛在的缺陷,并改進(jìn)未來的車型。大數(shù)據(jù)在制造業(yè)成功部署的好處包括:提高生產(chǎn)效率。采用傳感器和數(shù)據(jù)能夠提高效率,減少損失和浪費(fèi),并提高員工的工作效率。新的收入流??梢援a(chǎn)生更多收入的機(jī)會(huì),通過制造智能產(chǎn)品。這方面的一個(gè)很好的例子是芬蘭通力公司起重機(jī),研發(fā)創(chuàng)造了“智能”起重機(jī)。節(jié)省運(yùn)營成本。使用生產(chǎn)車間的傳感器,現(xiàn)場管理人員能夠通過預(yù)測性維護(hù),以減少停機(jī)時(shí)間。保持更強(qiáng)的競爭力。采用大數(shù)據(jù)和分析運(yùn)營機(jī)構(gòu)更為精簡,提高效率,并在市場中取得競爭優(yōu)勢。廣州高效物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)軟件開發(fā)需要實(shí)時(shí)流式計(jì)算。各種實(shí)時(shí)預(yù)警或預(yù)測已經(jīng)不是簡單的基于某一個(gè)閾值進(jìn)行。
數(shù)據(jù)接入服務(wù)(DIS):數(shù)據(jù)接入服務(wù)(Data Ingestion Service)為處理或分析流數(shù)據(jù)的自定義應(yīng)用程序構(gòu)建數(shù)據(jù)流管道,主要解決云服務(wù)外的數(shù)據(jù)實(shí)時(shí)傳輸?shù)皆品?wù)內(nèi)的問題。數(shù)據(jù)接入服務(wù)每小時(shí)可從數(shù)十萬種數(shù)據(jù)源(如IoT數(shù)據(jù)采集、日志和定位追蹤事件、網(wǎng)站點(diǎn)擊流、社交媒體源等)中連續(xù)捕獲、傳送和存儲(chǔ)數(shù)TB數(shù)據(jù)。實(shí)時(shí)流計(jì)算服務(wù)(CS):實(shí)時(shí)流計(jì)算服務(wù)(Cloud Stream Service),是運(yùn)行在公有云上的實(shí)時(shí)流式大數(shù)據(jù)分析服務(wù),全托管的方式用戶無需感知計(jì)算集群,只需聚焦于Stream SQL業(yè)務(wù),即時(shí)執(zhí)行作業(yè)。
數(shù)據(jù)自帶時(shí)間戳具有時(shí)間有效性,這意味著數(shù)據(jù)處理的實(shí)時(shí)性;都是小數(shù)據(jù),這意味著數(shù)據(jù)存儲(chǔ)系統(tǒng)需要對此進(jìn)行專門的設(shè)計(jì);數(shù)據(jù)隨時(shí)間延續(xù)而無限增長,這意味著數(shù)據(jù)的無限性;數(shù)據(jù)到達(dá)的速度有快有慢、負(fù)載有高有低,這意味著靈活又細(xì)粒度的資源彈性需求;數(shù)據(jù)可能是有序或無序的,會(huì)有持久化需求,以及數(shù)據(jù)本身傳輸?shù)沫h(huán)境可能是復(fù)雜的,在這些約束條件下要保證數(shù)據(jù)處理結(jié)果的***正確性。這幾個(gè)特性轉(zhuǎn)換成存儲(chǔ)技術(shù)的語義對應(yīng)著:實(shí)時(shí)性、高性能、無限性、可伸縮性以及恰好一次性,其中恰好一次性包括持久化、有序、一致性以及事務(wù)。從存儲(chǔ)的視角來說,每種類型的數(shù)據(jù)都有其原生的屬性和需求,對應(yīng)有比較好的適用場景以及**合適的存儲(chǔ)系統(tǒng)。那么目前又有哪種存儲(chǔ)系統(tǒng)**適合用于“流數(shù)據(jù)”呢?正如當(dāng)前技術(shù)條件下**適合“流數(shù)據(jù)”計(jì)算的是類似Flink這樣的分布式流計(jì)算應(yīng)用,**適合“流數(shù)據(jù)”存儲(chǔ)的系統(tǒng)我們認(rèn)為應(yīng)當(dāng)是專門針對流數(shù)據(jù)而設(shè)計(jì)的分布式流存儲(chǔ)系統(tǒng)。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。
必須是開放的。系統(tǒng)需要支持業(yè)界流行的標(biāo)準(zhǔn)SQL,提供各種語言開發(fā)接口,包括C/C++,Java,Go,Python,RESTful等等,也需要支持Spark,R,Matlab等等,方便集成各種機(jī)器學(xué)習(xí)、人工智能算法或其他應(yīng)用,讓大數(shù)據(jù)處理平臺(tái)能夠不斷擴(kuò)展,而不是成為一個(gè)孤島。14.系統(tǒng)必須支持異構(gòu)環(huán)境。大數(shù)據(jù)平臺(tái)的搭建是一個(gè)長期的工作,每個(gè)批次采購的服務(wù)器和存儲(chǔ)設(shè)備都會(huì)不一樣,系統(tǒng)必須支持各種檔次、各種不同配置的服務(wù)器和存儲(chǔ)設(shè)備并存。15.需要支持邊云協(xié)同。要有一套靈活的機(jī)制將邊緣計(jì)算節(jié)點(diǎn)的數(shù)據(jù)上傳到云端,根據(jù)具體需要,可以將原始數(shù)據(jù),或加工計(jì)算后的數(shù)據(jù),或符合過濾條件的數(shù)據(jù)同步到云端,而且隨時(shí)可以取消,更改策略。需要通過將一個(gè)或多個(gè)設(shè)備產(chǎn)生的數(shù)據(jù)流進(jìn)行實(shí)時(shí)聚合計(jì)算。揚(yáng)州應(yīng)用物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)產(chǎn)品介紹
物聯(lián)網(wǎng)是一個(gè)很寬泛的概念,是指各種設(shè)備機(jī)器都通過互聯(lián)網(wǎng)連接起來車聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等都屬于物聯(lián)網(wǎng)范疇。南通設(shè)備物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)分析
實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實(shí)時(shí)數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲(chǔ)介質(zhì)里,而且可能依據(jù)時(shí)長,保留在不同存儲(chǔ)介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。無論是訪問新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時(shí)間參數(shù)不同之外,其余應(yīng)該是一樣的。8.需要保證數(shù)據(jù)能持續(xù)穩(wěn)定寫入。對于物聯(lián)網(wǎng)系統(tǒng),數(shù)據(jù)流量往往是平穩(wěn)的,因此數(shù)據(jù)寫入所需要的資源往往是可以估算的。但是變化的是查詢、分析,特別是即席查詢,有可能耗費(fèi)很大的系統(tǒng)資源,不可控。因此系統(tǒng)必須保證分配足夠的資源以確保數(shù)據(jù)能夠?qū)懭胂到y(tǒng)而不被丟失。準(zhǔn)確的說,系統(tǒng)必須是一個(gè)寫優(yōu)先系統(tǒng)。9.需要對數(shù)據(jù)支持靈活的多維度分析。對于聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù),需要進(jìn)行各種維度的統(tǒng)計(jì)分析,比如從設(shè)備所處的地域進(jìn)行分析,從設(shè)備的型號(hào)、供應(yīng)商進(jìn)行分析,從設(shè)備所使用的人員進(jìn)行分析等等。而且這些維度的分析是無法事先想好的,而是在實(shí)際運(yùn)營過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來的。因此物聯(lián)網(wǎng)大數(shù)據(jù)系統(tǒng)需要一個(gè)靈活的機(jī)制增加某個(gè)維度的分析。南通設(shè)備物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)分析