基礎數據是智慧園區的基礎,基于基礎數據的分析、處理及整合,可以協(xié)調不同業(yè)務(wù)、不同領(lǐng)域、不同部門(mén)之間的業(yè)務(wù)處理,實(shí)現園區資源的綜合利用,在大數據技術(shù)領(lǐng)域,主要目的是圍繞打造信息優(yōu)勢并向決策優(yōu)勢轉換的發(fā)展目標,通過(guò)突破高效、穩定、易用、安全的大數據分析處理技術(shù),解決當前數據資源利用單一、分析挖掘手段缺乏、智能化輔助能力低的問(wèn)題,為智慧園區建設提供支撐。大數據關(guān)鍵技術(shù)的能力將瞄準在平臺運算處理能力和對業(yè)務(wù)的支撐,優(yōu)化、提升平臺存儲和運算能力,進(jìn)一步對跨系統及各類(lèi)數據進(jìn)行整合,提升數據分區二次存儲能力,滿(mǎn)足數據支撐不同類(lèi)型的業(yè)務(wù)需要。對行業(yè)業(yè)務(wù)數據進(jìn)行積累和沉淀,形成可復用算法庫。因此,基于大數據平臺的分析、處理及融合的相關(guān)技術(shù)是解決支撐平臺能夠智能運行的關(guān)鍵。
1、海量數據存儲技術(shù)
針對不同應用場(chǎng)景滿(mǎn)足海量數據存儲管理需求,提供異構數據統一管理,支持關(guān)系數據庫、分布式文件系統、分布式數據庫、圖數據庫的數據存儲。
2、多種計算模式的海量數據并行計算技術(shù)
針對不同數據處理需求特征,提供涵蓋批量計算、流式計算、圖計算多種計算模式,為大規模數據高效挖掘分析提供計算支撐。提供批處理計算框架、流處理計算框架、圖計算框架等計算引擎,并對集群的大規模計算資源進(jìn)行統一管理。
3、大數據挖掘引擎技術(shù)
實(shí)現大數據挖掘平臺技術(shù),為業(yè)務(wù)分析人員提供圖形化大數據挖掘算法運行、監控功能以及圖形化大數據挖掘流程構建與運行功能;為分布式開(kāi)發(fā)人員提供大數據挖掘算法開(kāi)發(fā)基礎軟件環(huán)境以及工具庫;提供大數據挖掘算法、流程管理功能,集成Mahout、MLib開(kāi)源分布式挖掘算法,支持分布式挖掘算法注冊與搜索。
4、大數據交互式分析技術(shù)
實(shí)現海量數據交互式內容分析,一方面提供交互式數據操作接口,支持select、join、insert、union、avg、group等典型SQL操作;另一方面封裝數據分析典型需求,支持全局有序數據重組、數據統計、數據抽樣等一鍵式數據分析。降低數據分析人員的分析復雜度,提升數據內容分析效率。