通信電纜 網絡設備 無線通信 云計算|大數據 顯示設備 存儲設備 網絡輔助設備 信號傳輸處理 多媒體設備 廣播系統 智慧城市管理系統 其它智慧基建產品
成都萬緯信息技術有限公司
在DT時代的今天,各行各業時時刻刻都在產生海量的結構多樣的數據,企業數據規模不斷增長,數據類型也變得復雜多樣,傳統數據庫技術已無法滿足企業海量多樣化數據的有效存儲、快速讀取以及分析挖掘的需求,急需一套專業化的大數據解決方案來點石成金,H3CDataEngine大數據平臺在此背景下應運而生
在DT時代的今天,各行各業時時刻刻都在產生海量的結構多樣的數據,企業數據規模不斷增長,數據類型也變得復雜多樣,傳統數據庫技術已無法滿足企業海量多樣化數據的有效存儲、快速讀取以及分析挖掘的需求,急需一套專業化的大數據解決方案來點石成金,H3C DataEngine大數據平臺在此背景下應運而生。
H3C DataEngine 3.0大數據平臺基于開源Hadoop3.0而優于開源Hadoop,提供一套完整的數據實時采集、數據存儲、計算、分析、管理與開發于一體的大數據平臺方案。相比開源Hadoop 3.0平臺,DataEngine大數據平臺在安全性、易用性、穩定性與兼容性等多方面,進行內核級優化與外圍加固,為用戶提供更貼心、更適合的大數據平臺方案。H3C DataEngine大數據平臺與H3C CloudOS深度融合,以云操作系統作為基礎底座,形成獨立的數據平臺云服務,利用云提供靈活的基礎設施資源管理,提供海量數據存儲以及高性能的查詢分析處理能力,助力企業用戶快速構建海量數據處理系統,分析挖掘數據內在價值,并用于指導企業經營決策, 完成業務驅動到數據驅動的轉型。
系統架構
H3C DataEngine大數據平臺,整合基礎資源服務(IaaS)、平臺服務(PaaS)、數據服務(DaaS)一站式數據解決方案,支持物理機與虛擬機多種資源服務模式,深度定制大數據生態系統,打通數據全鏈路開發處理流程和數據全域管理能力,助力企業業務快速創新,完成ICT轉型。
數據源:大數據平臺可對接各種類型的數據源,結構化數據、非結構化數據與半結構化數據,包括但不限于關系型數據庫、日志、流量、物聯網數據、圖片等。支持接收上一個數據處理組件或數據接入階段的數據。支持自定義的數據處理操作,并可向下一個數據處理組件發送數據;支持多元化數據處理方式,包括支持Java、Python、SQL等開發語言。
資源服務層:DataEngine大數據平臺依托H3C CloudOS云基礎平臺,提供數據平臺運行的服務支撐能力,包括控制臺管理框架、統一用戶組織管理、工單流程管理、組件監控告警、日志管理以及微服務治理、資源池管理等。數據平臺服務支持部署在物理機、裸金屬服務器和虛擬機,用戶可以根據實際業務場景需求靈活選擇。
平臺服務層:提供豐富的大數據組件即服務,包括但不限于分布式文件系統、NoSQL數據庫服務、內存數據庫服務、離線計算、流式計算、內存計算等服務,并通過自研統一SQL服務,兼容標準SQL,對外提供統一的數據查詢、分析服務,提升平臺的整體易用性。
分布式文件系統支持查詢存儲容量、存儲使用量等信息;支持根據數據價值的高低和存儲周期的長短,定義數據的物理存儲節點,提高集群資料使用效率。根據數據價值高可以存儲配置在SSD盤或者SATA盤的節點上,同時提供gzip、或lzc、或snappy、或其它存儲壓縮算法。
數據服務層:在數據存儲與計算平臺服務之上,還提供數據工廠、數據開發、數據資產以及數據質量等增值服務,形成統一數據標準規范,真正形成數據資產化,滿足上層應用的數據要求。
H3C DataEngine 大數據平臺產品包括以下關鍵特性:
多數據源的快速采集:數據集成服務通過簡易的工作流管理界面,可輕松將存儲在文件、關系型數據庫、實時數據流(如設備syslog信息)等各類數據源中的海量結構化數據、非結構化數據、半結構化數據采集至大數據集群中。
海量數據的存儲:對結構化、半結構化和非結構化數據提供低成本存儲,通過的Ensure Code技術實現數據低冗余、高容錯,并通過集群高可用和多副本機制,避免單節點故障,保證節點損壞時數據不丟失。此外平臺還具有高可擴展性,用戶可以增加集群節點數量,橫向擴展數據存儲和計算能力。
支持對集群內服務器硬盤故障自動容錯處理,支持硬盤熱插拔,故障硬盤的業務恢復時間< 2分鐘。
元數據庫支持快速切換容災,故障時可在1分鐘內完成服務恢復。
多計算框架融合:融合了穩定的離線計算MapReduce、高效的內存計算Spark以及實時的流計算Flink等多種計算框架,為客戶提供靈活的計算支持能力,全面支持各類計算業務場景,客戶無需切換平臺或架構即可完成復雜多變的計算任務。在各類計算框架之上H3C DataEngine通過自研的統一SQL引擎,高度兼容標準SQL,智能選擇計算引擎,極大降低使用復雜度,為上層應用程序提供標準的JDBC/ODBC/REST接口、多種語言的編程API和DaaS接口,輔以BI展示和可視化工具,通過即時報表、直方圖、柱狀圖等方式直觀呈現數據價值。
可視化數據工廠:提供一站式數據接入、可視化的數據開發,全托管的數據處理流程調度,實現一整套全生命周期數據開發服務,適用于數據建倉、數據分析與探索、業務報表生成、實時數據預警等業務場景。
豐富的行業應用: H3C DataEngine大數據平臺經過不斷的產品優化和架構演進,已經成功在、醫療、電力、稅務、高校等多個行業落地實施,配合行業的應用服務開發商為客戶提供豐富的大數據應用。
容災備份:可對關鍵組件元數據、文件、表進行備份和恢復;數據備份和數據恢復,支持全量或增量備份。數據中心間的數據集群備份,滿足多中心之間的數據互備需求,備份過程可視化管理。
多租戶支持:通過對物理或虛擬資源的分配實現多個租戶以及他們的計算和數據彼此隔離和不可訪問。
隔離管理:支持多租戶并行執行,租戶任務提交到不同的隊列執行,租戶間資源隔離。
權限管理:支持各業務組件的租戶統一管理,實現租戶資源的動態配置和管理,資源隔離,資源使用統計等功能,支持多級租戶的管理功能。
調度管理:支持多集群和多資源池的多租戶調度。
服務名稱 | 版本號 | 描述 |
---|---|---|
YARN | 3.0.0 | Hadoop資源管理器,是一個通用的資源管理系統,可為上層應用提供統一的資源管理和調度服務,使MapReduce、Spark、Flink等多種計算框架共享資源 |
HDFS | 3.0.0 | Hadoop分布式文件系統,具有高容錯、高吞吐等特點,適用于存儲超大文件 |
MapReduce2 | 3.0.0 | 批處理框架,主要用于離線計算、計算密集型應用。設計思想是分而治之,即將一個大任務分成多個獨立的小任務,最后匯總各個小任務的結果 |
ZooKeeper | 3.4.5 | 分布式應用程序協調服務,為集群提供一致性服務,包括配置維護、名字服務、分布式同步、組成員管理等 |
Spark | 2.4.0 | 一個快速的通用的大規模數據處理引擎,提供批處理、流處理、SQL查詢、機器學習、圖計算、R語言等功能。Spark計算中的中間結果緩存在內存中,在后續計算過程中直接讀取緩存數據,具有高效的計算性能。 |
Storm | 1.2.1 | Storm是一個分布式的、容錯的實時流處理引擎,效率非常高且能保證每條消息都能被處理 |
Tez | 0.9.0 | 一個支持DAG作業的計算框架。Tez將多個有依賴關系的作業轉化為一個DAG作業,大幅提升性能,幫助MapReduce克服在迭代計算和交互式計算方面的不足 |
HBase | 2.1.1 | HBase是一個分布式、面向列的NOSQL數據庫,常用于非結構化和半結構化數據的存儲和查詢。在應用程序開發中,常使用Java API等接口訪問HBase中的數據,也可以借助Phoenix等SQL引擎使用JDBC訪問HBase中的數據 |
Redis | 5.0.4 | Redis是Key-Value型內存數據庫,支持單機和集群兩種運行模式,常用作高速緩存和消息隊列代理 |
Flink | 1.6.0 | Flink是一個批處理和流處理結合的統一計算框架,其核心是一個提供了數據分發以及并行化計算的流數據處理引擎 |
ElasticSearch5 | 7.4.0 | ElasticSearch是一個基于Lucene的全文搜索服務器,提供了一個分布式的、多用戶全文搜索引擎。對外提供RESTful編程接口,特點是易擴展、實時搜索、穩定可靠,是當前流行的企業級搜索引擎 |
Solr | 7.4.0 | Solr是一個基于Apache Lucene項目的搜索平臺。其主要功能包括全文搜索、命中突出、面搜索、動態集群、數據庫集成和豐富的文檔(如Word、PDF)處理 |
Hive | 2.1.1 | 基于Hadoop的數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供簡單的類SQL查詢功能,具有以下特點: · 易于進行數據抽取、轉換和加載 · 支持多樣的數據存儲格式 · 能直接訪問存儲在HDFS或其他的數據存儲系統(如HBase)上的文件。多種使用方式,支持Shell交互式命令、JDBC、WebUI等 |
Impala | 3.2.0 | Impala是用于處理存儲在Hadoop集群中的大量數據的MPP(大規模并行處理)SQL查詢引擎,提供了高性能和低延遲查詢分析能力。 |
Kafka | 2.3.0 | 一種高吞吐量的分布式發布訂閱消息系統 |
Infra Solr | 0.1.0 | Infra Solr是一個專門提供給LogSearch服務的企業級搜索應用服務器 |
Sqoop | 1.4.7 | Sqoop是一個用于Hadoop和結構化數據存儲(如關系型數據庫)之間進行高效傳輸大批量數據的工具: · Hadoop數據:HDFS文件、HBase表、Hive表 · 關系型數據庫:MySQL、PostgreSQL、Oracle、SQL Server和DB2等支持JDBC的數據庫 |
Kerberos | 1.10.3.10 | Kerberos是一種不依賴主機地址信任、不要求網絡中所有主機的安全,通過密鑰系統為客戶機和服務器應用程序提供強大的認證服務的網絡認證協議 在Hadoop中,使用Kerberos來安全訪問各個服務 |
HBase Indexer | 1.5 | HBase Indexer是針對HBase開發的索引插件,使HBase支持二級索引 |
Oozie | 5.1.0 | Oozie是用于Hadoop平臺的工作流調度引擎,管理Hadoop作業 |
Flume | 1.9.0 | Flume是一個分布式的、高可靠的、高可用的將大批量的不同數據源的日志數據收集、聚合、移動到HDFS進行存儲的系統 |
您感興趣的產品PRODUCTS YOU ARE INTERESTED IN
智慧城市網 設計制作,未經允許翻錄必究 .? ? ?
請輸入賬號
請輸入密碼
請輸驗證碼
請輸入你感興趣的產品
請簡單描述您的需求
請選擇省份