伴隨著5G、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等技術的飛速發(fā)展,各行各業(yè)的業(yè)務場景日益復雜,數(shù)據(jù)呈現(xiàn)出大規(guī)模、多樣性的特點,特別是非結構化數(shù)據(jù)呈現(xiàn)出爆發(fā)式的增長態(tài)勢。企業(yè)對數(shù)據(jù)庫技術的需求不再局限于結構化的OLTP數(shù)據(jù)交易,而是需要進一步擴展到對多樣化數(shù)據(jù)進行實時處理的場景。傳統(tǒng)的數(shù)據(jù)湖在事務一致性及實時處理方面有所欠缺,而數(shù)據(jù)倉庫也無法應對高并發(fā)、多數(shù)據(jù)類型的處理,因此,支持事務一致性、提供高并發(fā)實時處理及分析能力的湖倉一體架構應運而生。湖倉一體架構在成本、靈活性、統(tǒng)一數(shù)據(jù)存儲、多元數(shù)據(jù)分析等多方面具備優(yōu)勢,正逐步轉化為下一代數(shù)據(jù)管理系統(tǒng)的核心競爭力。
湖倉一體是一種新型的開放式架構,打通了數(shù)據(jù)倉庫和數(shù)據(jù)湖,將數(shù)據(jù)倉庫的高性能及管理能力與數(shù)據(jù)湖的靈活性融合了起來,底層支持多種數(shù)據(jù)類型并存,能實現(xiàn)數(shù)據(jù)間的相互共享,上層可以通過統(tǒng)一封裝的接口進行訪問,可同時支持實時查詢和分析,為企業(yè)進行數(shù)據(jù)治理帶來了更多的便利性。湖倉一體可在數(shù)據(jù)入湖后原地進行數(shù)據(jù)處理與分析,能有效避免數(shù)據(jù)冗余及流動導致的算力、網(wǎng)絡及成本開銷,可以作為超大型ODS存儲貼源數(shù)據(jù),實現(xiàn)全量數(shù)據(jù)的實時處理。
湖倉一體架構在數(shù)據(jù)管理中主要具有以下幾大關鍵特征:
一是支持分析多種類型數(shù)據(jù)。 湖倉一體架構可為多應用程序提供數(shù)據(jù)的入庫、轉換、分析和訪問。數(shù)據(jù)類型包括結構化與非結構化類型,如文本、圖像、視頻、音頻等,以及半結構化數(shù)據(jù),如JSON等。
二是數(shù)據(jù)可治理,避免產(chǎn)生數(shù)據(jù)沼澤。 湖倉一體架構可以支持各類數(shù)據(jù)模型的實現(xiàn)和轉變,支持DW模式架構,例如星型模型、雪花模型等,可保證數(shù)據(jù)的完整性,同時具有健全的治理和審計機制,能夠避免數(shù)據(jù)沼澤現(xiàn)象的出現(xiàn)。
三是事務支持。 在企業(yè)中,數(shù)據(jù)庫往往要為業(yè)務系統(tǒng)提供并發(fā)的數(shù)據(jù)讀取和寫入。湖倉一體架構對事務ACID的支持,可確保并發(fā)訪問,尤其是SQL訪問模式下的數(shù)據(jù)一致性、正確性。
四是BI支持。 湖倉一體支持直接在源數(shù)據(jù)上使用BI工具,這樣可以提高分析效率,降低數(shù)據(jù)延時。另外,相比于在數(shù)據(jù)湖和數(shù)據(jù)倉庫中分別操作兩個副本的方式,湖倉一體更具成本優(yōu)勢。
五是存算分離。 湖倉一體采用存算分離架構,可使系統(tǒng)能夠擴展到更大規(guī)模的并發(fā)能力和數(shù)據(jù)容量,能滿足新時代對于分布式數(shù)據(jù)架構的要求。
六是開放性。 湖倉一體采用開放、標準化的存儲格式(例如行存、列存、塊存),能提供豐富的API支持。因此,各種工具和引擎(包括機器學習和Python/R庫)可以高效地對數(shù)據(jù)進行直接訪問。
從落地性來看,湖倉一體技術架構落地目前有三種方式:
第一個融合方向是基于Hadoop體系的數(shù)據(jù)湖向數(shù)據(jù)倉庫能力擴展,湖中建倉,從數(shù)據(jù)湖進化到湖倉一體。湖倉一體結合了數(shù)據(jù)湖和數(shù)據(jù)倉庫特點,直接在用于數(shù)據(jù)湖的低成本存儲上實現(xiàn)與數(shù)據(jù)倉庫中類似的數(shù)據(jù)結構和數(shù)據(jù)管理功能。目前主要有Netflix等開源企業(yè)在探索此技術路線。
第二個是基于自身云平臺或第三方對象存儲(如OSS、S3、Ceph等),基于Hadoop或自研技術進行湖倉一體能力的搭建。探索此技術路線的通常是各大云廠商,如AWS、阿里云、華為云等。
第三個融合方向是以數(shù)據(jù)庫技術為基礎,自研分布式平臺,從調(diào)度、計算到存儲不依賴第三方平臺,形成可以靈活在公有云、私有云、裸金屬等場景獨立部署使用的能力。技術方向上更注重于實時高并發(fā)場景及非結構化數(shù)據(jù)數(shù)據(jù)治理,并逐步向更廣泛的分析場景發(fā)展,主要廠商以Snowflakes、Databricks、巨杉數(shù)據(jù)庫等為代表。
三個技術方向均是廠商依托自身技術優(yōu)勢進行的架構融合,均有自身優(yōu)劣勢及技術特性,能夠滿足不同場景下的客戶需求。
同時,本報告指出了湖倉一體架構未來的發(fā)展趨勢:一是隨著企業(yè)對海量大數(shù)據(jù)的實時處理需求越來越迫切,湖倉一體架構將成為越來越多用戶的主流選擇,助力各行各業(yè)數(shù)字化轉型;二是以人為軸的數(shù)據(jù)開發(fā)和優(yōu)化,將越來越難以滿足企業(yè)實際需求,屆時人工智能技術將介入數(shù)據(jù)庫的自動調(diào)優(yōu)、自動整理過程,助力提升湖倉一體架構的智能化。
在報告的最后,賽迪顧問對用戶和廠商提出了一些發(fā)展建議。對用戶而言,要重視專業(yè)化服務能力和成功案例的可移植性,選擇適合自身情況的數(shù)據(jù)管理產(chǎn)品。對廠商而言,要重視研發(fā)投入,加快產(chǎn)品與新興技術融合,同時不斷提高專業(yè)化服務水平,重視實施與交付能力的提升。
關于巨杉數(shù)據(jù)庫
在此次報告中,巨杉數(shù)據(jù)庫作為湖倉一體典型廠商入選?;诤}一體的架構特性,巨杉數(shù)據(jù)庫可構建數(shù)據(jù)基礎設施平臺,整合結構化、半結構化、非結構化數(shù)據(jù)的統(tǒng)一存儲與管理,為面向全量數(shù)據(jù)業(yè)務提供:SQL、NoSQL、Object等多種接口。此外,通過特有的跨引擎事務能力,可以有效簡化多團隊開發(fā)流程中對不同引擎、不同結構的數(shù)據(jù)管理,打通ACID事務支持,提升業(yè)務開發(fā)、數(shù)據(jù)處理、運維管理能力,釋放全量數(shù)據(jù)價值,提升企業(yè)數(shù)據(jù)處理的“人效”及“能效”。目前,巨杉數(shù)據(jù)庫已經(jīng)在超過100家金融銀行客戶規(guī)?;暇€使用,全面覆蓋國有銀行、股份制銀行、省級農(nóng)信、城商行、保險、證券等金融客戶。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
5月17日,IOTE?2023國際物聯(lián)網(wǎng)展·上海站,在上海世博展覽館如期開幕,這場物聯(lián)網(wǎng)行業(yè)盛宴匯聚來自全球超350+家行業(yè)企業(yè)參展。廈門星縱物聯(lián)科技有限公司(以下簡稱“星縱物聯(lián)”)作為專業(yè)的數(shù)字感知產(chǎn)品提供商,攜公司全系列產(chǎn)品及多個行業(yè)產(chǎn)品解決方案,亮相3號館3C30展位,開展2日來,吸引了諸多合
近日,2022“物聯(lián)之星”物聯(lián)網(wǎng)行業(yè)年度榜單的結果正式公布!青云科技(qingcloud.com,股票代碼:688316)憑借著卓越的產(chǎn)品和應用,脫穎而出,在眾多優(yōu)秀企業(yè)中名列中國物聯(lián)網(wǎng)企業(yè)投資價值50強?!拔锫?lián)之星”評選活動始于2007年,歷經(jīng)15個年頭的發(fā)展和沉淀,是中國物聯(lián)網(wǎng)行業(yè)規(guī)格隆重、影響
2023年5月17日-19日,IOTE?2023國際物聯(lián)網(wǎng)展·上海站將在上海世博展覽館盛大開幕。星縱物聯(lián)受邀參展,屆時將亮相3號館3C30展位。星縱物聯(lián)展位圖作為專業(yè)的數(shù)字感知產(chǎn)品提供商,星縱物聯(lián)以前沿視角洞悉行業(yè)未來發(fā)展,并在物聯(lián)網(wǎng)領域持續(xù)深耕多年。展會期間,星縱物聯(lián)全系列產(chǎn)品將亮相展臺,從感知層
中國經(jīng)濟周刊-經(jīng)濟網(wǎng)訊(記者宋杰)4月27日,第六屆數(shù)字中國建設峰會在福州開幕,同期舉行的還有數(shù)字中國建設成果展覽會,本屆峰會以“加快數(shù)字中國建設,推進中國式現(xiàn)代化”為主題,集中展示數(shù)字中國建設最新成果和優(yōu)秀實踐案例,分享發(fā)展經(jīng)驗。其中,作為央企中國電科集團旗下的數(shù)據(jù)庫國家隊,人大金倉今年展出面積從
隨著全球物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等新技術的發(fā)展,“智慧園區(qū)”建設已成為發(fā)展趨勢,全球產(chǎn)業(yè)園區(qū)逐漸向著智慧化、創(chuàng)新化、科技化轉變?;谏罡锫?lián)網(wǎng)行業(yè)的豐富經(jīng)驗和對智能化場景應用的長期洞察,4月20日,由廈門星縱物聯(lián)科技有限公司主辦,博銳尚格科技股份有限公司、北京目視科技有限公司、北京思諾文通訊技術有限
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機構愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術研發(fā)能力、服務客戶數(shù)量、收入規(guī)模等維度對廠商進行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術發(fā)展司數(shù)字經(jīng)濟推進處處長張建倫,中國電子技術標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導下,以“數(shù)據(jù)確權”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權”為主題,由廈門市互聯(lián)網(wǎng)域名應用服務產(chǎn)業(yè)協(xié)會和構信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機構愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關注度、行業(yè)落地進展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實踐先行觀公共數(shù)據(jù)價值與應用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟博覽會組委會主辦,中國電子技術標準化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術全新打造,集數(shù)據(jù)采集、融合、治理、服務、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術全新打造,集數(shù)據(jù)采集、融合、治理、服務、管理為一體的旗艦平臺