十項標準出台在即 大數據產業告別「躍進式」發展_0

導讀

國家標準委正在著手制定首批共十項大數據標準,分別是大數據術語、大數據技術參考模型、數據交易平台交易數據描述、數據交易服務平台通用功能要求、數據能力成熟度評價模型、多媒體數據語義描述要求、科學數據引用、數據溯源描述模型、數據質量評價指標和通用數據導入介面規範。

本報記者 周慧

實習記者 宋興國 北京報導

大數據企業如何發展,市場正在做出自己的選擇。

8月末,北京某酒店的一場大數據企業展上,聚集了全國各地的企業。現場展示有隨著《江南style》起舞的機器人,有早期科幻電影裡走出來的「觸摸式數據可視化屏幕」……

「你們的具體業務是做什麼的」、「和大數據有什麼關係」……和直觀的服裝展、美食展不同,大數據行業作為當下的風口新業態,其行業標準、商業模式正在探索中,參展的大數據企業們,以各種可視化的方式,把大數據產業的最新成果展示給觀眾。這場活動吸引了大批企業和研究人員,其中還包括自費從國外過來學習的教授。

中國的人口數量,讓其成為大數據大國,但卻不是生來的大數據強國。國內大數據市場正在經歷炒作、探路和實踐期。21世紀經濟報導記者採訪發現,今年的大數據行業聚會,探討的內容已經從2014年的數據是什麼,發展到大數據產業的商業模式怎麼做。

從業務定位到市場開發,從產品生產到服務提供,大數據企業的發展還處於初始階段。在大數據生態圈裡,看上去很美的商業價值,已經吸引了一批創業者,將之視作彎道超車BAT的最大機遇;也有傳統企業和行業巨頭借勢圈地擴張,寄望完成轉型和整合。

有學界和業界人士預測,大數據已經從概念炒作走向了穩步發展時期。另外,8月份出台的促進大數據產業發展行動綱要,系列鼓勵和規範政策正在密集出台中。在大數據這個具體政策和標準近乎空白,正在野蠻生長的大數據產業生態鏈中,21世紀經濟報導記者通過採訪大數據產業生態鏈上的各類企業,摸底大數據產業的商業化落地進程。

應用行業參差不齊

「掃碼送牛奶」、「掃碼送雨傘」……進入2015年,從中關村地鐵站出來,簇擁圍住你的人群,不再給你發傳單,而是各類APP掃碼推廣。APP推廣的大量聚集,讓這裏被戲稱做「掃碼一條街」。

在大數據被各方合力推上風口的當下,這些APP推廣工作人員會介紹,這款應用是基於某領域海量資料庫的處理和分析的產品。在很多新上線APP的宣傳里,「數據為王」,「企業對大數據的態度決定未來的高度」,類似的說法越發常見。

事實上,這些企業是不是純粹的大數據企業尚有爭議。一部分人認為,嚴格意義上來說他們只是通過互聯網+的方式應用大數據,是大數據生態鏈上最終的消費者,是大數據得以應用的主要場景,而不是純粹的大數據從業企業。

拋開爭論,這些大數據應用企業,對大數據產業發展的重要性毋庸置疑。「企業對數據的應用,是大數據行業發展的引擎」,有專家表示。

21世紀經濟報導記者發現,在每一次關於大數據相關的活動中,大數據的商業應用,是最受關注的板塊。在8月26日的中國國際大數據大會開幕論壇上,關於大數據的商業應用,學界和業界即產生了兩種完全對立的觀點。

北京大學鄂維南院士提到:「現在的數據分析公司是風起雲湧,我把它說成是小鍋爐戰場,想當年大鍊鋼鐵的時候,就是自己在家裡就建了鍋爐就煉。」鄂維南稱,現在的確什麼人都可以做,沒有什麼技術含量。

鄂維南還提到,數據交易存在經濟學上的悖論,數據服務作為一個業務模式,它的商業模式現在沒有真正被認可,數據通過什麼方式賺錢,前景不是那麼清楚。

晶讚科技董事長湯奇峰在中國國際大數據大會上發言稱,大數據交易並不存在經濟學上的悖論。我國企業對大數據應用的現狀基本都是初期的狀態。應用的主要形式還是,基於大數據得到的商業洞悉,業務推薦和智能獲客等三個領域。其中的典型就是個性化推薦和智能廣告。

湯其峰在接受21世紀經濟報導記者採訪時表示,大數據的商業模式體現在很多方面,大數據價值在交易和流通的過程中體現,並且會發生聚變效應,實現邊際效應遞增。

21世紀經濟報導記者了解到,目前國內對於大數據應用,發展較好的還是以大企業為主,比如BAT、滴滴快的、Uber等互聯網企業。不管是對外數據源採集,還是企業內部的數據資產管理,其互聯網企業基因,以及自身的資本優勢,使得他們在大數據的應用上同樣處於領先的態勢。

同時,由於這些擁有大量數據資源的企業,在分析挖掘數據形成應用的同時,放棄直接依靠出售數據獲利,而選擇對外提供數據服務和分析結果,為應用類企業的決策和東西提供了便利條件。這也是應用類的數據企業或產品數量較大,佔到了行業總數的三分之一的重要原因。

而對於部分中小企業而言,資金缺乏和技術難題導致數據獲取難,缺乏數據資產管理意識,其對大數據的使用,仍在探路中。

另外,我國的大數據應用領域分佈仍然不夠全面,相關企業主要集中在互聯網、市場營銷、電信、金融領域,而政府公共服務、農業類應用,發展還在原始階段,近期個別企業還不時爆出數據造假的傳聞。同時,數據應用的方式單一,思路狹窄,一些企業盲目學習國外的數據應用模式,也是大數據應用企業發展的一大短板。

搶佔數據分析高地

如果說大數據的應用,是大數據產業的商業價值終端,那麼大數據行業公認的大數據分析,將會是大數據產業的核心,是大數據能夠點石成金的關鍵。

這樣的判斷是基於大數據的特性。數據本身不產生價值,當數據經過挖掘、歸類和分析,能夠給企業決策提供幫助之後,才具有價值。

數據堂公司今年發佈了一份《大數據產業調研及分析報告》,其中將大數據分析工作歸類為商業分析、語音識別、圖像分析、實時處理、空間分析、基因分析、用戶分析、日誌分析,和數據可視化等九個種類。目前,國內在各個領域都已出現了一批相關大數據企業。

與上述橫向劃分不同,另一些看法則偏向將大數據分析按商業價值的高低進行區分。前LinkedIn商業分析部總監,GrowingIO的創始人張溪夢介紹說,在數據分析發展更早的美國,數據分析區塊已經按商業價值從低到高地細分為數據採集、大數據架構、響應性分析,診斷性分析、戰略性分析、預測性分析和全自動分析。而一旦做到數據分析全自動化,將會利用10%的時間,創造出這個行業90%的價值。

在美國數據分析領域工作十余年的張溪夢認為,「數據分析前端過程複雜,分析昂貴,導致在過去若干年裡,數據科學家90%的時間和工作都是進行數據清洗、整理、傳輸和存儲,但真正產生價值的是剩下的10%。我們必須要利用各種先進技術,把金字塔底部做得非常狹窄,把以往很緩慢的流程縮短甚至透明化。」

21世紀經濟報導記者獲悉,目前國內的數據分析產品,在與國外產品的競爭中仍處劣勢。以日誌搜索系統為例,雖然國內已有自主研發的日誌實時搜索分析引擎面世,但市場使用的主流還是HADOOP、STORM和SPARK等國外開放計算框架下的產品,有部分互聯網和金融企業則選擇了SPLUNK等第三代日誌搜索軟體包,這同樣也是美國開發的大數據工具。

然而國內企業並非毫無競爭力,日誌搜索分析引擎「日誌易」的創始人兼CEO陳軍介紹,這些國外數據搜索處理系統價格非常昂貴,同時由於之前的「稜鏡門」事件,國外系統的軟體後門也令一些國內的企業尤其是金融企業擔憂。

人才短缺是限制國內大數據分析企業發展的另一大主因。《哈佛商業評論》曾將數據分析師稱為「21世紀最性感的職業」,當下也是稀缺和搶手的職業。鄂維南院士介紹,我國大數據發展最大的優勢是龐大的市場,最大的劣勢是缺乏人才,「我們國家目前沒有建立起非常好的培養大數據人才的機制,在大數據涉及的統計、機械學習等這些領域相比而言更加弱勢。」

滴滴快的CEO程維在講述如何到矽谷挖人時提到,人才是最大的瓶頸,中國沒有那麼多的大數據和機器演算法的科學家,後來發現矽谷一線的互聯網企業,像Uber、Facebook裏面20%的工程師是華人。「我們派了CTO和一個代表團在矽谷把他們請到一起交流。」程維說。

鄂維南認為,大數據分析人才的缺乏,當下數據人才市場,不僅有國內和國外的競爭,學術界與企業界也在競爭。要想彌補人才短缺,在大數據領域取得領先地位,需要建立一個開放的,既可以做科研也可以產業化做市場的國際標準的研究平台,或是解決之道。

數據平台期待全覆蓋

相對大數據分析企業的專業和專一定位,產業覆蓋面廣的大數據平台類企業,則是在國際大數據大會的企業展廳中,佔比最高的行業類型。

一位參展的大數據平台商人告訴記者,「大數據平台會是大數據行業的基石和中堅。」據了解,阿里,百度,華為等企業都早已布局大數據平台,阿里雲更是從2010年就對外開放了其在雲計算領域的技術服務。

然而,大數據平台的準確定義至今仍未有定論。廣州工業大學大數據戰略研究院副院長謝衛紅告訴記者,與數據分析、數據應用不同,大數據平台是隨著大數據產業興起而誕生的新興事物,目前還沒有官方定義。大數據平台的數據規模和具體功用,都還有待界定。

21世紀經濟報導記者採訪發現,當下市面上所謂的平台主要有兩類,一類是通過各種渠道搜集、整理數據,併為數據應用企業提供有償數據的數據交易類平台;一類是為了處理企業內部生產運營中產生的海量數據,以存儲、運算、展現這些數據為目的的數據處理類平台,其工作內容包括了數據的輸入、導入、分析以及加工。

在整個大數據生態中,大數據平台處於行業中上游位置,是進行數據分析和應用的基礎。其中,大數據交易平台由於數據權屬和交易規則尚未制定的緣故,發展相對滯后,基本都是2014年後開始投入運營;大數據處理平台則開發較早,商業化程度相對較高。

目前,大數據處理平台的服務對象以企業為主。除了一些中小型的創業公司,一些大公司也相繼推出自己的相關業務,如華為的FusionInsight,和海爾的SCRM(社交化客戶關係管理)平台。

其中,大多數平台主要解決企業特別是大企業內部的數據孤島問題,將CRM(客戶關係管理)、ERP(企業資源計劃)、OA(辦公自動系統)等業務系統打通,實現跨行業、跨部門的數據分析與整合,以協助企業的運營、管理和決策。

在這部分數據處理平台中,包括依靠技術模塊的變化,提供不同行業平台服務的平台,和針對專門行業的平台;後者數量較少,在交通、建築和媒體行業都有較為典型的專業化平台出現。

此外,數據處理平台中還有一類針對特定業務系統的大數據平台,比如海爾的SCRM,就是專門的社交化客戶關係管理的數據平台。

由於大數據平台在大數據產業中的基礎性地位,國內的大數據處理平台企業數量相對較多。對其業務性能和服務的評價體系也相應較為完整。

大數據處理平台供應商,九章雲極的CEO方磊稱,數據集成能力、存儲和計算能力、分析能力、部署能力、運維能力、開發定製能力,和管理協調能力等七大方面的能力,會是廠商在挑選平台服務時的主要尺度和標準。其中前六者形成數據資源挖掘和計算能力巨匠電腦評價閉環,管理協調能力則影響著平台的工作效率。

然而需求方的要求似乎並沒有得到滿足。方磊向21世紀經濟報導記者透露,在他們與平台需求企業的對接中,「端到端」、在數據處理平台上直接實現數據分析的要求,越來越多。需求方,往往也是數據應用企業,希望平台能夠提供一體化、一鍵式的自動化數據服務。

在商業價值開放較好的大數據處理平台區塊,需求正加速推動著產品的轉型。「未來大數據平台和大數據分析的融合會是一種趨勢,大數據分析企業會向下滲透到數據收集和整理,大數據平台企業會往數據分析上發展,這種擴張是必然的。」方磊說。

不過在當下的技術和人才條件下,大多數大數據處理平台,還只能實現基礎性的數據分析,和簡單的可視化呈現。清華大學數據科學研究院執行副院長韓亦舜,在接受21世紀經濟報導記者採訪時表示,目前一鍵式的自動化數據服務,只能在一些數據結構單一的特定領域實現。對於多源異構的數據,想要實現一鍵式自動化服務,還有很長的路要走。未來的數據平台,實現針對不同行業領域的垂直細分后,可能會在某些行業率先實現突破。

十項大數據標準制定中

在業界構想中的完整大數據生態鏈里,不同人的分類不同,大數據企業的類型也很多。其中必須要提的,就是大數據產業最基礎的工作——數據源。一些數據源企業和數據存儲系統企業,都已在市場上佔據了一席之地。

目前,由於數據流通尚未形成規模,國內數據源區塊中的平台比例較為明顯。作為當下僅有的幾家號稱專門從事數據源業務的公司之一,數據堂搜集線下數據,開展線上業務的市場定位和數據眾包、採集加工流通三位一體的「數據銀行」的業務模式較有代表性。

然而,由於行業規則和行業標準缺失、數據的權屬不明,當下大量的數據交易是不規範且有爭議的。國務院發展研究中心技術經濟部副部長田傑棠稱,數據交易的前提是產權要清晰,尤其是個人在線活動產生的數據,其產權到底屬於個人還是企業,對於整個產業的發展和數據資源的配置都有很大影響。

數據源企業的發展必然伴隨著數據交易,不規範交易、個人隱私界定模糊和數據產權劃分不清晰帶來的安全擔憂,是造成國內專門從事數據源工作的企業數量稀缺的重要原因。

與數據源區塊不同,在大數據存儲區塊,核心技術的缺失成為了最大的問題。一家參展的廈門數據存儲系統開發商負責人告訴記者,國內的數據儲存企業擁有自主知識產權的很少,特別在硬體上的技術落後國外更多。

不過這樣的情張肇良況正在好轉,韓亦舜告訴21世紀經濟報導記者,隨著近年來硬體開源的興起,國內在數據存儲領域實現自主可控的速度有望加快。

另外,國內大數據標準化進程也在逐步推進中,困擾大數據行業的瓶頸或將迎來部分解決。

據中國電子信息標準化研究院技術總監王立建介紹,國家標準委正在著手制定首批共十項大數據標準,分別是大數據術語、大數據技術參考模型、數據交易平台交易數據描述、數據交易服務平台通用功能要求、數據能力成熟度評價模型、多媒體數據語義描述要求、科學數據引用、數據溯源描述模型、數據質量評價指標和通用數據導入介面規範。

其中前四項處在徵求意見稿狀態,中間四項已完成草案,最後兩項還在草案大綱階段。另外,大數據標準體系框架也已在徵求意見稿階段。

隨著政策頂層設計的越發清晰和行業標準的逐漸形成,對於大數據企業的未來發展方向,各方也有了不同的判斷。

一些大數據商人認為,長遠看單純從事數據生態某一環節的企業,都存在重大轉型壓力,特別是底層的數據搜集和挖掘企業,針對不同行業領域的大數據企業將會整合該領域的數據收集、儲存和分析業務。

而另一些大數據交易平台的支持者則認為,大數據行業未來會圍繞大數據交易平台,形成縱向細分的垂直行業生態,以及橫向產業鏈精細化分工的網格狀發展態勢與布局。

來自業內的預測更為樂觀。阿里研究院數據經濟研究中心秘書長潘永花表示,根據2014年的Gartner新興技術曲線顯示,大數據已經從炒作高峰,進入5到10年的穩步發展期,2015年大數據已經成為主流技術。

(編輯:耿雁冰,如有意見建議請聯繫:zhouhui@21jingji.com;gengyb@21jingji.com)

發表留言

秘密留言

搜尋欄
RSS連結
連結
加為部落格好友

和此人成爲部落格好友