在前不久的一次公開會議上,李彥宏、馬云、馬化騰又對數據的應用產生了公開分歧,三者分別認為數據的價值在于算法、數據量、場景化,這其實是暗合了三家公司的經營方向與理念。百度掌技術,阿里重規模,騰訊把持著社交與游戲,是妥妥的三種企業文化,三個經營方向。
36大數據今天就來講講三者的交叉與區別。
百度大數據——到底是半壁江上還是黃埔軍校?
百度公司是一家妥妥的工程師文化公司,素來就有“數據為重,不為上”的傳統。
百度大數據產品
作為BAT三家中數據量最大的公司,百度的大數據其實起步是最晚的,自2014年4月24日起,百度正式宣布對外開放“大數據引擎”,包括開放云、數據工廠、百度大腦三大組件在內的核心大數據能力開放,通過大數據引擎向外界提供大數據存儲、分析及挖掘的技術能力,將面向多個傳統領域逐步開放。同年8月18日,聯合國與百度宣布啟動戰略合作,共建大數據聯合實驗室(bdl)。
據悉,聯合國開發計劃署與百度大數據聯合實驗室的目標是探索利用大數據解決全球性問題的創新模式。
百度在開發和運營一整套自主研發的大數據引擎系統,包括數據中心服務器設計、數據中心規劃和設計、大規模機器學習、分布式存儲、超大規模集群自動化運維、數據管理、數據安全、機器學習(特別是深度學習)、大規模GPU并行化平臺等方面,百度“大數據引擎”具有先進性和安全性。
現在的百度從大數據出發,在2012年余凱先生(已離職)的提議下,成立了深度學習實驗室(IDL),后歷經數位大牛操刀,已經成為了國內AI技術的標桿實驗室,并成為了李彥宏未來藍圖中百度的重要押寶方向。
目前驅動中國人工智能向前發展的領導者中,只有寥寥數人出身于高校和研究機構,絕大部分都來自中國頂尖的科技公司,其中中國互聯網三巨頭BAT(百度、阿里、騰訊)幾乎包攬了剩下的名額。而在這些人里,百度占據了近一半的名額,說百度撐起了中國人工智能領軍人物的半壁江山并不為過。
可以說若論AI人才儲備,百度就是中國AI中的霸王,對于中國AI而言的百度,最近網上有人戲稱之為“中國AI黃埔軍?!?。
這個說法自然有些戲謔,但毫不夸張。
《福布斯》也在今年初發布的另一份報告中指出,百度將自我學習、神經元網絡技術融入了核心的搜索業務之中,實現經營方式的創新,也許會成為新的增長點。
百度基于自己的搜索引擎,其數據具有廣而不精的特點,與現有技術相結合,目前被百度拿來盈利,最多的是“鳳巢”系統的精準營銷。
阿里巴巴大數據——電商是其魂,云為其靈
照常理說,BAT中,論大數據,唯獨是談不到阿里的,因為阿里起初的技術基因是最弱的,也不是數據量最大的。但現在若論云計算,偏偏阿里又是最強的。馬云先生和王堅博士的高瞻遠睹,甚至逐漸讓人嗅出了一絲論老練能強于貝佐斯的味道。(日前,Amazon已經成為了世界第一大云服務商,阿里位列第四)。
早在2014年時,馬云就提出了DT(Data technology)時代的概念,只不過當時和更早的20年前一樣,人們不過覺得這個小個子在吹牛罷了。
但這位小個子首富的眼光不可謂不獨到,讓阿里的大數據成了BAT中起步最早的。
阿里大數據有兩個起源,一是始于電商,二是始于阿里云。
不光是大數據始于電商,阿里整個公司都始于電商,電商是阿里大數據之魂。
起初阿里的數據產品名為“量子恒道”(現已更名生意參謀,專為淘寶賣家分析數據使用),可以說阿里對于大數據的認知起點就是始于這個電商數據分析軟件的。從2008年起,阿里就把大數據作為一項基本戰略,這樣的意識完全是阿里在電商領域里嘗到過甜頭。所謂的數據魔方也好,淘寶指數也好,都是始于“量子恒道”的。
另一個起源是阿里云,阿里云是阿里大數據之靈。
阿里云創立于2009年,截至2016年第三季度,阿里云客戶超過230萬,付費用戶達76.5萬 。在天貓雙11全球狂歡節、12306春運購票等極富挑戰的應用場景中,阿里云保持著良好的運行紀錄。
2016年1月20日,阿里云在2016云棲大會上海峰會上宣布開放阿里巴巴十年的大數據能力,發布全球首個一站式大數據平臺“數加”,首批亮相20款產品,這一平臺承載了阿里云“普惠大數據”的理想,即讓全球任何一個企業、個人都能用上大數據。阿里的大數據團隊——數加,就這樣誕生了。
魂與靈的結合就是數加的產品商業化十分成熟,且極其符合中國商人的口味,在數據可視化上,其推出的大屏功能最受歡迎(靈感來自雙11)。畢竟中國企業服務的兩大要點到在這里了,視覺沖擊足夠大,足夠滿足管理欲。所以數加產品除了夠商業,同時也夠“中國”。
在這樣的背景下,數加團隊越發的朝著可實時性、可解釋性、數據準確/穩定性發展,進而由電商為始逐步涉及到制造、金融、政務、交通、醫療、電信、能源等眾多領域。
在輸出自身大數據能力的同時,“數加”還向有數據開發能力的團隊開放。這些團隊可入駐“數加”,借助數加上的工具為各行業提供數據服務?!皵导印逼脚_首批集中發布了20款產品,覆蓋數據采集、計算引擎、數據加工、數據分析、機器學習、數據應用等數據生產全鏈條。
就像在淘寶開店一樣,只是他們售賣的是專業能力。
騰訊——大數據是騰訊游戲的秘密武器
馬化騰這個人特別低調,低調到整個騰訊都學了他“悶聲發大財”的路子,很少有相關消息或者報告面世。
但實際上在2009年1月,騰訊就搭建了第一個Hadoop集群,到2010年6月的時候,TDW v0.1版就發布了。
騰訊坐擁社交數據、游戲數據、交通數據、輿論數據等等,是場景化非常高的數據。
其中的社交數據,是騰訊自身最擅長的東西。如果騰訊愿意,它甚至可以通過分析得知,你的社會關系、性格稟賦、興趣愛好、隱私緋聞甚至生理周期和心理缺陷。
騰訊的大多數消費數據都來源于游戲與增值服務。騰訊游戲的收入十分暴利,游戲迷們總是愿意付出高昂的費用來購買虛擬道具,以此滿足自己的虛榮心。(據報道,王者榮耀第一季度流水達100億人民幣)
騰訊大數據的應用目前主要是為了完善自家產品,它了解用戶的性格稟賦、興趣愛好、隱私緋聞甚至生理周期,通過這些數據分析得出結果預測,做出來的產品能不受歡迎嗎?事實上騰訊游戲的開發,以及一些產品的改進,也正是基于這些數據進行,其應用方法類似《紙牌屋》。
這使得騰訊游戲的發展產生了“馬太效應”,坐擁海量游戲數據,做針對性的開發,然后繼續完善數據,再開發新游戲。
當然,現在騰訊大數據也早就對外開放了,在2016年還拿了Sort Benchmark排序賽冠軍,破了四項世界紀錄,98秒內實現了對100TB數據的排序,技術實力也是不容忽視的。
三強的交叉點
大數據并不是報表平臺、也不是計算平臺,更不等同于精準營銷。關鍵還是要看應用。
在大數據閉環系統中,萬事萬物都是數據產生者,同時也是數據的使用者。這就需要有大量能互相連接的的數據,在一個大數據計算平臺,有相同的數據標準并能產生關聯性,通過大數據相關處理技術最終形成自動化、智能化的閉環系統,自動學習,智能調整,從而提升整體的生產效率。
三強的數據量,目前是百度最大,騰訊次之,阿里最小,但阿里的數據變現做的較好。
三強目前的較量除了關起門來研究技術提升自身實力,也在其他領域里頻頻出手進行數據爭奪,百度地圖、高德地圖、騰訊地圖莫不是如此,前段時間的菜鳥物流與順豐事件,也是阿里和騰訊對物流數據爭奪的一個縮影。
三強面對的未來也許是三岔路
說出來你可能不信,國內最早研究大數據的,是在06年左右的暴風影音。但暴風影音只是搭建了一個大數據的架構,并沒有對數據本身進行落地應用。
國內除BAT以外的,能說的上在搞大數據的,大概也就是三大電信運營商和銀聯這些央企了,這些公司和前一類公司的不同點在于他們已經有海量的數據,并且有足夠的技術能力和財力。但此類公司目前的研究重點是國家戰略的方向,在商用方便考慮較少,加上國企的一些常見病,對大數據的核心分析能力掌握不深,或者是沒學習動力,基本是在等別人搞完了再拿過來。
所以說歸根結底大數據還是得看怎么應用。
這才有了三強爭霸的局面,日后的三強也是一樣。
阿里的數據量雖然最小,但有高度商業應用價值,而且多數是結構化的數據。百度和騰訊的數據量都比阿里多很多(準確說,高出了數量級)。騰訊是以社交和游戲為主,而且基本給內部用。百度則是量最大的,主要是為提高用戶的搜索體驗和廣告主的精準營銷。
說到底,三家的差別主要是數據來源和商業用途上的差別,核心能力差不多,都基本可以靠Hadoop搞定半結構化數據。
三強面對的不光是彼此,還有國門外的世界,也許100年后的歷史書上既不會提奧巴馬醫改,也不會寫川普有性丑聞,但一定會濃墨重彩地寫上從2014年起中國領導人決定走可持續發展的道路。
如今的三強正走在趕超GooGle、Amazon等硅谷企業的路上,他們彼此間的競爭其實也是面對新對手前的熱身,在吃招喂招之間成長,而不是著眼于彼此??纯醋罱侣勆系娜龔娫谧鍪裁淳椭懒?。
阿里忙著去美國底特律開會,買加拿大龍蝦帝王蟹,簽支付寶國際合作協議;騰訊在忙著收購游戲公司,部署云計算基地;百度在家里憋大招苦修人工智能,無人駕駛。
可以說現階段的三強間的摩擦都是一些小摩擦,各自其實都有著明確的路線藍圖,現階段的摩擦不過是為了拿更多的數據喂食自家產品以及在新領域里做做探索罷了。
他們真正的的征程是走出國門迎戰Google, Amazon,Microsoft,并且取而代之成為新時代的科技巨頭。他們之間的格局最后也會變成Google, Amazon,Microsoft之間這樣,既競爭,也彼此包容,既保持警惕,又不能自制的互相欣賞。
現階段三強和海外巨頭的大數據領域主要差距還是在對數據分析的基礎研究上和大數據分析人才儲備上(國內在大數據人才數量和質量上都和美國差的并不是太大,但畢竟起步晚了)。但大家的發展方向和架構沒有本質上的差別。
十年前,拿三強和GooGle比,會有人訕笑,今天再拿三強和GooGle比,每一個國人都可以像新聞外交部發言人一樣一本正經的說“那是歷史的必然選擇”
此文章來源賽文交通網?。?!