洞察消費者全部的行為,是商業社會一直以來的夢想。今天,這個夢想似乎不再遙不可及,因為我們手中已握有最重要的拼圖,它就是數據。從電子商務誕生之日起,數據就是區別于傳統商業的利器,因而不夸張地說,數據的挖掘和應用是電商的競爭力,更是使命。
本系列文章旨在從理論到實操,厘清數據與商業的關系,從營銷到轉化,探討電商數據化運營的道與術。本文作為本系列的第一篇之理論篇,從大數據的定義講起,啟示我們如何運用大數據的思維,按圖索驥拼出一張商業地圖。作者車品覺現任阿里巴巴副總裁,商業智能部負責人,是電商大數據挖掘和應用的專家。
何謂大數據
什么是大數據?在大多數人理解中,是企業用數據來優化自己的流程、產品以及決策,讓運營變得更有效。但我認為,這還不能涵蓋大數據范疇。
事實上,大數據是一個包含了技術和商業兩個層面的綜合性的概念。
一方面是技術層面的。在技術層面,數據并不是一個新鮮的概念,從計算機誕生的那一刻起就伴隨著數據的產生,但是在那個時候并沒有大數據的概念。一直以來,要進行海量的數據存儲、高效的數據計算,都需要有非常強大的計算機來支撐,而動輒百萬美元計價的大型機的硬件成本和每月數萬美元的維護成本并不是每一個企業都能夠承擔的。在高昂的成本面前,數據的使用成為了企業的一種“奢侈品”,并沒有得到很大的普及。最近幾年來,技術在不斷地進步和發展,類似于Hadoop這樣的分布式存儲和計算系統的出現,大大提高了數據存儲和計算的效率,使海量數據應用于商業變成了可能。大數據的概念也開始被越來越多的人關注。
另一方面是商業層面的。對于商業而言,最重要的是能夠讓企業通過數據獲得更多的收益。傳統意義上的數據是面向業務的,對于每一條業務線來說都會有數據的積累,相信很多企業已經在這方面做得很好了,可以說“量”已經足夠了。如果連“量”這方面都沒有做好,那我覺得有必要先去修煉一下內功,畢竟數據不是一天就能建成的。而能夠讓商業產生更大價值甚至顛覆性創新的則是多樣性的數據。這個多樣性是指能夠將多種數據連接在一起看,通過彼此之間的關聯和互動讓數據產生商業的價值。比如谷歌公司的“流感趨勢”預測模型就受到了很多人的關注。作為一家互聯網公司,谷歌是如何知道流感趨勢的呢?它的核心價值就在于大數據的應用。谷歌通過分析發現,在流感的不同階段,某些與流感有關的藥品、癥狀的關鍵詞會表現出不同數量和特征,谷歌正是通過這種多樣性數據的關聯來發現了數據價值。
對于企業來說,良好的指標體系可以增加企業可預見的范圍。通常情況下,數據可以通過是否正向作用、是否可預見兩個維度歸納成四個類別(見圖1)。對于企業而言,那些具有正向作用且可預見的數據通常作為運營指標進行關注,而那些具有反向作用且可預見的數據通常作為風險來規避,這都是需要先修煉好的內功。但是除了圖右邊可預見的數據之外,還有大量的不可預見的數據。例如雙十一,淘寶的目標是單天銷售100億,結果卻實現了191億,那么91億便是不可預見的驚喜。對于我們來說,我們需要把不可預見的變成可預見的,也就是把驚喜變成可預見的,讓它發揮更大的價值,把悲劇變成可預見的,最大可能地減少它。
縮小未知世界
如果說上述都是對大數據定義的解釋,那么下面用一張圖更清楚地展現企業與數據的關系。如圖2所示,橫坐標上方的是企業內部數據,包括財務數據、運營數據、市場數據這類公司的結構型數據,以及WA和MA,即網站的分析數據和移動應用數據;下方是企業外部數據,包括百度、SNS的社會數據,和comScore、Hitwise、艾瑞這類的第三方數據,這些往往是競爭對手的數據。
事實上,這四類數據都沒有得到電商企業足夠的重視。大多數有傳統商業背景的電商企業,對網站分析數據都不太專注。但往往它們一旦能用上網站分析數據,會大大改變自己內部的數據。
例如,一個消費者看了但不買,沒有產生消費,所以這組數據不可能出現在企業的經營數據中,絕對是網站分析數據。換而言之,如果要知道企業未來的機會,起碼可以把那些看了不買的消費者轉變成客戶,如果能轉化20%,你的市場會增加多少?
在這種情況下,如果你無法解釋市場份額增加的原因,那么這個就屬于“驚喜”;但當你看懂數據,當“驚喜”變得更加確定并做出相應的調整,不可知的東西慢慢變小,公司也會越來越聰明(Data smart)。
相比較對未知“驚喜”的探索,對未知風險的警惕顯得更為重要。當競爭數據化,不再是去看對手做了什么事,而是從那些“微聲音”中感受危機,例如,以前A公司的消費者,有10%是先去B公司看看后再來A公司的,現在這個比例變成了30%,說明B公司的影響力比以前大,一旦B公司策略有變化,對于A公司便是危險。所以,需要用一些非結構化的數據不斷補充,這就是大數據的范疇。
除此之外,SNS、百度這類的社會數據也是很大一塊非結構化的數據。這些社會數據不單只是用來評價公司口碑的好壞,同樣能幫助公司進行一些決策,只是一直沒有找到這個連接點。
表面上,這套框架已經很全面,但是盡管第五個元素沒有加入,可運營的能力還是極低。所謂的第五元素便是人,當不同的用戶群走進去后,整套框架立刻變得千變萬化。
在蛛絲馬跡中找數據
在商業環境中的企業,究竟應該收集什么數據,哪些數據對企業重要,這個數據究竟是社會數據、競爭數據、交互數據還是經營數據,這些都需要思考。
事實上,不少公司在收集數據上存在問題。如果早上8點你在A路上,覺得特別堵,怎么解釋那條路那天特別堵呢?必須收集與A路相鄰相交的各條路的情況,如果這些周邊數據不收集,只關注了一個數據,是沒法驗證A路堵車原因的。
這就是說,數據收集過程是沒有邊界的,不可能因為大數據的關系,什么數據都去收集,但一些關鍵性的核心數據以及周邊數據必須收集,否則一旦錯過,就沒有機會。
在目前電商中,最欠缺的是內部監控數據。簡單舉例,怎么去評價整個網站、店鋪運營做得好不好,大多數商家是沒有精準收集的。正是對自身運營含糊,使得突然的業務上漲只能歸功于好運,并不清楚為什么會漲。而如果突然變得不好,在找不到原因的情況下,風險控制更是無從談起。
這些現象的原因是大多數公司的數據之間(經營數據、用戶交互數據、競爭數據、社會數據)是不通或者缺乏周邊視野的。其中缺乏數據框架是重要原因。
此外,在國內,運用社會數據的例子不是太多,大多數都是用社會數據來分析一個公司的輿情,但會發現很多公司用完一段時間就銷聲匿跡。其實,社會數據同樣可以幫助企業減少風險,甚至預知市場。那些對企業有影響的“微聲音”早就存在了,但企業可能會忽略了其中的重要線索。
例如,我在一家B2B公司的時候,曾經提出一組數據,如何多角度去確定一個批發賣家是不是騙子。其中的元素很簡單,用他在網站所注冊的郵件地址去搜索,看與其公布在其他網站的郵箱地址是否相同,如果這個郵箱多次出現則說明這個人比較可信,如果這個郵箱在其他網站都搜索不到,風險便比較大。我們用兩組歷史數據去跑,發現的確是這樣,風險可以減少30%以上。這便是應用社會數據。
另外一個應用社會數據的案例,同樣是在B2B平臺。為了推出一些新的類目,我每天逛一些美國網站,從公開的數據去研究,到底美國B2C網站買了哪些Google關鍵詞,看這些關鍵詞的價格記錄,根據它們買的關鍵詞來估計未來的趨勢。當時我認為,美國B2C網站內的SEM達人肯定比中國人更懂美國的趨勢。
只要關注達人在關注什么關鍵詞,知道他們的數據后,再用其他數據來驗證到底會不會是趨勢。簡單來說,也是運用社會數據。所以,在運用社會數據時,首先要充滿好奇地關注周邊數據,好奇心會帶你找到很多有趣的數據。
舉個好玩的例子:以前,很多京東的競爭對手都好奇它每天能做多少單,那時候,只要早上在京東下訂單,晚上再在京東下個訂單就能知道。因為最初京東的訂單編號是一個一個加上去的,后來京東自己也發現了,便改了。
很多時候,看數據就要像福爾摩斯一樣,要從蛛絲馬跡中去判斷,數據會偷偷地“走”出來,只要你有足夠的心去看待它。
數據拼圖爭奪戰
實際上,對于現在的公司來說,需要的是大數據的精神,而非大數據的架構,這是兩個不一樣的概念,千萬不要混為一談。
大數據架構是技術性的架構,在中國擁有大數據架構的企業屈指可數。即使阿里巴巴、騰訊有著非常強大的大數據技術,但仍然沒有形成真正大數據的框架,都還在路上。
其實,對于這些互聯網大佬而言,大數據的真正價值是數據拼圖,但大家究竟在拼什么呢?追本溯源,商業是為了賺錢,實際上,是用消費者的行為在賺錢,但沒有人知道一個消費者行為的全貌。數據拼圖就是用已知的東西、用數據的方法來找出未知的東西,以期能做出一個決定,拼出一個消費者購物行為的拼圖。
一個新用戶進來,真實價值有多大?他的行為是怎么樣的?他的購買喜好怎么樣?當空間和時間(Marketing的4P)變化的時候,剛才講到的行為相對有什么改變……要知道這些,就需要拼圖。一旦知道這些答案,相信你就沒有對手了。
只可惜現在誰都沒法拼出這張圖。淘寶有大量的購物數據(Transactional data),可以從購物數據中去找出消費者在購物時的偏好;騰訊有大量的社交類數據(Social data),可以從社會數據中拼出消費者在SNS上面所表達出來的他們的需要;百度有大量的帶有明確目的的搜索數據 (Intention data),可以從大量搜索數據中去找出消費者的行為需要是什么。
我的前前老板是沃爾瑪的COO,不懂數據,但是告訴我,根據他在沃爾瑪做了這么多年的經驗,總有一天,當一個顧客走進沃爾瑪大門時,就知道他要什么。這個是零售業的老大相信的,十年內這個事情就要發生,所以沒數據會很可憐,這個世界會出現兩種人——數據的富人和數據的窮人。
現在越來越多的公司在用數據挖掘,但其實都沒有真正用好,而真正用到大數據的公司更是少之又少。以我的理解,現在能用上大數據的公司,一般來說產品經理都很會用數據。無論是Google還是Facebook,凡是大數據很厲害的公司,都有一套很好的大數據發現系統。
在過去的幾年,Facebook不斷地更新發現系統。兩年前,他們的發現系統可以通過一個男生輸入的關鍵詞,推測出他未來離婚的可能性會達到多少。
雖然我在負責BI部門,但我認為,好的發現系統是不需要BI部門的人跑數據的,凡是要用上大量數據分析師資源去跑數據的公司,其實就已經落后了。好奇和相關肯定是來自第一線對這個產品很有感覺的人。如果找一個分析師,他對這個產品都不是很熟悉,又怎么能找到相關的東西?這就如同隔山打牛。
改變思考方式
但不可否認,大數據思考的精神是每一家公司都能用的,只要讓他們偶爾找到大數據的精神所在,就會有很大進步。
前段時間碰到一個B2C公司的CEO,我向他建議,今天下訂單的消費者,也許在十幾天前已經在瀏覽網站,你為什么不收集這個消費者從注冊那天起,所看過的產品與最后購買產品之間的關系,為將來所用呢?
我認為,這個數據就是大數據思考的精神所在。其實,大數據并不是我們在聚光燈下看到的這么死板,而是要充滿好奇,不斷地自問,有什么數據(全新的或重新創造的)能夠解決今天的一些問題。
一直以來,由于數據獲取成本高,大多數商家都用假定沒數據的方式進行決策。而如今,要想具備大數據思考精神,必須先改變思考方式,假定這個世界能找到任何數據來思考你的問題。
而這一思考方式的改變,最重要是從管理層開始,如果沒有意識到大數據是個管理問題的話,做大數據是沒意義的。
企業管理層不要過度注意自己的事情,要把眼界打開,看到周邊的微信號和自己現在所做東西的一種關系,這是大數據的精神所在。具體點說就是,不要只盯著今天眼前的數據,有些數據雖然放在路邊,但是它卻非常有用,只是你沒有看見,所以沒有把它用上。今天大數據使更多人知道,周邊數據比本身數據更重要。
如果大家相信我,就不要再說做大數據,而是說用大數據的思考來運用數據。雖然公司有數據挖掘部門,但這些數據都是用來做營銷的,而這并不是大數據。
現在,我常常接觸的電商老板,已經開始運用大數據思考,每天都講數據,而這些數據就是大數據能夠給到他們的機會是什么。對于企業運營層面而言,不需要把數據分為大數據和小數據,但是企業的決策層應該有所區分。
例如,唯品會把自己BI團隊的員工打散在業務部門做輪崗,他們在業務部門輪崗六個月后再回到BI團隊。我覺得這個做法非常對,一個沒有商業感覺的數據分析師是廢人一個。
而銀泰網的CEO廖斌,現在天天在美國走來走去,看人家大數據在干嘛。對于CEO來講,應該多一些對大數據的了解,通過思考讓企業更好地發展。
但公司的運營層面,要老老實實把公司里可以用的數據都用上,忌不吃碗里的,只盯鍋里的,用大數據的思考方式來找出一些以前沒看過的點。
大數據的新挑戰
當數據越來越復雜,大數據同樣面臨新挑戰。預計未來,當無線數據和電腦數據混在一起后,將是大數據的一大難題。
早上,你用手機看到覺得挺好的商品,點擊收藏,下午,你用電腦打開再看,那這個鏈條加起來后,你覺得以前電腦端講的漏斗還有效嗎?
所謂的轉化率都是假定存在于電腦發生,而如今,包括淘寶在內的很多網站手機的訪問占比已經遠遠高于幾年前了。當用手機和用電腦購買商品的用戶群混在一起,用什么方法證明購物體驗的好壞、轉化率的高低,都需要重新設定。
而無線所產生的數據,與網站分析數據最大的差異是情景(Context),究竟是在百貨公司里搜索還是在機場里搜索,重要的是在什么情景下進行搜索,這是很重要的鏈接點。
除了無線數據,線下和線上數據的關系,也會產生新的數據原材料和方向(Re-invent Data)。
在某些地區,線上購物已經極具影響力,線上的商家慢慢發現,最大的競爭對手不是線上的競爭對手,而是傳統商業的線下零售商。
其實,1號店最大的競爭對手是離消費者三百米外的沃爾瑪。以前,線上購物用戶比較宅,他們更偏向互聯網,但是現在線上市場已經不是一幫鐵桿的互聯網用戶群,而是一群以前在線下購買,現在開啟線上購買的人,這才是所有電商公司正在爭奪的用戶群。
所以線上和線下這兩種數據,變得非常重要。
例如,我看過亞馬遜的數據科學家的用戶檔案里,重點關注的是消費者首次/末次購買情況,購買的地理位置旁邊的數十公里范圍內有沒有書店。因為亞馬遜知道最大的對手是線下書店,消費者喜歡逛,而線下書店可以提供逛的感覺,這就是競爭對手。
一直以來,互聯網用戶群是最核心的線上消費者,而現在被部分線下消費者稀釋了,所以現在的消費者更偏向瀏覽和逛,用戶的行為更寬泛。
事實上,逛的用戶習慣和傳統的線上購物習慣是矛盾的,傳統線上購物是先有目標,輸入關鍵詞,再選東西,但對于逛的人,根本不需要關鍵詞。這也是為什么淘寶要開始推逛的概念,這是一個趨勢。
看淡數據的得失
數據不會把一家公司救活,只有公司經營的方向和理念,才會救活一家公司,數據只是錦上添花, 甚至有人說數據是用來幫企業調頭用的。
但大數據思考顯然不同,它并非錦上添花之用,而是將數據作為產品的原材料,產生一種新的商業模式。如果有人能想到,有些數據以前沒人關注,運用到商業中,可能會出現一個新模式,這才是大數據的范疇。
最近我一直都在思考,什么樣的團隊才可以管理大數據,這個必須要想清楚。先想通人再講事,因為數據人才在中國非常少,在這種人才、管理經驗都不夠的情況下,要做到很棒的數據是不容易的。所以在數據上,人才培養才是王道,在未來的一兩年會很重要。在目前這個浮躁的環境下,中國專業性的人才很難培養起來。
至于未來,因為大數據還沒形成一種直接動力,很難形成積累和利用的意識。對電商老板說,只能慢慢來,對數據不要失望,也不要太樂觀。今天,企業最難抓到的點是,如何在專注的領域里找到一些對企業有價值但是以前沒有關注過的數據,這個數據如果能為我所用的話,會成為企業的核心競爭力。
【想看更多互聯網新聞和深度報道請關注速途網官方微信。(微信號:速途網)】