337p西西人体大胆瓣开下部,人妻偷人va精品国产旡码,无码高潮少妇毛多水多水,亚洲爆乳巨臀无码专区,国产乱子伦小说

你的位置:首頁 > 新聞動態 > 行業新聞

“大數據”時代,什么是數據分析做不了的?

2015-4-12 20:46:16      點擊:

(文/DAVID BROOKS)不久之前我曾與(yu)一位(wei)大型銀行的(de)首(shou)席執(zhi)行官一同(tong)用餐。他正在考(kao)慮是(shi)否(fou)要退出意大利市場,因為經濟(ji)形勢不景(jing)氣,而且未來很(hen)可能(neng)出現一場歐元危機(ji)。

這位CEO手下的經濟學家描繪出一片慘淡的景象,并且計算出經濟低迷對公司意味(wei)著什么(me)。但是(shi)最(zui)終,他(ta)還是(shi)在自己價值觀念的指(zhi)引下做出了(le)決定。

這家銀(yin)行在(zai)意大(da)利(li)已(yi)經有了幾(ji)十年的歷史。他不(bu)希望意大(da)利(li)人覺(jue)得他的銀(yin)行只(zhi)能同甘不(bu)能共苦。他不(bu)希望銀(yin)行的員工認為他們在(zai)時局(ju)艱難之際會棄甲而(er)逃(tao)。他決定留在(zai)意大(da)利(li),不(bu)管未來有什么危(wei)機都要堅持下去,即便付出短期代價也在(zai)所不(bu)惜(xi)。

做決策之時他(ta)(ta)并沒有忘記(ji)那些數(shu)據,但最終他(ta)(ta)采用(yong)了另(ling)一(yi)種不同的思(si)維方式。當(dang)然,他(ta)(ta)是(shi)正確的。商業建(jian)立在信任(ren)之上(shang)(shang)。信任(ren)是(shi)一(yi)種披著情感(gan)外衣(yi)的互惠主義。在困境(jing)中做出正確決策的人和機構能(neng)夠贏得(de)自尊(zun)(zun)和他(ta)(ta)人的尊(zun)(zun)敬,這(zhe)種感(gan)情上(shang)(shang)的東西是(shi)非常(chang)寶貴的,即便它不能(neng)為數(shu)據所捕捉和反映。

這個(ge)故事反映(ying)出了(le)數(shu)據分析(xi)的(de)(de)(de)(de)長處和局限。目前這一歷史時期最大的(de)(de)(de)(de)創新就在于,我(wo)們(men)(men)的(de)(de)(de)(de)生活現在由(you)收集數(shu)據的(de)(de)(de)(de)計算(suan)機調控著。在這個(ge)時代,頭腦無(wu)法理解的(de)(de)(de)(de)復雜情況,數(shu)據可以幫我(wo)們(men)(men)解讀其中的(de)(de)(de)(de)含義(yi)。數(shu)據可以彌(mi)補我(wo)們(men)(men)對(dui)直(zhi)覺的(de)(de)(de)(de)過分自信,數(shu)據可以減輕欲望對(dui)知覺的(de)(de)(de)(de)扭曲程度。

但有,些(xie)事情是“大(da)數(shu)據”不(bu)擅長的(de),下面我(wo)會(hui)一(yi)一(yi)道來:

數據不懂社交。大(da)腦(nao)在數學方面很(hen)差勁(不(bu)信請迅速心算一下(xia)437的平方根是多少),但是大(da)腦(nao)懂得(de)社會認知。人們擅(shan)長(chang)(chang)(chang)反(fan)射彼此(ci)的情緒狀態,擅(shan)長(chang)(chang)(chang)偵測出不(bu)合(he)作的行為,擅(shan)長(chang)(chang)(chang)用(yong)情緒為事(shi)物賦予價值(zhi)。

計(ji)算機數據(ju)分析擅長的(de)(de)(de)(de)是測量社(she)會交往的(de)(de)(de)(de)“量”而(er)非“質(zhi)”。網絡科學家可以測量出你(ni)在(zai)76%的(de)(de)(de)(de)時間里與6名同事的(de)(de)(de)(de)社(she)交互動情(qing)(qing)況,但是他們不(bu)(bu)可能捕捉到你(ni)心底對于(yu)那些一年才見2次的(de)(de)(de)(de)兒時玩(wan)伴的(de)(de)(de)(de)感情(qing)(qing),更不(bu)(bu)必說但丁對于(yu)僅有兩面之緣(yuan)的(de)(de)(de)(de)貝阿特麗斯的(de)(de)(de)(de)感情(qing)(qing)了(le)。因(yin)此(ci),在(zai)社(she)交關系的(de)(de)(de)(de)決策中(zhong)(zhong),不(bu)(bu)要愚蠢(chun)到放(fang)棄頭腦中(zhong)(zhong)那臺充滿魔力(li)的(de)(de)(de)(de)機器,而(er)去相信你(ni)辦工作上的(de)(de)(de)(de)那臺機器。

數據不懂背景。人(ren)類的(de)(de)決策(ce)不是(shi)離散的(de)(de)事(shi)件,而是(shi)鑲(xiang)嵌在時(shi)間序列和背景(jing)之(zhi)中的(de)(de)。經(jing)過數百萬年的(de)(de)演化,人(ren)腦已(yi)經(jing)變(bian)得(de)善于處理(li)這樣的(de)(de)現實。人(ren)們(men)擅長講述交織了(le)多重(zhong)原(yuan)因和多重(zhong)背景(jing)的(de)(de)故(gu)事(shi)。數據分析則不懂得(de)如何(he)敘事(shi),也不懂得(de)思(si)維的(de)(de)浮現過程(cheng)。即(ji)便是(shi)一(yi)部(bu)普普通通的(de)(de)小說,數據分析也無法解釋其中的(de)(de)思(si)路。

數據會制造出更大的“干草垛”。這一(yi)觀點是由納西姆•塔勒布(bu)(Nassim Taleb,著名商業思想家(jia),著有《黑(hei)天鵝(e):如何應(ying)對不可知(zhi)的(de)(de)(de)未來(lai)》等(deng)書作)提出的(de)(de)(de)。隨著我們掌(zhang)握的(de)(de)(de)數(shu)據越(yue)(yue)來(lai)越(yue)(yue)多(duo),可以發(fa)現的(de)(de)(de)統計上顯著的(de)(de)(de)相關(guan)(guan)(guan)關(guan)(guan)(guan)系也就越(yue)(yue)來(lai)越(yue)(yue)多(duo)。這些(xie)相關(guan)(guan)(guan)關(guan)(guan)(guan)系中(zhong),有很(hen)多(duo)都(dou)是沒有實際(ji)意(yi)義的(de)(de)(de),在真正解決問題時很(hen)可能將人引(yin)入歧途。這種欺(qi)騙(pian)性會隨著數(shu)據的(de)(de)(de)增(zeng)多(duo)而指數(shu)級地增(zeng)長。在這個(ge)龐大(da)的(de)(de)(de)“干草垛”里,我們要(yao)找的(de)(de)(de)那根針被越(yue)(yue)埋越(yue)(yue)深。大(da)數(shu)據時代的(de)(de)(de)特征之一(yi)就是,“重(zhong)大(da)”發(fa)現的(de)(de)(de)數(shu)量被數(shu)據擴張(zhang)帶來(lai)的(de)(de)(de)噪音所(suo)淹沒。

大數據無法解決大問題。如果你(ni)(ni)只想分(fen)(fen)析哪些郵件(jian)可(ke)以帶(dai)來(lai)最(zui)多的(de)競選資金贊助,你(ni)(ni)可(ke)以做一個(ge)隨機控制實驗。但假(jia)設目標是刺激衰退期的(de)經濟形(xing)勢(shi),你(ni)(ni)就不(bu)可(ke)能(neng)找(zhao)到(dao)一個(ge)平行世界中的(de)社會來(lai)當對(dui)照組。最(zui)佳的(de)經濟刺激手段(duan)到(dao)底(di)是什(shen)么?人們對(dui)此爭論(lun)不(bu)休,盡管數據像海(hai)浪一般涌來(lai),就我所知,這場辯論(lun)中尚未有哪位主(zhu)要“辯手”因為參考了數據分(fen)(fen)析而(er)改(gai)變立場的(de)。

數據偏愛潮流,忽視杰作。當大量個(ge)體對某種(zhong)文化產品迅速產生興趣時,數(shu)據分析(xi)可(ke)以敏(min)銳地偵測到(dao)這種(zhong)趨勢。但是,一些重(zhong)要的(也是有(you)收益的)產品在一開(kai)始就被數(shu)據擯棄(qi)了,僅僅因為它們的特異(yi)之處不為人所(suo)熟(shu)知。

數據掩蓋了價值觀念。我(wo)最近讀(du)到一本有著精彩標題的(de)學術專著——《‘原(yuan)始(shi)數據(ju)’只是(shi)(shi)(shi)一種修辭》。書中的(de)要點(dian)之一就是(shi)(shi)(shi),數據(ju)從來(lai)都(dou)不可(ke)能(neng)是(shi)(shi)(shi)“原(yuan)始(shi)”的(de),數據(ju)總是(shi)(shi)(shi)依照(zhao)某人的(de)傾向和(he)價(jia)值觀(guan)(guan)念而(er)被構建出來(lai)的(de)。數據(ju)分析的(de)結(jie)果看(kan)似客觀(guan)(guan)公正,但(dan)其(qi)實價(jia)值選擇(ze)貫(guan)穿了從構建到解讀(du)的(de)全過(guo)程。

這篇文章并不是要批評大(da)(da)(da)數(shu)據不是一(yi)種(zhong)偉大(da)(da)(da)的(de)(de)(de)工(gong)(gong)具。只是,和任(ren)何一(yi)種(zhong)工(gong)(gong)具一(yi)樣,大(da)(da)(da)數(shu)據有拿(na)手強項,也有不擅長的(de)(de)(de)領域(yu)。正如耶(ye)魯大(da)(da)(da)學(xue)的(de)(de)(de)愛(ai)德(de)華•圖弗(fu)特教授(Edward Tufte)所說:“這個世界的(de)(de)(de)有趣之處,遠勝任(ren)何一(yi)門學(xue)科(ke)。”

 

編譯自:《紐約時報》,What Data Cannot Do
文章圖片:(小圖)computing.co.uk;rwconnect.esomar.org