《時代周刊》:用形象化的老辦法對付大數(shù)據(jù)
題材挖掘機 2015.11.14 19:25 大數(shù)據(jù)概念股
導讀:《時代周刊》最新一期封面文章稱,我們每天被數(shù)據(jù)海洋淹沒,只有讓冷冰冰的數(shù)據(jù)形象化,變成看得見摸得著的東西,我們才能從中挖掘出意義。
威廉-普萊費爾(William Playfair)生于1759年,在家里排行老四,父親是上進的蘇格蘭大臣。他年紀輕輕便當上瓦特的個人助理,隨后從事制圖、會計、工程、經(jīng)濟、銀匠、土地投機、記者等多種職業(yè),取得大小不等的成功。最終他在貧困中去世。
不過在此過程中,他差不多是不聲不響地一手創(chuàng)立了統(tǒng)計圖表學,發(fā)明了柱狀圖、線形圖和扇形圖。1786年他出版《商業(yè)和政治地圖集》,該書以一副英國歷史進出口圖開場,放在今天的話與本刊的排版看上去并不太脫節(jié)。用他自己的話說,“普萊費爾是將幾何原理用于財政事務之第一人”。
他生不逢時。如果他活在當今時代,普萊費爾很可能身居硅谷一家受熱捧創(chuàng)業(yè)公司的首席數(shù)據(jù)官高位。我們周圍的世界發(fā)生著看不見但影響巨大的轉變,即從信息稀缺到信息過剩的無聲顛覆。人類進化首先面臨的是食物短缺,如今我們卻遭受著普遍肥胖之苦。
與之大同小異的是,過去我們獲得信息很困難,現(xiàn)在到處都是海量的信息。谷歌前CEO斯密特曾經(jīng)估計,人類每兩天所創(chuàng)造的數(shù)據(jù)量就相當于有史以來到2003年的數(shù)據(jù)量總和。他說這話是在五年前。我們從認識上還未進化到這一步。
估計人類創(chuàng)造的總數(shù)據(jù)量是技術人員的一大愛好。確切數(shù)字雖然各不相同,但誰都承認大得驚人。只需想想你的智能手機就夠了:沒錯,它是一個通訊設備,但它也是把你周圍的世界轉化為數(shù)據(jù)的工具。你看到某個東西,把它拍下來或者錄下來,然后上傳到云端,以字節(jié)的方式永遠存在。每一天人們發(fā)布五億條推文,在Instagram分享7000萬張照片,在Facebook觀看40億條視頻。每一分鐘我們向YouTube上傳300小時的新內(nèi)容。
創(chuàng)造數(shù)據(jù)的不僅是人。還有被稱為物聯(lián)網(wǎng)的新現(xiàn)象。汽車、自動售貨機、眼鏡、計步器等裝上傳感器和傳輸器,與云端或彼此之間通訊。這些物體也像人類一樣在數(shù)字世界留下痕跡。市場研究機構IDC在2014年的報告中估計,數(shù)字世界的規(guī)模將從2013年的10萬億吉字節(jié)增長到2020年的44萬億或44澤字節(jié)。
我們擁有豐富的數(shù)據(jù),但從中獲得的回報卻迅速減少,因為擁有的數(shù)據(jù)越多,就越難從中挖掘出意義。頗具諷刺意味的是,信息過多差不多也像信息不足一樣難以分析和理解。于是,新技術讓我們的世界充斥著越來越多的復雜信息,我們最終就越需要有著悠久歷史的人類努力,即始終致力于使復雜的東西可以理解、從混亂中求得意義的藝術,尤其是視覺藝術。
正如普萊費爾所發(fā)現(xiàn)的那樣,超過某一界限挖掘數(shù)據(jù)意義的最佳辦法就是使數(shù)據(jù)形象化。試想Instagram的海量照片。去年紐約市立大學教授曼努維奇(Lev Manovich)對來自紐約、圣保羅、柏林、曼谷、莫斯科5座城市的12萬張照片進行了視覺分析。他和他的研究團隊從中選取自拍照片,估計照片上的人的年齡和性別。然后他們對照片運用面部分析算法,對所有數(shù)據(jù)進行統(tǒng)計分析,最后放到selfiecity.net制成互動圖表。
結果這些毫無意義的原始數(shù)據(jù)現(xiàn)在具有了意義。你可以按照城市、性別、心情、是否歪腦袋、是否戴眼鏡、睜開還是閉上眼睛瀏覽照片。你可以提出問題并得到答案:誰自拍用的多,男人還是女人?(答案是女人)。哪里的人笑得最多?(曼谷)哪里的老年人愛自拍?(紐約)……
如果你把數(shù)據(jù)形象化看作我們抵抗信息海洋的防洪堤,那么隨著數(shù)據(jù)日益增多,防洪堤的壓力總是不斷上升,而壓力上升又改變了數(shù)據(jù)形象化的方式和作用,這一點甚至普萊費爾也不曾料到。
形象化從對統(tǒng)計數(shù)據(jù)集的分析呈現(xiàn)發(fā)展為實時數(shù)據(jù)的不斷變化圖景。在Bostonography你可以像上帝一樣鳥瞰波士頓所有按照當前時速進行顏色編碼的公交車位置。Crimemapping.com實時顯示按照報案地點分類的案發(fā)地情況,用不同表情符號代表不同性質(zhì)的案件。fbomb.co網(wǎng)站提供上推特的人何時何地如何說國罵的全球實時圖景。
從“紐約出租:生命中的一天”(NYC Taxis: A Day in the Life)可以得見美觀、免費的數(shù)據(jù)豐富性。一位名叫Chris Whong的黑客根據(jù)《信息自由法》從出租車與電召車委員會(TLC)下載50G紐約市出租車數(shù)據(jù),利用這些數(shù)據(jù)制作了2013年某一天任意出租車的路線和收入圖。你可以選擇一輛車快進(或以正常速度——如果你有時間)觀看它在曼哈頓大街上行駛,像勤勞的小精靈吃豆子那樣在身后留下一條藍線。
數(shù)據(jù)形象化并非總是為了鬧著玩。今年4月30日在Kickstarter發(fā)布的一個眾籌項目將從OpenSecrets.org抓去競選資金數(shù)據(jù)并以多種方式自動圖像化,清楚、簡潔地顯示政治家獲得的資金數(shù)量和來源。這是超越透明性的下一個必要步驟:不僅公布信息,而且要公布該信息的意義。今年數(shù)據(jù)圖像化最引人注目、最具革命性的實驗之一是紀錄片制作人、數(shù)據(jù)專家霍洛蘭(Neil)的“二戰(zhàn)死難者”(The Fallen of World War II)互動視頻。該實驗利用圖表圖像講述歷史:表示成千上萬死難者的幾乎獨家的抽象數(shù)據(jù)形象化地帶領我們回顧二戰(zhàn)和“大屠殺”。
視頻六分鐘左右鏡頭急劇仰拍現(xiàn)出摩天大樓似的柱狀圖,表示前蘇聯(lián)軍隊870萬人的傷亡。初一看似乎極不可能,但隨著鏡頭回搖,在二戰(zhàn)的巨大災難中又合情合理。在這種不動聲色的敘述中,人類的死亡更顯觸目驚心。
之后的視頻同樣攝影手法反復出現(xiàn):冷冰冰的抽象數(shù)據(jù)變?yōu)橐曈X藝術,讓我們感同身受,增加知識。現(xiàn)階段人類遭遇普萊費爾也發(fā)現(xiàn)無法理解的海量數(shù)據(jù)。我們也覺得數(shù)據(jù)多得無法理解,而這些數(shù)據(jù)又可能使得我們的世界不可理解。不過我們并非毫無辦法。信息不僅需要自由,它還需要看得見摸得著。
大數(shù)據(jù)概念股:東方國信、易華錄、拓爾思、銀之杰、東方網(wǎng)力、天璣科技、科華恒盛、宜通世紀、榮之聯(lián)、紫光股份、海蘭信、創(chuàng)意信息。
大數(shù)據(jù)概念股
那么問題來了:最值得配置的大數(shù)據(jù)概念股是哪只?即刻申請進入國內(nèi)首個免費的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉載,在概念股網(wǎng) http://m.guangshenggb.com/ 上發(fā)表,為其獨立觀點。不代表本網(wǎng)立場,不代表本網(wǎng)贊同其觀點,亦不對其真實性負責,投資決策請建立在獨立思考之上。