人工智能與可視計算的過去、現(xiàn)在與未來
matthew 2016.12.28 07:55 人工智能概念股
一位資深學者、70后,講述了從研究數(shù)學、數(shù)據(jù)、大數(shù)據(jù)、大計算,到制作機器人的親身經(jīng)歷。這里沒有某個技術的細節(jié),卻有整個科技發(fā)展的脈絡,技術研究的思路,產(chǎn)品設計的方向。
本文根據(jù)浙江大學CAD&CG國家重點實驗室副教授、Rokid科學家顧問張宏鑫在鈦坦白的分享整理。
張教授是浙江大學理學博士、香港科技大學計算機系博士后。曾先后在微軟亞洲研究院、德國亞琛工大等做訪問合作研究。近年來已完成論文30余篇,其中多篇論文被SCI/EI/ISTP收錄,并獲得了較高的文獻引用率。在浙江大學 CAD&CG國家重點實驗室,系統(tǒng)并深入地研究了數(shù)字幾何處理、計算機圖形硬件加速、三維重建、可視化和計算機視覺的理論,將離散微分方程、卷積理論成功應用于快捷三維造型。與阿里云合作研發(fā)了渲染云系統(tǒng),并參與了Rokid家庭陪伴機器人的研發(fā)。
以下是張宏鑫教授的分享:
大家好,我是浙江大學CAD&CG國家重點實驗室的張宏鑫,也是Rokid機器人研發(fā)團隊科學家顧問,感謝各位聽眾,也感謝鈦媒體給了我這么一個機會,和眾多人工智能行業(yè)的大佬們一起來做這個分享。
我雖然做機器學習相關的應用研究已經(jīng)十多年了,但還算不上一個真正的搞機器學習或者人工智能的專家,勉強可以算是一個資深的玩家,因為我自己的研究興趣其實主要在圖形學和計算機視覺交叉的領域,后來慢慢擴展到對數(shù)據(jù)的可視化分析。借此機會,我想通過我個人的一些經(jīng)歷,反映我們這一代人的想法,進而講一些我對人工智能的粗淺認識,供大家研討。
緣起
我們這代人屬于70后,我記得我最小時候最喜歡看的一個動畫片是《鐵臂阿童木》,最早看的科幻電影應該是《星球大戰(zhàn)》三部曲,當時對電影里面的R2D2等等機器人特別特別的著迷,這些片子使得我們這代人對智慧機器人有了最早的直觀認識。但是說實話,最早并不知道什么叫“人工智能”,只是單純的覺得這是科學,這些可愛的機器人總有一天會出現(xiàn)在我們的生活當中,會成為我們人類的好朋友。
機緣巧合,直到兩年前的一天,我的好朋友——Rokid公司的創(chuàng)始人Misa找到我,說“我們做機器人吧”,我沒有任何猶豫脫口說“好吧,我們一起干!”于是,和Rokid的團隊一起開始了這個有趣的探索之旅。在這個探索的過程當中,發(fā)現(xiàn)有很多的研究問題大有可為,所以現(xiàn)在也算是樂在其中。
種子
回想起來,從小學到中學隨著年齡的增長,我非常喜歡看幾本雜志分別是《科學畫報》、《飛碟探索》還有《奧秘》,也很喜歡背后的物理跟數(shù)學。然后再大一點的話,喜歡看《無線電》。但是后來發(fā)現(xiàn),《無線電》里面很多簡單的小制作還可以,但是復雜的制作的話需要很多儀器,對于一個初中生、高中生來說是買不起的。所以覺得不如退一步,因為數(shù)學自己還不錯吧,就以數(shù)學為基本工具來探索這個世界。后來也比較幸運,考上了浙江大學,就讀數(shù)學系,算是了卻了自己的心愿。也就是在大學里,有一次很偶然的機會認識了Misa同學,因為他和我一樣很喜歡彈吉他,沒想到兩個人因為彈吉他在一起,斷斷續(xù)續(xù)合作了很多年。
在大學三年級的時候,大概是1996年前后,有一個很有趣的事情。當時的數(shù)學系主任是陳叔平教授,他有一次找我們一幫學生來聊天,問我們對什么東西感興趣。輪到我講的時候,腦子里就突然冒出了三個字——機器人。然后我就對陳老師說,我很想做機器人。陳老師當時愣了好一會兒,微笑著鼓勵我說,“以后要多學習專業(yè)知識,和自動化還有計算機的老師多合作”,也許就是因為師長的這種鼓勵,后來促使我花了很多時間去學計算機的技術,并輔修了偏工程的電氣專業(yè)。
所以說在大學期間的這些經(jīng)歷,在我們70后這一代人的身上埋下了現(xiàn)在做這些智能設備、智能技術的種子,才有了今天Rokid的產(chǎn)品。也正是因此,我們愿意跳出自己的小圈子,把電子器件、計算機技術,以及很多數(shù)學的算法邏輯等等元素組合在一起。說實話,是因為喜歡彈吉他,喜歡音樂,當年我們這幫人才能夠聚攏來,去探索這個有點離經(jīng)叛道,但有些跨界的美物。
也正是因此,我覺得人工智能,不能簡單理解為是一組算法所形成的自動化邏輯,它是軟硬件技術的結合體,只有實物化才是王道。
小數(shù)據(jù)時代
后來很幸運,順利保送浙大碩士以及直接轉為博士,師從數(shù)學系的王國瑾教授。他當時給我的論文題目是《復雜形體建模與繪制的離散方法研究》。在這個課題當中,其實我們研究的是一種樣條理論,試圖通過一種過程式的細分曲面方法來表達三維場景。所以在當時,我廣泛的探索了各種各樣的三維模型如何去進行表達,怎么樣去進行有效繪制之類的問題。
在博士期間,大概2001年左右,我去微軟實習了一段時間。加入了微軟沈向陽博士領導的視覺組,在他那邊做實習生。當時到這個組,給了我一個專門的問題,希望我做重光照(relighting)技術方面的研究。什么是重光照?具體而言,就是研究從一張圖片或者多張圖片中,首先是恢復三維場景,然后再根據(jù)這個三維場景的信息進一步猜測計算物體的材質屬性(補:最后是對三維場景重新打光)。當時來說,這是一個很難的問題,而且需要用到很多的計算機視覺技術,包括圖像分割、立體視覺還有很多數(shù)據(jù)統(tǒng)計的方法。這些方法都是可以看作是人工智能的一種形態(tài),也是機器學習里面的一些典型方法。當時在微軟,有非常好的氛圍。我記得當時有很多很厲害的人,現(xiàn)在都已經(jīng)成為了研究員、教授,比如說孫劍、劉策等等,大家在一起廣泛討論了很多機器學習的方法。
我在微軟的工作屬于“可視計算”領域。可視計算這個方向實際上是計算機圖形學和計算機視覺的交叉領域,這兩個方向其實可以說是天生的一對。計算機圖形學,是一種正向從三維的場景或者數(shù)據(jù)去生成二維圖像的一個過程;而計算機視覺恰恰是反過來的,是從二維的圖像反向去猜測或者是預測三維的結果,特別是基于圖像的重建那塊的內容,可以說圖形學跟計算機視覺是不可分家。所以,在學術界把這兩者加在一起叫“可視計算”。
微軟期間我印象最深刻的是,從那個時候開始接觸所謂的小樣本學習方法。因為當時我們有一個討論班,例如孫劍、王天樹、劉策,還有別的一些朋友,包括朱頌春老師,大家在一起討論各種各樣的視覺方法。期間,我們重點研讀了,SVM發(fā)明人Vapnik博士所寫的一本很有名的書叫《統(tǒng)計學習理論的本質》。在這本書里面他廣泛研討了SVM方法的理論。全文的宗旨是希望通過比較小的樣本,就能夠學習獲得一個很好的統(tǒng)計模型,這個模型是通過數(shù)據(jù)進行計算來獲得的。在當時的這樣一種氛圍底下,其實大家都在探索各種各樣的機器學習的方法,除了SVM方法以外,還有比較重要的是一些降維的技術。
博士畢業(yè)后,我在香港科大做了一年的博士后,當時在那邊合作的老師是戴秋蘭教授,跟她一起做的是基于草圖的人機交互。香港科大在當時如日中天,集合了一大幫來自于五湖四海的科研人員,有的在那邊做博士后的,也有在那邊當教員的。這期間我很榮幸結識了張志華老師,大家親切的把他稱為“老張”,他現(xiàn)在在上交大和北大任教。老張既是我的老師,也是我的朋友,我們經(jīng)常飯后一起在香港科大的海邊散步。散步的時候,他就跟我講好多統(tǒng)計的方法。為此,我們后續(xù)合作做了一些數(shù)據(jù)降維的工作。最終,其中一個算法被用于圖形學中的模型分解跟紋理映射。在當時大家都特別推崇小樣本的統(tǒng)計方法,用了很多統(tǒng)計學里面的理論和計算技巧。但是當時大家都比較鄙視神經(jīng)網(wǎng)絡方法,這是挺特有意思的一個過程。
大概在2005年到2006年左右的時候,我有幸訪問了德國亞琛工大,在那邊訪問的教授是Leif Kobelt。他當時主要做很多關于三維網(wǎng)格處理的研究,其課題組的很多技術其實最后都輸出給寶馬汽車,因而有很多的橫向課題。在訪問Kobelt教授期間,我主要致力于將機器學習技術進一步引入到圖形學當中,用于三維模型的處理和分析。因為在當時,我跟浙大CAD實驗室的一位博士生叫許棟,做了一個很有趣的工作。我們這個技術,可以在不同的三維模型之間進行插值,背后用的計算理論是網(wǎng)格上的微分方法,我們將其稱為“泊松形狀插值”。
泊松形狀插值的方法,Kobelt教授也非常感興趣,因為他發(fā)現(xiàn)這個技術也許可以用于寶馬汽車的外形設計。后來,我們也逐漸意識到這一技術,也許是一種物體的本質表達方法。但是怎么樣去驗證這件事情不好說,因為需要大量的數(shù)據(jù)。因此,從這個項目開始,我就越來越關注圖形數(shù)據(jù)庫方面的一些進展。這當中我們發(fā)現(xiàn)很多數(shù)據(jù),其實適合去做一些數(shù)據(jù)驅動的方法。如果能累積較多數(shù)據(jù),不光是能夠去做圖形的形狀分析與搜索,還能夠去驅動一些相關的物理仿真。
記得有一年,我和一個叫宋超的博士合作做了一個關于物理仿真的技術。在這個仿真技術里邊,我們不光用了是事先采集好的一些形狀數(shù)據(jù),而且還融匯了一個物理力學模型。我們把兩者結合起來,來做到一個比較真實,但是速度非??斓奈锢矸抡嫘Ч?。
但當時做了這一系列的研究之后,說實話我們在學術方面其實有些迷茫,特別在圖形學方向。該方向已經(jīng)發(fā)展到一個非常高的高度,進入了一個平臺期。所以我們在做一些嘗試,想從別的角度去進行一些挖掘,看看還有沒有別的路可以去走。這一點恰恰把我們70年代的人引入到大數(shù)據(jù)的時代來了。
大數(shù)據(jù)時代
大概是在2010年左右,我們前前后后做了三個不同的項目,我把這三個項目總結為三個“大”。
- 大計算
在2010年左右的時候,阿里云的王堅博士找到我們,希望把我們已有的圖形計算渲染,這種非常復雜的計算過程,搬到阿里云上。后來這個項目通過兩到三年的努力成型后,成為阿里云第一個上線的saas應用。
有一次,我們兩邊合作總共調集了6500臺計算機,或者說計算節(jié)點,來完成一部動畫電影的渲染任務,這個片叫《昆塔傳奇》,是我們杭州本地的一家廣告企業(yè)博彩傳媒拍攝的。我們把這么大規(guī)模的計算資源調度起來,做這么一個復雜的計算任務,其實是非常了不起的。正是因為能夠大規(guī)模的去調動這種計算資源的經(jīng)歷,使我后面可以說是開竅了,讓我很興奮,覺得這種大的計算能力真的可以做一些事情。
- 大并發(fā)
我們在完成了阿里云這個項目之后,浙江大學的相關領導對我們很看重,把浙江大學研究生信息系統(tǒng)的改造項目,交給了我的課題組。為此,我們課題組經(jīng)過三年的努力,加上研究生院的老師一起,對整個研究生院的業(yè)務系統(tǒng)進行了一次改造。
在這個改造項目當中,最難的一點在于我們浙大每年有五千名研究生入學。然后這五千人一旦入學之后,會進行一次集中選課,而且這個選課的流程是比較復雜的。可以說這個業(yè)務系統(tǒng),就需要支撐五千個人同時進到這個系統(tǒng)進行選課。這是一個高并發(fā)的項目。我們通過自己的努力,加上一些朋友幫忙,設計了一個很好的基于云的架構。目前這個項目已經(jīng)順利結題,并已經(jīng)上線。我們浙大五萬師生目前每天都在使用這樣一個系統(tǒng)。
- 大數(shù)據(jù)
在2010年代,我們接觸的第三個項目才真正讓我認識到什么叫做大數(shù)據(jù)。當時在杭州本地有一家創(chuàng)業(yè)公司叫做淘淘搜。因為淘淘搜的CEO,也恰恰是我們浙大的同事,他有一次來找我,說我們能不能合作,把淘淘搜的圖像庫給利用起來。這個圖像庫有多大呢?當時的數(shù)據(jù)是大概有四千萬張圖像。我們從中抽取了大概兩百萬張圖像,主要是四類——衣服、包、鞋子、褲子。我們希望能設計出一種新的交互方法,這個基本上重用了我們之前的一些技術,就是草圖交互,我們希望通過草圖交互做一個以圖搜圖的功能。
在整個項目實施過程當中,我們其實也借鑒了很多數(shù)據(jù)庫的相關技術,把數(shù)據(jù)庫里所謂的倒排索引技術,應用到了我們圖像索引里面來。通過它,我們提供給用戶一個非常舒服方便的交互界面,使得用戶通過簡單的勾勾畫畫,就可以選中相關的圖象數(shù)據(jù),后來我們上線了一個專門的App應用放在蘋果的商店里叫“服飾繪”。通過這個應用,用戶可以進行勾畫、搜索最后形成購買。
通過這三個項目,以及各方面科研,我們有很多深刻的體會。在2010年代開始之后,整個業(yè)界擁有的計算能力非常強大了,也有了大規(guī)模的數(shù)據(jù)。而且這些數(shù)據(jù)就是由大規(guī)模的人群產(chǎn)生,因為高并發(fā)往往背后是一個大規(guī)模的普通用戶人群的出現(xiàn)。
這三者的合力其實給了我們一些契機,讓我們覺得數(shù)據(jù)驅動方法已經(jīng)不能只局限于以前的小規(guī)模小樣本的數(shù)據(jù),這個大數(shù)據(jù)的時代真的是來臨了。
但在這個心里面,其實一直記得當時有一個宿愿,就是怎么樣做機器人這件事情?因為對于機器人,我們總是覺得它是很有智慧,很有力量的。它的這種能力的來源,是不是可以通過這種大計算、大并發(fā)與大數(shù)據(jù)的依托去做呢?這是當時放在腦子里的一個問題。
智能家居時代
正是因為我們在2010年左右完成的這一系列項目,使得各方面的合作紛至沓來,我們也有機會結合一些具體的項目來思考大數(shù)據(jù)如何應用到機器人。后續(xù)我們做了兩個方面的探索:一個是在原有可視計算方面的探索,另一個是對人工智能與可視分析方法的探索。而這兩個探索的背景,是我們觀察到,最近幾年整個IT行業(yè)已進入到智能家居時代。
- 可視計算方面
我們發(fā)現(xiàn)了一個趨勢,那就是視覺技術的重新興起。比方說我們在Rokid做了很多新的技術研發(fā),特別是人臉方面。我們從人臉檢測、人臉識別、人臉表情、年齡判斷到性別判斷,做了一系列的工作。最近一段時間,我們在人臉年齡識別方面,在某一個人臉數(shù)據(jù)庫上已經(jīng)刷到了世界第一,因為我們找到了一種新的計算方法。
另外,我們在手勢識別方面也做了一些很有益的探索。當時我們在設計Rokid的時候,有一個初衷,希望除了人能通過語言跟Rokid進行交互,還能通過視覺通道來做各種各樣場景的交互,手勢是其中非常重要的一種手段。
人臉也好,手勢也好,其實我們發(fā)現(xiàn),思路基本上都是通過大量數(shù)據(jù)的累積,來訓練合適的模型。這種模型再結合具體的場景,進行進一步的改造跟提升,就能使它更加實用化。這其實是一個非常有意義的探索。在這個過程當中,不僅僅是簡單去用深度學習等大數(shù)據(jù)處理方法,也要把之前小樣本學習里面的各種技術,比方說各種統(tǒng)計的方法要綜合利用起來。
Rokid是家庭里面的伙伴,所以我們覺得對Rokid這樣的設備,對家庭環(huán)境的認知其實是非常重要的。所以我們結合相關項目的需求,著重做了幾件事情:第一個,我們研發(fā)了一個技術,就是如何從建筑平面圖當中能夠快速的重建室內三維結構。因為對于整個家庭環(huán)境來講,整個三維結構的建立是非常重要的,而讓一般人去做一個交互生成一個三維的建筑平面圖,并不是每個人都可以完成的。所以比較合適的、折中的方式,就是盡量通過一些比較容易獲取的手段拿到這個三維信息。一個思路是,比如說樓道里經(jīng)常有一些建筑平面圖,類似于消防方面的信息,我們的技術可以通過這個圖直接進行構建。另外一個思路是,我們也做過嘗試,就是怎么樣從深度圖像里面去重建三維場景,這也是最近大家比較關心的一塊內容就是SLAM。只有你對三維場景有認知之后,很多家庭的應用,場景里面的應用就可以真的做起來了。
還有一個很有趣的點,怎么樣把視覺的方法跟語音的方法結合起來,或者說,做所謂的多模態(tài)識別?舉個例子,當Rokid看到一個人的時候,不光是“見其形”,也是“聞其聲”。只有在此基礎上,我們對于見到那個人有更多的認知,對他的了解或者判斷會更加的準確。所以其實在這里是有很多的事情可以去做的,我們最近也在做這方面的一些探索。總的來說,這些內容是在可視計算方面與智能家居的一個結合點。
- 人工智能與可視化分析
智能家居時代跟可視化分析是緊密結合在一起的。一個重要原因是在于:像這樣的智能家居設備,會產(chǎn)生大量的后臺日志信息,而如何重用這些信息,本來就是一件非常有趣的事情。
舉幾個我們最近幾年研究的案例。比方說我們在后臺搜集Rokid的一個應答內容,它是一種短文本信息。當時我們?yōu)榱俗鰧嶒?,大概搜集?00萬條短文本信息。我們希望通過這個短文本信息,能夠做一個應答場景的判斷。比方說,你跟Rokid講一句話,“若琪,我想聽歌”,其實應該是個音樂場景;而“若琪,今天天氣怎么樣”是一個天氣的問答場景。后來,我們就是拿了這200萬條的數(shù)據(jù),采用了一個深度學習的神經(jīng)網(wǎng)絡模型進行了訓練。在這個方法當中,我們做了一個特別的嘗試,就是“不分詞”。因為Rokid的主要用戶是講中文、普通話的人群,所以我們需要對中文進行針對性的處理。
我們知道,中文處理往往面臨一個問題需要對中文進行分詞。但是實際上我們后來發(fā)現(xiàn),中文未必需要進行分詞。我們可以把中文里面的每一個字看成是一個單元,然后把它作為一個構建神經(jīng)網(wǎng)絡的基礎,來進行一個深度學習的網(wǎng)絡構建。通過這個網(wǎng)絡的構建,我們就能夠做出一個很好的分類模型,當時我們用了GPU來進行數(shù)據(jù)的訓練之后,大概能達到97%的準確率。所以從這個方面來說,是一個很有意義的嘗試。雖然我本身不是做自然語言處理的,但是因為這些問題背后面臨的數(shù)據(jù),在那些問題里是相通的。使得我們有機會來做一個有益的嘗試。
從而我們發(fā)現(xiàn),這個數(shù)據(jù)本身雖然是大規(guī)模的,但每一條數(shù)據(jù)單位的信息量很少。只有集合在一起,這個數(shù)據(jù)的價值才是很高的,才有豐富的內涵值得我們去挖掘。在Rokid短文本的訓練當中,我們還得到了一些啟示:是不是可以對一般的數(shù)據(jù),也采用類似的自然語言處理的方法,來進行學習訓練,最后獲得一些好的分析結果。
當時正好有一位朋友,給了我一個千萬級的手機日志數(shù)據(jù)。所以我們在這個數(shù)據(jù)集合上面,做了一些探索。這個案例里,我首先介紹下這個數(shù)據(jù)本身。大家知道,現(xiàn)在手機在運行過程當中,后臺會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)會由一些專門的日志分析公司進行搜集。我所拿到這份數(shù)據(jù)里,是一份每個手機里面安裝的應用表的數(shù)據(jù)。現(xiàn)在好多HR在面試人的時候,經(jīng)常會問對方要手機,看對方的手機里面裝了什么樣的應用,因為可以通過一個人在手機里面安裝應用,大概能夠分析出這個人的興趣、愛好,平常喜歡干些什么。我們就是利用這個原理,抽取了這么一個千萬級用戶的應用列表,希望通過這個應用列表來分析用戶的興趣點,也就是通常所說的用戶畫像。在這個應用當中,其實我們是把后臺的日志數(shù)據(jù)通過某種形式的轉化,轉化成了一個個“文本”。通過這個“文本”再做一些語義分析,我們就獲得了人群的聚類信息,相當于我們給每個人或者說“文本”做了一個量化,量化成了一個向量。
有了這個量化信息之后,我們在這么一個大規(guī)模的數(shù)據(jù)上面,就可以再進一步進行可視化。我們分別做了兩種可視化,包括宏觀的和微觀的。通過這個可視化,我們可以看到各個人群的興趣和愛好,他是不是對游戲感興趣,或者說他是不是對于QQ、聊天之類的感興趣。這個其實是有很大的業(yè)務場景可以去應用的。
這樣的數(shù)據(jù)如果只是數(shù)據(jù)層面去進行分析,去進行統(tǒng)計的話,是不直觀的。所以在這項研究當中,我們充分利用了最近大家都在談的地理信息可視化方法。我們把所有的數(shù)據(jù)都投在一個地圖上面,投在這么一個空間上面,做時空數(shù)據(jù)的分析。為此,我們找了很多專家,讓他們去看我們的可視化結果,大家都覺得這個很有意思,因為可以從這個地理信息的可視化上直接發(fā)現(xiàn)一些端倪和趨勢。
后來我們又延續(xù)了這個思路,分析了杭州市運營車輛的數(shù)據(jù)。這個數(shù)據(jù)規(guī)模也差不多是一個十萬級別車輛的數(shù)據(jù),總共一個月的信息,我們做了一個統(tǒng)計跟可視分析。在這個案例里邊,我們同樣的是把汽車的軌跡轉化成像文本一樣的內容。你可以認為一條汽車軌跡就是一個文本,既然是一個文本的話,我們就可以來進行量化分析,用自然語言的方法來進行處理。通過這個量化處理之后,我們就又可以對每條軌跡做一個畫像,然后千千萬萬的軌跡匯聚在一起,我們最后可以對一天24小時獲得24個不同的交通轉換圖。有了這個圖之后,我們就可以進一步的來看看每個時段在城市里面各個關節(jié)要點,是如何在進行各種車輛之間的轉換的。是不是某時段從城西到城東去買東西的很多?或者在某一個區(qū)間段到機場會比較繁忙?
這兩個應用案例里面,其實沒有用到太多的深度學習方法,但是其實里面也包含了一種人工智能的智慧。因為我們是對這種大規(guī)模的數(shù)據(jù)進行了深度的分析,看起來真的是有一點智能。而在這樣的案例當中,人也參與到了整個的分析過程當中,起到了對數(shù)據(jù)進行進一步梳理,設計整個處理過程的作用。
對于云計算,之前我們搞過那些大計算的任務,也做過類似的一個研究。因為我們在做渲染云的時候,曾經(jīng)遇到過云計算后臺有大規(guī)模的數(shù)據(jù)在那里。對于整個并行計算運行的數(shù)據(jù),那些CPU,對內存的占用等各種信息,其實我們都有,但是靠人是看不過來的。然而機器可以,機器可以把這些數(shù)據(jù)給記錄下來,然后計算。所以我們就想了一個方法,是不是能夠把機器記錄下來的數(shù)據(jù)進行可視化,再讓人來做進一步的分析。這個方面的問題,其實我們前前后后做了將近三四年的研究。開始的話也沒有什么眉目,直到最近兩年我們通過跟UC Davis的馬匡六教授合作,做了一個有趣的工作,發(fā)表在了今年的IEEE TVCG上面。我們把云計算各種各樣的指標做了一個綜合,而這些指標通過可視化的系統(tǒng)可以展現(xiàn)出來。通過這么一個可視化的方法,我們把他稱為行為線,英文叫Behavior Line。對于每一臺機器,對于一個集群里面的每一個計算節(jié)點,我們都可以進行刻劃,然后通過這些行為線的匯聚進行可視化之后,我們可以分析清楚在一個集群當中很多分布式的計算任務是如何進行調度的,他整個的計算生命周期當中的各種資源是如何進行變化的。通過這種分析,我們可以進一步知道,在一個云計算集群里面,計算資源是如何分配,可以如何進行優(yōu)化的。
最后一個案例也是關于Rokid的,上半年我們做的一項很有趣的工作,把Rokid的很多日志數(shù)據(jù)按照時間,按照月、星期、天進行了一個可視化,我們把這樣的分析稱為“可視化敘事分析”。因為我們希望知道一個用戶或者一群用戶在使用Rokid的時候,一天做了哪些事情?在這個項目當中,我們把整個日志數(shù)據(jù)進行了清洗,進行各種各樣的整理,也通過類似前面所講的自然語言處理的方法,進行了分類。用戶的行為,通過這種方法,還真可以顯現(xiàn)出來他每一天的規(guī)律??梢哉f是“躍然圖上”了。
未來
從我非常個人的理解來說,人工智能是一種基于數(shù)據(jù)的累積,是一種數(shù)據(jù)驅動的方法。這個跟我個人的研究經(jīng)歷有關系。從小數(shù)據(jù)時代到大數(shù)據(jù)時代,到后面的智能家居,對各種各樣應用數(shù)據(jù)的處理,我們深深的體會到這種數(shù)據(jù)驅動方法是無處不在的。而且人工智能應該是人的智慧與機器智能的融合。因為在我們的研究當中,特別是最近一段我們在可視分析領域的些微進展,讓我特別確信這一點。在這個過程當中,存在人與機的互動。這個最早在我們開始做人機交互的時候,其實我隱隱當中已經(jīng)覺得有這種因素在。因為在這個過程當中,機器往往負責的是機械邏輯方面的一些計算,各種數(shù)據(jù)的清洗,非常繁復的工作,而且轉得非???。人負責思考,進行數(shù)據(jù)的整理,從宏觀方面,從邏輯方面,進行進一步的分析。同時這種機器和人之間的互動形成了一個閉環(huán)。我相信這種閉環(huán)對于我們這種數(shù)據(jù)科學,對人工智能,甚至對因人工智能而所產(chǎn)生的智能家居設備,它的制造、生產(chǎn)以及設計各個環(huán)節(jié),都會是有很大的助益的。
人工智能概念股:埃斯頓、科大智能、漢王科技、江南化工、華東數(shù)控、和而泰、中科曙光、永創(chuàng)智能、北京君正、通富微電、永創(chuàng)智能、勁拓股份。
人工智能概念股
那么問題來了:最值得配置的人工智能概念股是哪只?即刻申請進入國內首個免費的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉載,在概念股網(wǎng) http://m.guangshenggb.com/ 上發(fā)表,為其獨立觀點。不代表本網(wǎng)立場,不代表本網(wǎng)贊同其觀點,亦不對其真實性負責,投資決策請建立在獨立思考之上。