5月初,“2017中國(guó)工業(yè)大數(shù)據(jù)大會(huì)·錢(qián)塘峰會(huì)”在杭州國(guó)際博覽中心舉辦。本屆峰會(huì)以“數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新 融合引領(lǐng)變革”為主題,圍繞工業(yè)大數(shù)據(jù)展開(kāi)分享與交流。中國(guó)科學(xué)院院士、西安交通大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院徐宗本教授以“大數(shù)據(jù)與智能制造融合應(yīng)用”為題發(fā)表演講,引起了媒體的廣泛關(guān)注?,F(xiàn)摘登其部分觀點(diǎn),以餉讀者。
作為一個(gè)數(shù)據(jù)科學(xué)家,今天我講兩個(gè)觀點(diǎn):第一,政府和企業(yè)只要扎扎實(shí)實(shí)打好基礎(chǔ),就能從大數(shù)據(jù)技術(shù)上獲益。第二,大數(shù)據(jù)技術(shù)目前是一個(gè)正在從應(yīng)用中逐漸走向成熟的技術(shù),挑戰(zhàn)仍然很多。
大數(shù)據(jù)是很多工作的基本“標(biāo)配”
什么是大數(shù)據(jù)?什么是數(shù)據(jù)?什么是資料?資料就是生產(chǎn)過(guò)程、管理過(guò)程,乃至經(jīng)濟(jì)、社會(huì)、生活過(guò)程的記憶,那些記憶可能表現(xiàn)在一個(gè)文件、一段演講、一段文字等等。資料放在計(jì)算機(jī)上就叫數(shù)據(jù),所以有個(gè)標(biāo)準(zhǔn)的說(shuō)法,數(shù)據(jù)是指以編碼形式存在的信息載體才是數(shù)據(jù)。真正的大數(shù)據(jù)是指大而復(fù)雜的資料集,這些復(fù)雜性包括了海量性、時(shí)變性、異構(gòu)性、分布性等等,是我們從互聯(lián)網(wǎng)的數(shù)據(jù)能夠觀察到的特征。只要數(shù)據(jù)量超過(guò)臨界量,就叫大數(shù)據(jù),反之則不叫大數(shù)據(jù)。因而講大數(shù)據(jù)涉及兩個(gè)概念:第一,大和小是相對(duì)概念;第二,相對(duì)的特定問(wèn)題而言,不同的決策問(wèn)題要求的數(shù)據(jù)不一樣。
大家認(rèn)為現(xiàn)在是大數(shù)據(jù)時(shí)代,大數(shù)據(jù)可以解釋任何事情,其實(shí)是不正確的。當(dāng)然,不重視大數(shù)據(jù)同樣不正確?,F(xiàn)在都說(shuō)大數(shù)據(jù)是基本的生產(chǎn)資料,大數(shù)據(jù)是基本的生產(chǎn)力,因而才說(shuō)大數(shù)據(jù)是經(jīng)濟(jì)社會(huì)的基本生產(chǎn)資源。大數(shù)據(jù)離不開(kāi)互聯(lián)網(wǎng),近幾年互聯(lián)網(wǎng)的發(fā)展走向是從復(fù)雜的信息傳遞到消費(fèi)互聯(lián),再到生產(chǎn)互聯(lián),也就是物聯(lián)網(wǎng),再到智慧互聯(lián)。在這個(gè)走向中信息技術(shù)向互聯(lián)網(wǎng)產(chǎn)生以后,要與其他任何領(lǐng)域深度整合,這就是今天談?wù)撔畔⒐I(yè)化、談?wù)摯髷?shù)據(jù)的主要原因。
目前有太多的新技術(shù),比如說(shuō)物聯(lián)網(wǎng)、人工智能、移動(dòng)互聯(lián)網(wǎng)等等,其實(shí)這些新技術(shù)都是信息技術(shù)的一個(gè)層面,大家不要期望某一個(gè)技術(shù)包打天下。真正產(chǎn)生效益和作用的是所有技術(shù)的綜合運(yùn)用。千萬(wàn)不要以為有了大數(shù)據(jù)就不講物聯(lián)網(wǎng),講物聯(lián)網(wǎng)就不講互聯(lián)網(wǎng),講互聯(lián)網(wǎng)就不講人工智能,其實(shí)大家是互補(bǔ)的,都是從不同的層面講問(wèn)題。
互聯(lián)網(wǎng)和云計(jì)算是基礎(chǔ)設(shè)施,這是肯定的。物聯(lián)網(wǎng)講的是交互方式,人工智能講的是應(yīng)用模式,那么大數(shù)據(jù)講的是信息技術(shù),是人和人、人和機(jī)器、機(jī)器和機(jī)器交互的內(nèi)容特征。所以,從這個(gè)意義上講,大數(shù)據(jù)是最底層的信息技術(shù),任何工業(yè)要實(shí)現(xiàn)“兩化”,任何政府要實(shí)現(xiàn)科學(xué)決策,大數(shù)據(jù)是基本標(biāo)配。
大數(shù)據(jù)可以帶來(lái)超凡價(jià)值
對(duì)于大數(shù)據(jù)如何去運(yùn)用,我想說(shuō)五句話。
第一,明確目標(biāo)是前提。這是推出大數(shù)據(jù)產(chǎn)業(yè)最重要的一步。我們用大數(shù)據(jù)不是說(shuō)國(guó)家發(fā)個(gè)戰(zhàn)略,有個(gè)文件就用大數(shù)據(jù)。我認(rèn)為只有真正解決每個(gè)地區(qū)、每個(gè)政府、每個(gè)企業(yè)不同的問(wèn)題,大數(shù)據(jù)才有用。
第二,擁有數(shù)據(jù)是基礎(chǔ)。大數(shù)據(jù)產(chǎn)業(yè)就是以現(xiàn)代技術(shù)設(shè)施為基礎(chǔ),以數(shù)據(jù)為生產(chǎn)要素,以數(shù)據(jù)的價(jià)值挖掘?yàn)閯?chuàng)新活動(dòng)的產(chǎn)業(yè),叫大數(shù)據(jù)產(chǎn)業(yè)。因此,沒(méi)有數(shù)據(jù)就談不上大數(shù)據(jù)產(chǎn)業(yè)。
第三,計(jì)算平臺(tái)是支撐。換句話說(shuō),沒(méi)有一定的計(jì)算架構(gòu)和計(jì)算平臺(tái),計(jì)算不了。它是支撐作用,但做企業(yè)的人不必過(guò)分強(qiáng)化,也不必過(guò)分低估。
第四,分析技術(shù)是核心。這是當(dāng)今較少提到的一個(gè)主題。我非常擔(dān)心在整個(gè)大數(shù)據(jù)的鏈條中,有些鏈條做得過(guò)分粗壯,有的鏈條過(guò)分纖弱,也就是產(chǎn)業(yè)鏈布局不均衡。如果過(guò)分膨脹,將會(huì)產(chǎn)生新的產(chǎn)能過(guò)剩。
第五,產(chǎn)生效益是根本。在這里送給大家四句話:數(shù)據(jù)是基礎(chǔ),平臺(tái)是支撐,技術(shù)是核心,盈利是王道。只有記住這四句話,大數(shù)據(jù)產(chǎn)業(yè)才能既不走樣也不失敗。
為什么大數(shù)據(jù)可以帶來(lái)超凡價(jià)值?我概括了三條原理:第一,量變到質(zhì)變的原理。大數(shù)據(jù)之所以有用,是因?yàn)閿?shù)據(jù)積攢到了可以質(zhì)變,通過(guò)數(shù)據(jù)就可以知道背后的故事。第二,分析出價(jià)值原理。剛才已經(jīng)提到,如果存儲(chǔ)不分析,無(wú)疑是只買(mǎi)米不做做飯,產(chǎn)生不了實(shí)際效益。所以,要分析,要挖掘。第三,跨界關(guān)聯(lián)原理。這三條原理是我概括出來(lái)的,和大家分享。
這個(gè)過(guò)程中有很多觀念要改變:第一,數(shù)據(jù)是資產(chǎn);第二,用戶是資源;第三,服務(wù)即感知。正如剛才所說(shuō),大數(shù)據(jù)突飛猛進(jìn)地發(fā)展,能夠解決相當(dāng)多的問(wèn)題,但千萬(wàn)不要以為大數(shù)據(jù)技術(shù)已經(jīng)成熟了。挑戰(zhàn)仍然存在,主要是分析基礎(chǔ)被破壞,計(jì)算技術(shù)待革新,真?zhèn)闻卸ㄐ枰亟?,?duì)新技術(shù)的盲目所引起的盲從?,F(xiàn)在大家的認(rèn)識(shí)越來(lái)越清晰,蕭山區(qū)政府的認(rèn)識(shí)就非常正確??傮w來(lái)說(shuō),雖然挑戰(zhàn)很多,但是仍需集中力量攻克,大數(shù)據(jù)的發(fā)展才能有大的突破。
智能制造大數(shù)據(jù):機(jī)遇與挑戰(zhàn)
制造大數(shù)據(jù)非常重要,“中國(guó)制造2025”主要講的就是這件事情。繼互聯(lián)網(wǎng)之后,真正能夠?qū)ζ髽I(yè)產(chǎn)生重大影響的就是大數(shù)據(jù)。同時(shí),要將大數(shù)據(jù)與其他技術(shù)相結(jié)合?,F(xiàn)在人工智能潮正在到來(lái),在可見(jiàn)時(shí)間內(nèi),真正能夠稱(chēng)得上人工智能、真正發(fā)揮作用的就是數(shù)據(jù)智能,就是大數(shù)據(jù)。因?yàn)槿斯ぶ悄芎?jiǎn)單是兩個(gè)大的類(lèi)型,一類(lèi)是模型人腦工作機(jī)制、行為方式,是防老累老的技術(shù);另一類(lèi)是快速的認(rèn)識(shí),因?yàn)槿四X對(duì)大數(shù)據(jù)的認(rèn)識(shí)本身沒(méi)有那么快,但獲取數(shù)據(jù)的速度極強(qiáng),可以從數(shù)據(jù)中分析出人類(lèi)認(rèn)識(shí)問(wèn)題特定的方式方法,這就是數(shù)據(jù)智能,也叫人工智能。所以,真正起作用的主要是數(shù)據(jù)智能,而從這個(gè)意義上講,數(shù)據(jù)智能無(wú)法和大數(shù)據(jù)分開(kāi)。
大家說(shuō)大數(shù)據(jù)能服務(wù)于轉(zhuǎn)型升級(jí),我建議至少要清楚什么是轉(zhuǎn)型和升級(jí)。工業(yè)中的轉(zhuǎn)型,就是過(guò)去以產(chǎn)品為中心,進(jìn)行產(chǎn)品組織設(shè)計(jì)、制造、銷(xiāo)售管理,到以服務(wù)和以定制化為中心。
最近有一個(gè)基本的觀點(diǎn),說(shuō)從過(guò)去的老三基到新三基,過(guò)去的材料、工藝、零部件是老三基,現(xiàn)在的新三基是大數(shù)據(jù)、傳感器和零部件。大家要知道,對(duì)一個(gè)行業(yè)來(lái)講,數(shù)據(jù)的復(fù)雜性來(lái)源于設(shè)計(jì)、制造、運(yùn)行和服務(wù),來(lái)源于對(duì)每一個(gè)數(shù)據(jù)的仔細(xì)分析。離散型和連續(xù)型并存,數(shù)值型和非數(shù)值類(lèi)型并存,結(jié)構(gòu)化和非結(jié)構(gòu)化并存。大數(shù)據(jù)必須關(guān)注完整屬性,必須關(guān)注產(chǎn)品全壽命特性,必須關(guān)注全方位連接,關(guān)注制造系統(tǒng)融合等等,這些要求使得我們認(rèn)為基本難點(diǎn)在認(rèn)知知識(shí)數(shù)據(jù)。其實(shí)全鏈條數(shù)據(jù),如物理模型的結(jié)合,也是這方面技術(shù)的難點(diǎn)。
大數(shù)據(jù)是新一代信息技術(shù)的基礎(chǔ)性技術(shù),需要應(yīng)用,工業(yè)大數(shù)據(jù)非常有潛力,但一定要解決好定位問(wèn)題、規(guī)劃問(wèn)題、切入點(diǎn)問(wèn)題、標(biāo)準(zhǔn)問(wèn)題、開(kāi)發(fā)共享問(wèn)題等等,互聯(lián)互通是基礎(chǔ),定制化服務(wù)是中心,懂?dāng)?shù)據(jù)會(huì)分析是關(guān)鍵。
來(lái)源:西安交通大學(xué)