數(shù)據(jù)分析,包括大數(shù)據(jù)分析,在企業(yè)的業(yè)務(wù)中,特別是在傳統(tǒng)的商務(wù)行業(yè),已有多年的應(yīng)用實(shí)踐,在消費(fèi)者市場的營銷中已成了必不可缺的技術(shù)。隨著工業(yè)互聯(lián)網(wǎng)和智能制造的興起和發(fā)展,工業(yè)大數(shù)據(jù)技術(shù)也越來越受到各方關(guān)注。在“中國制造2025”的技術(shù)路線圖中,工業(yè)大數(shù)據(jù)是作為重要突破點(diǎn)來規(guī)劃的,而在未來的十年,以數(shù)據(jù)為核心構(gòu)建的智能化體系會(huì)成為支撐智能制造和工業(yè)互聯(lián)網(wǎng)的核心動(dòng)力。
對制造企業(yè)而言,不論是新實(shí)施的系統(tǒng)還是老舊系統(tǒng),要實(shí)施大數(shù)據(jù)分析平臺(tái),就需要先弄明白自己到底需要采集哪些數(shù)據(jù)。因?yàn)榭紤]到數(shù)據(jù)的采集難度和成本,大數(shù)據(jù)分析平臺(tái)并不是對企業(yè)所有的數(shù)據(jù)都進(jìn)行采集,而是相關(guān)的、有直接或者間接聯(lián)系的數(shù)據(jù),企業(yè)要知道哪些數(shù)據(jù)是對于戰(zhàn)略性的決策或者一些細(xì)節(jié)決策有幫助的,分析出來的數(shù)據(jù)結(jié)果是有價(jià)值的。
比如企業(yè)只是想了解產(chǎn)線設(shè)備的運(yùn)行狀態(tài),這時(shí)候就只需要對影響產(chǎn)線設(shè)備性能的關(guān)鍵參數(shù)進(jìn)行采集。
再比如,在產(chǎn)品售后服務(wù)環(huán)節(jié),企業(yè)需要了解產(chǎn)品使用狀態(tài)、購買群體等信息,這些數(shù)據(jù)對支撐新產(chǎn)品的研發(fā)和市場的預(yù)測都有著非常重要的價(jià)值。
因此,建議企業(yè)在進(jìn)行大數(shù)據(jù)分析規(guī)劃的時(shí)候針對一個(gè)項(xiàng)目的目標(biāo)進(jìn)行精確的分析,比較容易滿足業(yè)務(wù)的目標(biāo)。明確目標(biāo)以后,就要著手開始搜集數(shù)據(jù)并進(jìn)行預(yù)處理了。本期格物匯將跟大家介紹,企業(yè)如何實(shí)現(xiàn)對工業(yè)大數(shù)據(jù)的預(yù)處理。
數(shù)據(jù)采集
首先我們看看數(shù)據(jù)是如何獲取的,在現(xiàn)實(shí)生活中,我們所面對的問題,往往都是抽象復(fù)雜的。我們來看如下兩個(gè)例子:
如何提升產(chǎn)品的良率?
可能這是制造業(yè)最為普遍的一個(gè)問題,如果我們要分析解決這個(gè)問題,常常就會(huì)問到:什么產(chǎn)品?有多少條產(chǎn)線在生成?經(jīng)過了哪些機(jī)臺(tái)?影響產(chǎn)品良率的因素有哪些?我們可能會(huì)提出很多很多這樣的問題,解決這些問題需要對相關(guān)業(yè)務(wù)知識(shí)非常了解,盡可能多的找出與問題有關(guān)的數(shù)據(jù)。
如何進(jìn)行人臉識(shí)別?
這問題更加復(fù)雜一些,雖然我們每個(gè)人的大腦每天都在做人臉識(shí)別,但是大腦如何工作的卻異常難懂。我們可能需要做很多科研工作,去挖掘到底哪些數(shù)據(jù)會(huì)影響到人臉識(shí)別的正確率。如果這些數(shù)據(jù)本身沒有,很可能還需要進(jìn)行測量采集,比如兩眼之間的距離,嘴的寬度和長度等等。當(dāng)然,我們還會(huì)評估采集的成本,并對這些數(shù)據(jù)有效性進(jìn)行評估,驗(yàn)證我們的成本是否值得去花費(fèi)精力測量。