實(shí)現工業(yè)4.0,需要高度的工業(yè)化、自動(dòng)化基礎,是漫長(cháng)的征程。工業(yè)大數據是未來(lái)工業(yè)在全球市場(chǎng)競爭中發(fā)揮優(yōu)勢的關(guān)鍵。無(wú)論是德國工業(yè)4.0、美國工業(yè)互聯(lián)網(wǎng)還是《中國制造2025》,各國制造業(yè)全新戰略的實(shí)施基礎都是工業(yè)大數據的搜集和特征分析,及以此為未來(lái)制造系統搭建的無(wú)憂(yōu)環(huán)境。不論智能制造發(fā)展到何種程度,數據采集都是生產(chǎn)中實(shí)際的需求,也是工業(yè)4.0的先決條件。
數字化工廠(chǎng)不等于無(wú)人工廠(chǎng),產(chǎn)品配置,制造流程越復雜越多變,越需要人的參與;在數字化工廠(chǎng)當中,工人更多地是處理異常情況,調整設備。但數據采集一直是困擾著(zhù)所有制造工廠(chǎng)的傳統痛點(diǎn),自動(dòng)化設備品牌類(lèi)型繁多,廠(chǎng)家和數據接口各異,國外廠(chǎng)家本地支持有限,不同采購年代。即便產(chǎn)量停機數據自動(dòng)采集了,也不等于整個(gè)制造過(guò)程數據都獲得了,只要還有其他人工參與環(huán)節,這些數據就不完整。
工業(yè)數據采集類(lèi)型
互聯(lián)網(wǎng)的數據主要來(lái)自于互聯(lián)網(wǎng)用戶(hù)和服務(wù)器等網(wǎng)絡(luò )設備,主要是大量的文本數據、社交數據以及多媒體數據等,而工業(yè)數據主要來(lái)源于機器設備數據、工業(yè)信息化數據和產(chǎn)業(yè)鏈相關(guān)數據。
從數據采集的類(lèi)型上看,不僅要涵蓋基礎的數據,還將逐步包括半結構化的用戶(hù)行為數據,網(wǎng)狀的社交關(guān)系數據,文本或音頻類(lèi)型的用戶(hù)意見(jiàn)和反饋數據,設備和傳感器采集的周期性數據,網(wǎng)絡(luò )爬蟲(chóng)獲取的互聯(lián)網(wǎng)數據,以及未來(lái)越來(lái)越多有潛在意義的各類(lèi)數據。主要包括以下幾種:
1、海量的Key-Value數據。在傳感器技術(shù)飛速發(fā)展的今天,包括光電、熱敏、氣敏、力敏、磁敏、聲敏、濕敏等不同類(lèi)別的工業(yè)傳感器在現場(chǎng)得到了大量應用,而且很多時(shí)候機器設備的數據大概要到ms的精度才能分析海量的工業(yè)數據,因此,這部分數據的特點(diǎn)是每條數據內容很少,但是頻率極高。
2、文檔數據。包括工程圖紙、仿真數據、設計的CAD圖紙等,還有大量的傳統工程文檔。
3、信息化數據。由工業(yè)信息系統產(chǎn)生的數據,一般是通過(guò)數據庫形式存儲的,這部分數據是好采集的。
4、接口數據。由已經(jīng)建成的工業(yè)自動(dòng)化或信息系統提供的接口類(lèi)型的數據,包括txt格式、JSON格式、XML格式等。
5、視頻數據。工業(yè)現場(chǎng)會(huì )有大量的視頻監控設備,這些設備會(huì )產(chǎn)生大量的視頻數據。
6、圖像數據。包括工業(yè)現場(chǎng)各類(lèi)圖像設備拍攝的圖片(例如,巡檢人員用手持設備拍攝的設備、環(huán)境信息圖片)。
7、音頻數據。包括語(yǔ)音及聲音信息(例如,操作人員的通話(huà)、設備運轉的音量等)。
8、其他數據。例如遙感遙測信息、三維高程信息等等。
數據采集的方法
傳統的數據采集方法包括人工錄入、調查問(wèn)卷、電話(huà)隨訪(fǎng)等方式,大數據時(shí)代到來(lái)后,一個(gè)突出的變化是數據采集的方法有了質(zhì)的飛躍,下面所介紹的數據采集方式的突破直接改變著(zhù)大數據應用的場(chǎng)景。
1、傳感器
傳感器是一種檢測裝置,能感受到被測量的信息,并能將檢測感受到的信息,按一定規律變換成為電信號或其他所需形式的信息輸出,以滿(mǎn)足信息的傳輸、處理、存儲、顯示、記錄和控制等要求。在生產(chǎn)車(chē)間中一般存在許多的傳感節點(diǎn),24小時(shí)監控著(zhù)整個(gè)生產(chǎn)過(guò)程,當發(fā)現異常時(shí)可迅速反饋至上位機,可以算得上是數據采集的感官接受系統,屬于數據采集的底層環(huán)節。
傳感器在采集數據的過(guò)程中主要特性是其輸入與輸出的關(guān)系。
其靜態(tài)特性反映了傳感器在被測量各個(gè)值處于穩定狀態(tài)時(shí)的輸入和輸出關(guān)系,這意味著(zhù)當輸入為常量,或變化極慢時(shí),這一關(guān)系就稱(chēng)為靜態(tài)特性。我們總是希望傳感器的輸入與輸出成的對照關(guān)系,是線(xiàn)性關(guān)系。
一般情況下,輸入與輸出不會(huì )符合所要求的線(xiàn)性關(guān)系,同時(shí)由于存在這遲滯、蠕變等因素的影響,使輸入輸出關(guān)系的唯(一)性也不能實(shí)現。因此我們不能忽視工廠(chǎng)中的外界影響,其影響程度取決于傳感器本身,可通過(guò)傳感器本身的改善加以抑制,有時(shí)也可以加對外界條件加以限制。
2、RFID技術(shù)
RFID(Radio Frequency Identification,射頻識別)技術(shù)是一種非接觸式的自動(dòng)識別技術(shù),通過(guò)射頻信號自動(dòng)識別目標對象并獲取相關(guān)的數據信息。利用射頻方式進(jìn)行非接觸雙向通信,達到識別目的并交換數據。RFID技術(shù)可識別高速運動(dòng)物體并可同時(shí)識別多個(gè)標簽,操作快捷方便。
在工作時(shí),RFID讀寫(xiě)器通過(guò)天線(xiàn)發(fā)送出一定頻率的脈沖信號,當RFID標簽進(jìn)入磁場(chǎng)時(shí),憑借感應電流所獲得的能量發(fā)送出存儲在芯片中的產(chǎn)品信息(Passive Tag,無(wú)源標簽或被動(dòng)標簽),或者主動(dòng)發(fā)送某一頻率的信號(Active Tag,有源標簽或主動(dòng)標簽)。
閱讀器對接收的信號進(jìn)行解調和解碼然后送到后臺主系統進(jìn)行相關(guān)處理;主系統根據邏輯運算判斷該卡的合法性,針對不同的設定做出相應的處理和控制,發(fā)出指令信號控制執行機構動(dòng)作。
RFID技術(shù)解決了物品信息與互聯(lián)網(wǎng)實(shí)現自動(dòng)連接的問(wèn)題,結合后續的大數據挖掘工作,能發(fā)揮其強大的威力。
數據采集技術(shù)難點(diǎn)
在當今的制造業(yè)領(lǐng)域,數據采集是一個(gè)難點(diǎn)。很多企業(yè)的生產(chǎn)數據采集主要依靠傳統的手工作業(yè)方式,采集過(guò)程中容易出現人為的記錄錯誤且效率低下。
有些企業(yè)雖然引進(jìn)了相關(guān)技術(shù)手段,并且應用了數據采集系統,但是由于系統本身的原因以及企業(yè)沒(méi)有選擇適合自己的數據采集系統,因此也無(wú)法實(shí)現信息采集的實(shí)時(shí)性、準確性和延伸性管理,各單元出現了信息斷層的現象。
技術(shù)難點(diǎn)主要包括以下幾方面:
1、數據量巨大。任何系統,在不同的數據量面前,需要的技術(shù)難度都是完全不同的。
如果單純是將數據采到,可能還比較好完成,但采集之后還需要處理,因為必須考慮數據的規范與清洗,因為大量的工業(yè)數據是“臟”數據,直接存儲無(wú)法用于分析,在存儲之前,必須進(jìn)行處理,對海量的數據進(jìn)行處理,從技術(shù)上又提高了難度。
2、工業(yè)數據的協(xié)議不標準。互聯(lián)網(wǎng)數據采集一般都是我們常見(jiàn)的HTTP等協(xié)議,但在工業(yè)領(lǐng)域,會(huì )出現ModBus、OPC、CAN、ControlNet、DeviceNet、Profibus、Zigbee等等各類(lèi)型的工業(yè)協(xié)議,而且各個(gè)自動(dòng)化設備生產(chǎn)及集成商還會(huì )自己開(kāi)發(fā)各種私有的工業(yè)協(xié)議,導致在工業(yè)協(xié)議的互聯(lián)互通上,出現了極大地難度。
很多開(kāi)發(fā)人員在工業(yè)現場(chǎng)實(shí)施綜合自動(dòng)化等項目時(shí),遇到的問(wèn)題及時(shí)面對眾多的工業(yè)協(xié)議,無(wú)法有效的進(jìn)行解析和采集。
3、視頻傳輸所需帶寬巨大。傳統工業(yè)信息化由于都是在現場(chǎng)進(jìn)行數據采集,視頻數據傳輸主要在局域網(wǎng)中進(jìn)行,因此,帶寬不是主要的問(wèn)題。
但隨著(zhù)云計算技術(shù)的普及及公有云的興起,大數據需要大量的計算資源和存儲資源,因此工業(yè)數據逐步遷移到公有云已經(jīng)是大勢所趨了。但是,一個(gè)工業(yè)企業(yè)可能會(huì )有幾十路視頻,成規模的企業(yè)會(huì )有上百路視頻,這么大量的視頻文件如何通過(guò)互聯(lián)網(wǎng)順暢到傳輸到云端,是開(kāi)發(fā)人員需要面臨的巨大挑戰。
4、對原有系統的采集難度大。在工業(yè)企業(yè)實(shí)施大數據項目時(shí),數據采集往往不是針對傳感器或者PLC,而是采集已經(jīng)完成部屬的自動(dòng)化系統上位機數據。
這些自動(dòng)化系統在部署時(shí)廠(chǎng)商水平參差不齊,大部分系統是沒(méi)有數據接口的,文檔也大量缺失,大量的現場(chǎng)系統沒(méi)有點(diǎn)表等基礎設置數據,使得對于這部分數據采集的難度極大。
5、穩定性考慮不足。原先的工業(yè)系統都是運行在局域網(wǎng)中,穩定問(wèn)題不是突出考慮的重點(diǎn)。
一旦需要通過(guò)云端調度工業(yè)之中核心的生產(chǎn)能力,又沒(méi)有對穩定的充分考慮,造成損失,是難以彌補的。2015年,受網(wǎng)絡(luò )穩定事件影響的工業(yè)企業(yè)占比達到30%,因病毒造成停機的企業(yè)高達20%。僅美國國土穩定部的工業(yè)控制系統網(wǎng)絡(luò )應急響應小組(ICS-CERT)就收到了295起針對關(guān)鍵基礎設施的攻擊事件。