首页>梦蝶头条>智能运维大数据的终极宝典
智能运维大数据的终极宝典

作者:梦蝶云运营团队 2019-04-16 00:00:00

大数据应用 智能运维

一、什么是智能运维 ?

生产设备/装备是工业的关键生产工具,其安全性、性能对工业生产有重大影响。随之工业大数据推进,设备的智能运维被定义为一个重要的行业应用。但什么是智能运维?目前还没有一个明确的定义,但有不少提法,我们将其初略归纳为4种模式:

♦ 智能决策,如预测性维修、故障诊断等PHM、运维运作优化;

♦ 智能装备,将云端分析结果直接作用到端(如传感器偏差矫正);

♦ 新业务模式,如共享备件库存等;

♦ 结合其他新兴技术的新能力(如基于无人机的自动巡检、基于AR的协同运维)。

以用户角色为例,设备制造商与业主的动机不同。设备制造商主要从降低事故损失(角度去看,落在预测性维修等方面。业主(生产企业)主要从保证生产连续性(或提高设备OEE)的角度去看。即使在同一个生产企业内部,生产运行部的关注和设备部也有微妙差别,生产运行部更加关心生产的稳定性和连续性,而设备部则关注设备延寿、设备状态维修和维修效率。

二、大数据平台能提供什么?

智能运维一般牵涉到大批量装备的高频传感数据(机器状态、工况等)及其丰富的上下文信息(环境、运维等),属于典型的工业大数据的应用。除开数据管理平台的共性需求之外(提供动态接入、质量在线处理、时序数据压缩与索引等数据存储,以及并行化计算功能),智能运维还有不少工业设备的特有需求。

设备智能运维的一个前提就是设备的全生命周期档案,记录设备的过往今生以及不同维度的信息。这是大数据应该解决的基础问题。包括设备结构(BOM)、维修履历、故障记录、异常预警记录、工况、档案、基本信息等维度。

设备全生命周期档案,不仅仅是多个数据源Data Schema方面的关联,还包含业务语义层面的处理,包括编码间的映射关系、同义词(例如,风速在不同时期数据标准中的字段名可能不同)、字段名称相同但业务语义不同(以油气生产中的“产量”为例,井下产量、井口产量、集输产量等不同口径的“产量”,因为测量方式、测量环境、测量标准不同存在很大差别)。大数据平台在提供行业建模工具时候一定要注意业务语义层面的需求。

以设备档案数据模型为基础,大数据平台提供基于图搜索技术的语义查询模型,以友好的方式支撑设备管理分析。以风机为例,当叶片断裂事故发生后,整机制造商运维主管想查看确认是否为叶片批次问题(即和当前风机使用同一叶片厂商的风机最近机舱加速度是否正常?),有了图语义模型的支持,后台可以自动跨越多个表格进行查询(而不需要用户/应用开发者写复杂的表间关联语句),这样将大大降低应用开发的工作量。

三、智能运维大数据分析的CRAB规划方法

正如第一节讨论,不同行业、不同设备、不同角色企业的智能运维差别很大,在智能运维的实践中,我们初步归纳出CRAB三部法。在规划上,运维大数据相对质量大数据要轻松一些,因为设备运维与生产工艺的耦合度没有质量分析那么大,且设备通常有很多共性基础单元构成。

主要从以下三个方面进行分析:

(1)主导企业在产业链中的独特能力:决定了智能运维的侧重点在哪儿。

不同设备特征、不同角色的知识/信息资源程度也会决定智能运维的着力点。对于比如风力发电机、航空发动机等主力生产设备,并且生产过程也是透明的,则设备制造商可以掌握大量类似设备的数据,从而在数据技术和知识基础较业主有很大优势。但对鼓风机、机床等装备,只是生产制造设备中的一环,设备制造商即使可以掌握设备自身的状态信息,但对整个生产的工况、生产控制、工艺以及其他相关设备状态缺乏了解,设备故障预警对设备制造商来说有一定的限制。因此,在进行设备运维业务规划时候,要充分了解业务上下文(Context),决定了智能运维的侧重点在什么地方。

(2)数据资产

在了解相关IT系统(SCADA、MRO等)基础上,还应该从CPS(Cyber-Physical System)思维的角度,去审思Cyber在多大程度上反映了Physical?在哪些地方有较大差距?这就需要:

逻辑层面的融合:在了解设备的数字化程度之上,将IT系统中的数据与设备动力学机理、控制逻辑、环境、工况、生产控制等信息融合起来,去看现实世界中的例外情形。比如,MRO订单中写的保养项在大多数情形下是否忠实执行(用明确的数据记录,但不一定真实);备件需求是否存在囤货行为(永远不会有明确的数据记录,但切实影响到了备件销售量的这个数字)。

(3)行业经验与知识

对于不少问题,一线业务人员或行业专家已经有了相对清晰的认识,这时候没有必要走纯粹数据挖掘的思路。但大数据仍有很多价值,因为很多专家经验通常不够精确,大数据平台通过支持“大-小数据”迭代,快速支持行业经验在全量数据上的验证与精化。

针对典型的设备故障以及诊断的问题,大数据平台或数据分析案例库通常积累了很多故障模式、故障原因、故障因素/表征以及常用的诊断模版,但FMEA(Failure mode and effectsanalysis)、FTA(Failure Tree Analysis)经典方法对于细化一个具体设备的故障模式很有帮助。

四、总结

本文简要讨论了我们在应用KMX大数据平台实施智能运维项目中的部分经验与感想。和很多其他大数据应用一样,智能运维应从业务出发,将大数据技术融入到企业的运营与技术体系,融入的具体业务流程与环节。


下一篇 机器学习和大数据: 先有鸡还是先有蛋
联系客服,定制专属数据需求
立刻定制
需求提出

客户将目标网站、数据要求等信息提交给梦蝶云

需求评估

与客户进行仔细的需求沟通评估确认,确保双方人之一致

实施采集

与客户确认后实施采集任务

数据交付

审核完成后为客户交付完整数据