微型计算机
厂长知道机器在运转。运转多久、负载多少、为什么一个班次的产量少了30% — 这些仍是未知数。
以IT方式看待生产
工业自动化有两个极端。一端是大厂商的昂贵方案:生产管理系统、数字孪生、动辄数百万美元的集成。另一端是人工数据采集,信息零星记录,容易散失。 作为具有可观测性经验的IT专业人员,我们决定把监控服务器和应用所用的那套原则应用到生产设备上。指标从传感器采集,传到云端,在仪表盘上可视化。出现越界情况时告警到达。日志留存供分析。 生产与IT基础设施一样,都是遥测数据源。问题在于如何采集这些数据、以及拿它们做什么。
盲区
想象一个车间。五十台机器,三班倒,两百人。一部分设备是新式的,有控制器和显示屏。另一部分是机械式的,没有电子元件,是30到50年前的型号。运转数据零散汇集:有人记了点什么,有人记得住,有人口头传达了一下。 月末出了一份报表。数字在那里,却什么也解释不了。为什么一个工段总是拖后腿?为什么这台机器的零件更容易损坏?产量相同,电耗为什么在涨? 最关键的是 — 没法对比。这个工段一年前是怎么干的?上季度类似订单是怎么应付的?上次故障前的读数是什么样?没有积累的数据,这些问题就没有答案。

我们如何解决
我们把在IT中行之有效的那套原则应用到生产上:观察、日志、指标、告警。数据来源变了 — 现在是机器、传感器、控制器。 网络。 所有设备都需要联网。凡是可以布线的地方 — 铺设弱电线缆。无法拉线的地方 — 部署带4G模组的节点。每个节点自治运行:连接中断时数据在本地累积,恢复后再上传。 硬件。 带传感器的微型计算机分布在车间各处。配置随任务而定:一台微型计算机可服务多台机器,或者一台机器配置多个数据采集点。 云。 所有数据汇入同一个系统,在那里运行监控、告警与分析。计算在云上完成,资源按需租用。


车间中的设备
对于带控制器的新式机器,集成走Modbus或以太网。数据已经在机器内 — 把它取出来、汇聚到一处即可。对于没有电子元件的老机器,安装外部传感器,不触动机械部分。 带Modbus的电能表装在配电柜的DIN导轨上,实时显示电能消耗:运行模式、负载、异常。三相型号可以按每一相呈现完整图景。机壳上的MEMS加速度计跟踪振动 — 从中可以看出机构运行的变化。关键节点上的温度传感器记录偏离正常值的情况。车床和铣床上的主轴转速传感器反映运行模式。带液压或气动的机器 — 用压力传感器。油位和切削液传感器提示维护需求。循环计数器记录操作次数。



老设备
还有一件事单独说 — 没有电子元件的机器。可能是一台30到50年前的车床,从厂房建起时就一直在用;也可能是一台按传统方案装配、没有数字控制器的新机器。这样的机器可靠,更换没有意义,又难以像带控制器的新机器那样做日常的数值记录观测。 这类设备上可以安装振动传感器、油位传感器、在电源端装电能表 — 这是示例,并非完整清单。安装之后即可看到:机器在运转还是停着,是在负载下还是空转,振动是否在正常范围或出现偏离,还剩多少油。于是有了在计划检修之间持续跟踪设备状态的可能。

问题在于这台机器不做维护还能再运行多久。有了传感器,这件事就可以预测。
空气质量与通风
对一些生产场所而言,空气管控是安全问题。喷漆车间、木材加工厂、维修车间里悬浮的粉尘或蒸汽可能很关键。带Modbus或RS485接口的空气质量传感器可测量PM2.5和PM10浓度、CO2水平、挥发性有机化合物(VOC)。 这些数据进入同一个监控系统。可以配置告警:粉尘浓度超出标准时,系统通知相关负责人。可以与通风联动:CO2升高时,自动提升送风量。 类似的传感器也装在通风系统里:排风是否在运转,空气是否流动还是滞止,各级的风量是多少。这样就能实时看到工程系统的状态,在车间空气变差之前很早就察觉问题。 空气质量传感器示例
安全与管控
采集设备数据的同一套基础设施也服务于安全任务。值得明白的是:这是事件模型。每一个事件都会被记录 — 舱门打开、门关上、存在传感器被触发。即使这条信息当下并无用处,日后也可能用于事件分析或分析业务。保留看似无意义的数据。
起重设备
行车与叉车上的存在传感器。用于称重的称重传感器。用于跟踪移动的位置传感器。当人员进入危险区域时自动停机。
出入管控
带车牌识别的道闸。按权限等级对场区进行分区。记录所有车辆与人员通行。
周界管控
门与舱门的开启传感器。对技术房间的进出管控。出现未经授权的进入时发出通知。
工程系统
关键区域的漏水传感器。纳入统一监控系统的火灾探测器。管道中的压力与温度管控。
所有事件都进入同一个系统。一个仪表盘同时展示设备状态与安全事件。
云与分析
遍布企业的众多微型计算机构成的整个系统,从一个中心统一管理。可以是云,也可以是本地服务器放在企业内。 云更适合起步:无需采购和维护服务器硬件。数据以多份副本保存在不同服务器上 — 其中一台出了问题,信息依然保得住。对大多数监控任务而言,这样就够了。 在数据敏感、需要留在企业边界内的情况下,或需要脱离互联网也能做实时响应的情况下,本地服务器是有意义的。 数据采集与可视化我们使用开源工具:Prometheus用于指标,Grafana用于仪表盘,Loki用于日志。告警投递到即时消息或邮件。

数据显示原因。下一步是行动计划。
系统里可以看到每台机器的真实运转时长、停机次数与时长、能耗异常、各班次与工段的有效性、各项指标的趋势。这就可以在故障发生前安排维护:当振动开始上升,再过一定小时数就需要介入。
数据与人
当技术指标与班次及具体操作者的数据对应起来,就会多出一层分析。可以看到哪台机器在哪个班次运转、由谁负责、达到了哪些指标。 这有助于暴露系统性问题:也许问题出在夜班的物料供给物流。或者某台机器的换型准备需要更多时间。或者某一类零件一贯生产得更慢。
我们如何工作
我们先从理解任务开始:需要怎样的可观测性、企业内已有什么、希望采集哪些数据。若有弱电基础设施 — 好事,可以加快部署。若没有 — 使用4G模组或请外包团队铺设网络。 接下来 — 设计:选哪些传感器、装在哪里、如何联成一个系统。然后是部署:设备安装、软件配置、与现有流程的集成。启动之后 — 培训:演示如何使用仪表盘和告警。再就是支持:持续监控状态、升级固件、按需扩展系统。 可以先从一个工段甚至几台机器开始,看运行效果,再逐步扩展。
这适合哪些人
这样的监控是给愿意用数据工作的人准备的工具。 先要积累信息。随后 — 试着按不同维度交叉对照:按时间、按班次、按产品种类、按工段。找出趋势。再下来 — 既用日志回看,也通过与现场同事的对话,去寻找解释和解决办法。 这对于从事企业流程改进的人有帮助。对于需要事件全貌的安全主管。对于需要全生产聚合分析的管理层。对于想了解设备真实运转方式的工艺人员。 数据本身不决定什么。当大量分散的信息按维度汇合、可供分析之时 — 就产生了把猜测放在一边、基于事实做决策的可能。
讨论项目
说说您的生产 — 我们看看什么可测,能带来什么收益。