设备在线不等于可运维
很多 IoT 项目第一阶段只关注设备能不能发数据,真正上线后才发现离线判断、重复告警、历史补传和权限隔离没有设计好。
重点问题
- 心跳周期与离线阈值要按设备类型配置,不宜全局统一。
- 弱网环境下需要缓存补传,并标记真实采集时间。
- 告警要去重、升级和关闭,避免消息轰炸。
- 设备证书、Topic 权限和数据隔离要提前设计。
- 远程配置和 OTA 要留审计记录,防止误操作。
落地建议
把设备运维看作产品功能,而不是后台附属能力。上线后最常用的页面往往不是炫酷大屏,而是设备列表、异常记录和日志检索。