HiveMQ健康API现在提供了对HiveMQ平台健康状况的全面洞察。它不仅为每个HiveMQ集群中的节点提供了准备状态和存活状态的REST API资源,还包含了每个已安装的HiveMQ扩展的详细状态和健康信息。此项增强允许对HiveMQ MQTT Broker及其扩展进行全面监控。站点可靠性工程师(SRE)可以利用这些数据主动监控平台健康,迅速识别和解决问题,保持最大正常运行时间。
健康API是什么,它能做什么?
HiveMQ平台是我们客户物联网部署的核心组件。我们的客户依赖HiveMQ平台来实现各种用例,如智能制造中的预测性维护、能源领域的关键基础设施监控或运输和物流中的高价值资产跟踪。
由于HiveMQ平台是支持这些用例的复杂物联网部署的核心,我们的客户需要能够监控其健康状况。他们需要访问关于HiveMQ Broker组件和已安装平台扩展的操作信息,以确保一切顺利运行。
我们在4.14版本中发布了健康API。该API为每个HiveMQ集群中的节点提供了存活和准备状态检查。这些检查帮助您快速、准确地识别每个HiveMQ节点的精确状态,并确定集群的整体状态。
- 存活检查告诉您您的Broker是否在运行并响应。
- 准备检查告诉您HiveMQ Broker的MQTT组件是否准备好接收流量。
这些信息以结构良好的格式呈现,帮助您快速识别Broker或其组件中的任何问题,确保您的HiveMQ部署顺利运行。
健康API对SRE有何价值?
HiveMQ集群部署在各种环境中,从本地数据中心到AWS、Azure或GCP等托管云服务。保持卓越的集群可用性对于确保物联网部署的顺利运行至关重要。
存活和准备状态检查共同提供了一种验证MQTT集群健康状况的方法,确保流量仅路由到准备好并能够处理它的组件。
健康检查返回的HTTP状态代码显示了集群中每个节点的当前状态。
- 状态码200表示节点可以接受MQTT流量。
- 状态码503表示节点当前不可用。
每个健康检查响应还以人类可读的JSON格式提供附加信息,以获得更深入的洞察:
- HiveMQ Broker和HiveMQ MQTT监听器的状态信息——MQTT监听器指定了HiveMQ接受来自MQTT客户端的传入连接的IP地址和端口。
站点可靠性工程师(SRE)可以使用此API来监控HiveMQ平台的健康状况。他们可以利用这些深入的信息迅速检测到任何问题,并构建自愈系统,以确保尽可能高的可用性。
健康API有哪些新功能?
在4.28版本中,健康API的功能扩展,包含了一个子组件部分,提供了您HiveMQ集群中每个企业扩展的关键状态和健康细节。
状态部分提供了关于任何已安装扩展的当前状态的关键信息,包括企业或自定义扩展。在这里,您可以查看扩展是否“UP”(正常)、“DEGRADED”(降级)或“DOWN”(停机),以及其启动时间、许可证信息和配置摘要。
让我们以Kafka的企业扩展为例。
监控Kafka企业扩展的健康状况
以下JSON块显示了HiveMQ Kafka企业扩展的状态。
json复制代码{
"author": "HiveMQ",
"status": "enabled",
"name": "HiveMQ Enterprise Extension for Kafka",
"priority": 1,
"startTime": 1714053790016,
"version": "4.28",
"internals": {
"license": "...",
"entryPoint": "...",
"services": [...]
},
"application": {
"configuration": "..."
}
}
上面部分提供了有关扩展的一般信息,如:
- 扩展的作者:HiveMQ
- 扩展状态:已启用
- 扩展名称:HiveMQ Kafka企业扩展
- 扩展加载优先级:1(最高优先级扩展先加载)
- 扩展启动时间(以纪元时间表示):1714053790016
- HiveMQ平台版本:4.28
内部子组件提供了关于扩展的更多细节,包括许可证、入口点和服务,而应用子组件总结了扩展的配置。每个健康API的组件都可以通过一个URL检索。
回复