silo错误代码监控
组 | 日志类型 | 记录代码值 | 阈 | 描述 |
---|---|---|---|---|
Azure问题 | 警告或错误 | 100800 - 100899 | 任何错误或警告 | 读取或写入Azure表存储的暂时性问题将被记录为警告。暂时性读取错误将自动重试。最终的错误日志消息,表示连接到Azure表存储的确存在问题。 |
成员连接问题 | 警告或错误 | 100600 - 100699 | 任何错误或警告 | 警告日志是网络连接问题和/或silo重启/迁移的早期指示。Ping超时和silo宕机投票,将显示为警告消息。Silo厌恶它被了投宕机票,它会显示为错误消息。 |
grain调用超时 | 警告 | 100157 | 在短时间内记录多个警告 | grain调用超时问题,通常是由临时网络连接问题或silo重启/重启问题引起的。系统应在短时间后恢复(取决于Liveness配置的设置),此时应该清除超时。理想情况下,仅对大容量日志代码600157的各种警告进行监视就足够了。 |
silo重启/迁移 | 警告 | 100601或100602 | 任何警告 | 当silo检测到它在相同的机器{100602上重新启动或迁移到不同的机器(100601)时,打印警告 |
网络套接字问题 | 警告或错误 | 101000至101999,100307,100015,100016 | 任何错误或警告 | 套接字断开连接被记录为警告消息。打开套接字或在消息传输过程中出现的问题记录为错误。 |
grain问题 | 警告或错误 | 101534 | 任何错误或警告 | 检测非重入grain的“卡住”的请求。每次请求执行时间超过5x请求超时时间时,都会报告错误代码。 |