云平台问题及修复记录
编号 | 问题 | 原因 | 处理方案 | 状态 | 处理人 | 创建时间 |
---|---|---|---|---|---|---|
1 | 节点服务器CPU负载过高 | NFS4.0版本在大量IO时引起的问题, 表现为CPU负载过高,但CPU占用率低, POD无法正常启动. | 降低NFS版本为3.0 | D | 张海陆 | 2022-09-15 |
2 | MySQL节点或Operator状态异常 | 猜测:MySQL压力增大的情况下,节点数据同步未及时完成 | N | 2022-09-15 | ||
3 | MySQL集群节点无法恢复,提示binlog异常 | 尝试重新创建operator/pvc等仍无法解决 | N | 2022-09-26 | ||
4 | Redis,Kafka压测性能低 | NFS4引起的问题,占用过多网络带宽,影响中间件性能. | 配置PVCmountOptions: nfsvers=3后,网卡占用大幅下降 | D | 张海陆 | 2022-09-29 |
5 | 集群服务器全部重启后redis无法正常恢复 | Redis集群节点信息使用nodes.conf进行存储配置,集群重启后,redis pod ip发生变化,与nodes.conf中数据不一致. | 清除redis相关pvc,重新创建redis集群 | D | 张海陆 | 2022-09-29 |
*状态:A—新增,D—已解决,N-暂无方案