0%

ceph 问题列表

问题列表

Ceph升级(L to N)引发的问题

问题ID 1
问题出现版本 pre-14.2.3
问题现象
POOLS:
POOL ID STORED OBJECTS USED %USED MAX AVAIL
data 0 63 TiB 44.59M 63 TiB 30.21 48 TiB

but when one OSD was updated it changed to
POOLS:
POOL ID STORED OBJECTS USED %USED MAX AVAIL
data 0 558 GiB 43.50M
1.7 TiB 1.22 45 TiB
问题触发条件 1、从nautilus之前的集群进行了升级
2、然后,您提供一个或多个新的BlueStore OSD,或在升级的OSD上运行“ceph-bluestore-tool repair”。
问题原因 根本原因是,从Nautilus开始,BlueStore维护了每个池的使用情况统计信息,但是它需要对磁盘上的格式进行少量更改。
除非您运行ceph-bluestore-tool修复,否则升级后的OSD不会拥有新的统计信息。
问题在于,一旦* any * OSD报告了er-pool统计信息,mon就开始使用新的统计信息(而不是等到* all * OSD都在这样做)。
问题解决办法 为避免此问题,可以
1、升级后不要置备新的BlueStore OSD
2、更新所有OSD,以保留新的每个池统计信息。现有的BlueStore OSD可以通过以下方式转换:
systemctl stop ceph-osd@$N
ceph-bluestore-tool repair –path /var/lib/ceph/osd/ceph-$N
systemctl start ceph-osd@$N
请注意,FileStore根本不支持新版每个池统计信息,因此,如果集群中有文FileStore OSD,则没有解决方法。无需将文件存储OSD替换为bluestore。
修复程序[1]正在通过QA检查,将在14.2.3中出现; 它不会在14.2.2完整发布。
ceph-users地址 http://lists.ceph.com/pipermail/ceph-users-ceph.com/2019-July/035889.html
https://github.com/ceph/ceph/pull/28978
https://tracker.ceph.com/versions/574
备注
实践修复
问题修复版本(社区计划) 14.2.3
问题ID 2
问题出现版本 14.2.2
问题现象 Legacy BlueStore stats reporting detected on 6 OSD(s)
问题触发条件 1、从nautilus之前的集群进行了升级
问题原因
问题解决办法 systemctl stop ceph-osd@$OSDID
ceph-bluestore-tool repair –path /var/lib/ceph/osd/ceph-$OSDID
systemctl start ceph-osd@$OSDID
ceph-users地址 http://lists.ceph.com/pipermail/ceph-users-ceph.com/2019-July/036010.html
备注 可以静默告警 bluestore warn on legacy statfs = false
实践修复 [root@ceph1 ~]# systemctl stop ceph-osd@1.service
[root@ceph1 ~]# ceph-bluestore-tool repair –path /var/lib/ceph/osd/ceph-1/
2019-10-14 15:39:53.940 7f87c8114f80 -1 bluestore(/var/lib/ceph/osd/ceph-1) fsck error: legacy statfs record found, removing
2019-10-14 15:39:53.940 7f87c8114f80 -1 bluestore(/var/lib/ceph/osd/ceph-1) fsck error: missing Pool StatFS record for pool 2
2019-10-14 15:39:53.940 7f87c8114f80 -1 bluestore(/var/lib/ceph/osd/ceph-1) fsck error: missing Pool StatFS record for pool ffffffffffffffff
repair success
[root@ceph1 ~]# systemctl start ceph-osd@1.service
问题修复版本(社区计划)
问题ID 3
问题出现版本 14.2.2
问题现象 Legacy BlueStore stats reporting detected on 6 OSD(s)
问题触发条件 1、从nautilus之前的集群进行了升级
问题原因
问题解决办法 systemctl stop ceph-osd@$OSDID
ceph-bluestore-tool repair –path /var/lib/ceph/osd/ceph-$OSDID
systemctl start ceph-osd@$OSDID
ceph-users地址 http://lists.ceph.com/pipermail/ceph-users-ceph.com/2019-July/036002.html
备注 可以静默告警 bluestore warn on legacy statfs = false
实践修复
问题修复版本(社区计划)
问题ID 4
问题出现版本 14.2.4
问题现象 3 monitors have not enabled msgr2告警
问题触发条件 1、从nautilus之前的集群进行了升级
问题原因 messenger v2 protocol(msgr2)是Ceph’s on-wire protocol第二次主要修订。
问题解决办法 ceph mon enable-msgr2
systemctl restart ceph-mon@ceph1.service
ceph-users地址
备注
实践修复 ceph mon enable-msgr2
systemctl restart ceph-mon@ceph1.service
问题修复版本(社区计划)
问题ID 5
问题出现版本
问题现象
问题触发条件
问题原因
问题解决办法
ceph-users地址
备注
实践修复
问题修复版本(社区计划)
问题ID
问题出现版本
问题现象
问题触发条件
问题原因
问题解决办法
ceph-users地址
备注
实践修复
问题修复版本(社区计划)
问题ID
问题出现版本
问题现象
问题触发条件
问题原因
问题解决办法
ceph-users地址
备注
实践修复
问题修复版本(社区计划)