ceph的heartbeat设置

ceph MON会根据ceph OSD的状态报告来动态调整集群状态。

常见的设置

osd heartbeat interval

OSD每隔一段时间检查另OSD心跳,默认时间6s

osd heartbeat grace

OSD检查另OSD心跳,超过这个时间不回复就向MON报告down,默认时间20s
logo

mon osd min down reports

默认OSD要向MON报告3次另OSD down,MON才会认为另OSD down

mon osd min down reporters

默认只需要一个OSD向MON报告另OSD down的情况
logo

osd mon heartbeat interval

如果OSD无法和另OSD同步,每隔一段时间就会接受MON新的集群映射。默认时间30s
logo

mon osd report timeout

如果OSD没有给MON报告,隔这段时间MON会将OSD标记为down。默认时间900s

osd mon report interval min

OSD向MON连续报告的最小间隔时间。默认时间5s

osd mon report interval max

OSD向MON发报告的最大时间间隔。默认时间120s
logo

如何在线设置

查询心跳

1
ceph daemon /var/run/ceph/ceph-mon.ceph.asok config show | grep heart

设置相关的参数

1
ceph daemon /var/run/ceph/ceph-mon.ceph.asok config set osd_heartbeat_grace 30

如果重启集群在线设置都会丢失,要想永久设置就必须写在配置文件中。

参考文献

Heartbeat Settings