该环境由运行RabbitMQ的两台2012R2虚拟机在其队列中的高可用性(ha-all)组成。 我使用Veeam创build作为DR策略一部分的异地发送的快照备份。
我所看到的是Veeam备份发生时群集的间歇性故障。 当群集中断时,会导致loggingMnesia事件,或者有时会导致一个节点完全closures。 我相信这个问题是虚拟机如何被Veeam所掀起,在这个虚拟机暂停虚拟机一会儿,然后继续。 当这个点出现时,两个节点看到另一个消失,并且二级促进立即掌握。 两个主人一看到对方(几秒钟之后)就立即开始行动,他们碰头,集群破裂。
我在这里阅读了关于net_ticktime
,并实现了300秒,认为这将有助于使群集更加适应短Veeam点,但似乎没有帮助。 当一个节点看到另一个消失时,二级促进自己立即掌握并且似乎没有利用net_ticktime
设置。
示例Mnesia错误:
Mnesia('rabbit@Node01'): ** ERROR ** mnesia_event got {inconsistent_database, running_partitioned_network, 'rabbit@Node02'}
有没有人经历过这个或类似的东西? 使用RabbitMQ或Erlang进行额外的configuration设置是否有助于使群集更具弹性,以便节点之间的连接丢失小点?