DNS失败通过重新启动lighttpd解决?

我有一个运行相当繁忙的网站2年的这个networking服务器的设置:

  • ec2 / Amazon Linux AMI 2014.03.2在微型实例上
  • lighttpd(最新)
  • godaddy dns

今天早上,该网站被closures – DNS失败。 我能够通过IP地址和ec2公共地址访问站点,但不能访问域名。 我之前曾经有过一次或两次出现过godaddy的DNS中断,但是这个很奇怪:

  • pingdom在一个小时之前就提到了DNS问题,但是以为我们已经起来了。
  • downforeveryoneorjustme.com认为我们起床了
  • 浏览器认为我们失望了。

我想这不是太奇怪:我知道DNS问题并不总是全球性的。 这是奇怪的部分:重新启动lighttpd修复了这个问题。

我想采取行动来帮助解决这个问题,但是我对这个问题还不太清楚,我甚至不知道下一个步骤,或者search什么。 服务器如何重新启动会影响DNS问题?

更新在重新启动和问题被修复之间的时机是非常完美的,我没有预料到人们会巧合。 但实际上这个问题大概在一个小时后才回来,我又用lighttpd反弹来修复它。 我知道这听起来很疯狂!

由于caching机制,DNS问题很难弄清楚。 如果相应的RR(资源logging,请参阅RFC1035第3.2节 )被caching在某处,它仍然有效,直到它到期,即使该RR的权威服务器失败。

Web服务器的重新启动首先让我想到一个虚拟主机问题,但是您可以通过使用IP来访问网站。

接下来的诊断步骤应该使用DNS特定的工具(例如dig +trace选项)和常用的路由诊断工具(ping,traceroute)

对我来说,这听起来像是DNS提供商的问题。 也许在某些路由器或DNS服务器中有错误的DNS条目。 而且他们在同一时刻更新,因为你重新启动lighttpd …或者你误解了错误信息,但我不这么认为;)