我们有大约20个主机连接到从Ubuntu服务器运行的NFS共享。 有一天他们都失去了联系。 我们已经重新启动NFS服务器,以排除任何有趣的服务。
当试图连接到挂载,这是来自Ubuntu端syslog的日志,看起来很好:
May 14 16:23:26 nas1 snmpd[2351]: Connection from UDP: [192.168.99.51]:36999->[192.168.99.41] May 14 16:23:45 nas1 rpc.mountd[1863]: authenticated mount request from 192.168.30.1:604 for /data/nfs (/data/nfs)
这是来自ESX服务器上的vmkernel.log的日志:
2013-05-14T15:29:25.882Z cpu6:9124)NFS: 157: Command: (mount) Server: (nas1.4d.wirehive.int) IP: (192.168.30.51) Path: (/data/nfs) Label: (NFS) Options: (None) 2013-05-14T15:29:25.882Z cpu6:9124)StorageApdHandler: 692: APD Handle b4215f5c-3ba55d8f Created with lock[StorageApd0x41001d] 2013-05-14T15:29:25.887Z cpu6:9124)NFS: 1236: NFS FSINFO failed with NFS status 70 (Invalid handle) on Server (192.168.30.51) Path (/data/nfs) 2013-05-14T15:29:25.887Z cpu6:9124)StorageApdHandler: 739: Freeing APD Handle [b4215f5c-3ba55d8f] 2013-05-14T15:29:25.887Z cpu6:9124)StorageApdHandler: 802: APD Handle freed! 2013-05-14T15:29:25.887Z cpu6:9124)NFS: 218: NFS mount nas1.4d.int:/data/nfs status: Unable to query remote mount point's attributes
看起来问题始于:
NFS FSINFO failed with NFS status 70
这是什么意思? 我可以提供任何所需的日志。
每当遇到ESXi的NFS问题时,我都可以通过这篇知识库文章工作: http : //kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1003967
$ vmkping - I
是非常好的,因为你可以隔离你想使用的vmkernel
。
另外,如果运行ESXi 4.x或更高版本, nc
(又名.netcat)非常适合确保没有防火墙问题。
对于你来说,试试像这样:
$ nc -z 192.168.30.51 2049