疯狂的想法:确定系统是否空闲,当它是一个黑匣子

我需要能够判断一系列服务器上是否有任何活动的服务器,如果没有,则自动closures它们(closures虚拟机)。 这不是一个简单的任务,因为我有1000多个服务器实例,包括各种操作系统(Win,Unix,Linux)和许多不同types的configuration。 这使得安装正常运行时间代理的盒子是非平凡的。 另外,因为用户是pipe理员,我不能确保我安装的工具不会被篡改。

所以我的想法是将每个服务器视为一个黑盒子,并使用服务器外部的统计信息来决定是否有活动:

  • 监视所有服务器的磁盘和CPU活动。
  • 如果磁盘写入和CPU活动在1小时内降至零,则假定系统处于空闲状态并将其closures。

如果我有90%的准确度,我不在乎closures更多的机器。 上述黑匣子是工作还是不可靠? 什么黑匣子指标会更合适?

服务器问题集锦,包括 Linux(Ubuntu, Centos,Debian等)和Windows Server服务器.