戴尔PowerEdge R320上的难以理解的极端缓慢,只能通过冷启动来解决

在该客户的网站上,有两个新的Dell PowerEdge R320服务器,具有以下configuration:

  • 一个6核CPU
  • 16 GB的RAM
  • RAID 1arrays中的2×500 GB SATA磁盘

操作系统是Windows Server 2012 R2,用作域控制器; 所有固件和驱动程序都是最新的,并且Windows已经完全修补; 系统负载通常很低。

突然之间,其中一台服务器变慢了。 而“爬”,我的意思是“它甚至不能在一个适当的时间画一个窗口”。 做任何事情,即使右键点击并显示上下文菜单,甚至移动光标 ,都是令人难以忍受的痛苦。

服务器上没有exception的负载:CPU使用率为1-3%,内存使用量低于4 GB,没有磁盘或networking高峰,完全没有。

在任何Windows事件日志中(当我们终于设法打开它时)也没有任何错误,并且当networking电缆断开连接时缓慢没有停止。

重新启动Windows也是无用的:在很长的启动时间之后,系统仍然非常缓慢。

最后但并非最不重要的是,在系统的前面板显示屏上或者在POST期间没有错误消息。

作为最后的手段,我们决定尝试冷启动,并在重新启动服务器之前切断电源线。 这就解决了这个问题:系统正常启动并恢复完整性能

然而,问题仍然存在:WTF发生在这里?!?

而且更重要的是:我们如何确保它不会再发生?

出现同样的问题,在问题出现之后检查DSET日志,然后在冷启动修复之后,戴尔支持声称电源浪涌,当时由APC 1500kVA SmartUPS供电的服务器。

戴尔支持build议使用冷启动来重置传感器(拔掉电源,按住电源button3秒钟以上)。

支持还build议通过生命周期(需要重新启动)或从Windows系统(不需要重新启动)将iDrac修补到最新的1.66.65。

发生在2015年1月的第一周几周前,问题没有回来。

ESM_Firmware_3F4WV_WN64_1.66.65_A00.EXE

Dell PowerEdge R320 6核CPU 24 GB RAM 2 x 1000 GB NLSAS磁盘RAID 1

我有2个相同的硬件,固件和驱动程序的Win2K12-R2 T320。 昨天一个变得痛苦缓慢 – 几个星期没有安装Windows更新。 在没有硬件错误的情况下运行DSET之后:

戴尔技术推荐进入T320的BIOS,进入系统configuration文件设置,并将“每瓦性能”更改为“性能”

重新启动和服务器运行速度快,性能比几个月好。

我将开始将所有固件版本升级到最新版本,包括BIOS,iDRAC / Lifecycle Controller。 这更可能是BIOS中的电源使用和性能设置的问题。 有关详细信息,请参阅Dell第12代服务器的“ 性能和功耗调优”文档。

这发生在我们的T320。 这是一个在BIOS中的错误。 戴尔发布了更新的BIOS,问题得到解决。 解决方法是按以下方式设置BIOS:在PowerEdge Bios中,将系统configuration文件更改为Performance Optimized。 这将禁用C状态和C1E。 说明: http : //www.ponjavic.com/wordpress/2014/09/30/disable-dell-poweredge-m620-cpu-throttling/