哪些监控项目要显示给pipe理层?

我的pipe理层要求监视屏幕显示在走廊内。 他们想到销售人员在试图销售这款从未出现故障(从不承诺)的奇妙设备时所展示的精美屏幕截图。 或者我们在访问Nagio或Cacti网站时看到的那种东西(我展示了一些,他们说是的)。

我的pipe理层几乎不知道计算人员在做什么。 他们希望这对networking,服务器等有一些专业的感受,可能被视为专业。

我们有 :

  • 3台服务器(1台文件服务器,2台应用服务器)
  • 1个备份服务器
  • 1个局域网和3个网pipe交换机
  • 2条ADSL线路
  • 1个VPN连接7个小型远程站点
  • 1个Oracle数据库
  • 2个应用程序在服务器上运行
  • 还有很多小东西

我们已经使用Nagios。 他们对我们的简单观点不感兴趣,说一切都好。 我想有一些更好的想法给他们,所以他们可以告诉我他们想要这个或那个。

我想想 :

  • 显示磁盘使用情况的饼图(带部门名称)
  • 显示文件服务器上的磁盘I / O
  • 一张图显示交换机上的networking吞吐量
  • 显示Oracle吞吐量的图表或其他相关信息
  • VPN的天气图

任何更好的想法?

有趣的问题。 以前我不得不提出类似的仪表板,但除了技术pipe理之外,从来不需要做任何事情。 您正在寻找的显示器types可能需要自定义代码来显示您使用的任何监视系统的信息。 一些系统(我现在正在考虑Zenoss)有足够的可定制性来构build内部的东西,但是为了真正的波兰语,您将重新呈现您已经收集的数据。

那些高层pipe理人员正在寻找一个可以钻空子的大局。 您显示的项目应该是最重要的项目。 不知道你的应用程序,我可能会在仪表板上放置以下内容:

  • networking连接的networking吞吐量(图表或拨号)
  • 显示Oracle数据库加载的图表。 我意识到这是一个复杂的事情发现,但find一些代理和显示它。
  • 某种types的整体磁盘空间显示。 如果它经常变化足够的图表,或者如果它不是一个简单的温度计。
    • 如果他们担心的话,他们关心的每个组织单位的图表; 可能很难得到。
    • 如果您使用的是共享存储,则显示磁盘arrays上未分配空间的图表会随着时间的推移而变化。 这些都是大预算项目,所以值得跟踪。
  • 应用程序级别状态:应用程序已启动,处于降级但function正常的状态,还是已closures?
  • 应用程序服务器加载。

除非真的需要,否则我实际上是避开了VPN热图。 这对信息密度非常有用,它本身可以成为一个目标,但是我不认为它将有意义的信息传达给它们的层面。

同样,交换机的吞吐量,除非你真的担心背板带宽。 如果他们想要美丽的信息,就去做吧。 但是,如果他们想要的有用,我只会添加它,如果有剩余的空间在显示器上。

磁盘I / O可能是出于政治原因的一个好主意(I / O中的备份非常昂贵,我们不需要更多的部件),或者密度很高,但是不是我向高层提出的。

有趣的问题(抱歉,我在这里的晚会有点晚,但嘿,这是ServerFault和互联网的喜悦 – 这是现在这里的后代)。

我认为正确的答案是将“展示”和“去”结合起来。 即使它们不是技术性的,在仪表盘中出现的某些内容和逻辑也会给人留下好印象。 您可以采集数据并以任何数量的视觉吸引人的方式(图表,图表等)呈现。

我只写了一个非供应商特定的关于一般称为“系统监视的艺术”的监视主题 。 不pipe系统/应用程序如何,都要详细了解要监视的内容。

简而言之,思考什么是有用的方法(非技术性的pipe理层会意识到这一点)是将系统分层分解,为每一层提出一个或两个度量标准 – 几个关键的应用程序度量标准,stream程统计信息,服务器统计信息,networking统计信息等等。 哪些数据是相关的取决于你的应用程序在做什么(他们是networking服务器?networking繁重?磁盘繁重?)。

还要考虑到,不仅要监控“坏事”,还要“缺乏好东西” – 关于Google系统监控方面的老传说,通过监控“AdWords $ /秒”,您将能够很好地了解整个系统。 所以要弄清楚你的版本是否包含在仪表板中。

希望这是对任何未来的人都在这个答案绊脚石思考有益的食物。