五一将至,忙碌的人们终于盼来了假期。网管阿服在公司已经干了很多年了,任劳任怨,今年假期又是他值班。办公室内寂寞的他环顾四周,空荡荡的一片,暗想何时自己才能出去透透气,享受一下假期。
正如阿服一样,很多网管在放假期间还要加班值守服务器,以提供假期间的网络服务。那么我们一定要坐守服务器前吗?一定要驻扎在空无一人的机房中吗?作为一个辛勤的员工,网管就没有假期吗?别急,我们有办法让你在假期,既能离开机房监守服务器,又能自由享受生活。
不可忽视 放假前的硬件维护
既然不用呆在机房,那么走之前,我们还得仔细检查一番。要知道,长假期间最怕服务器、机房出现故障。
服务器软件和程序的运行存在着很多不确定因素,我们不可能对出故障的时间进行判断,但是就硬件方面来说,我们可以通过多种维护手段将故障发生率大大降低。
●打扫卫生
我们在忙碌地打扫自家卫生的同时也要对服务器及网络路由交换设备所在的机房进行整理,因为好的卫生条件是网络设备正常运行的基础。
如何打扫卫生呢?首先是选择时间段,公司业务是24小时的,应该尽量避免关闭设备电源、暂停服务等,要选择人少、流量少的时间。打扫卫生时关闭设备电源,防止灰尘进入设备造成静电和短路,要为每个设备盖上防尘布。打扫卫生过程中要保证足够的湿度,防止尘土飞扬。
●设备进柜
设备乱放、随意走线不利于故障的排除。因此在假期来临的时候首先要把机房中的设备放入机柜,将机柜门关好,所有网线都在地板下走线,不要有明线。如果必须保留一部分线缆在外,应尽可能地缩短距离或沿墙面、拐角等不明显的地方走线。干净整洁的机房对于网管排查故障是非常有利的(图1),网管在远端获悉服务器出问题而赶回机房后也能立刻着手解决问题。
图1
●散热与电源
检查各个服务器的散热设备,包括服务器自身的风扇,以及机柜顶部的散热风扇转动是否正常(图2)。对机房中的空调等设备进行检查,笔者所在机房就出现过一次因为空调损坏而温度高达42℃,从而造成核心交换机死机。
图2
接下来对电源进行检查,保证设备的24小时电力供应正常。停电会造成关键设备损坏、主要服务终止、重要数据丢失等问题。应该主要检查各个设备的电源是否正常、接线板工作是否正常、UPS设备是否正常,对UPS设备的检查尤其重要。
●其他方面
还有很多因素需要注意,如要将路由和交换设备的配置信息做好保存,防止掉电后信息全部丢失。还要注意其他部门的工作安排,及时和他们进行沟通。笔者就遇到过工程部门利用假期施工,结果弄断线缆,施工中渗水将服务器泡坏。另外一些传统的安全防范措施也是不可少的,例如防止偷盗以及消防工作。