| 個人檔案小江的魔法树屋相片部落格清單 | 說明 |
|
7 February 菜鸟网管被小小水晶头难倒的经过 虽然连考几次网工都没过(网工:网络工程师,相当于中级职称资格),但出来混了一年半,怎么也算小有经验,但年前被一个极其寻常的网络故障难倒了。
说来实在丢人,故障点其实相当地简单,查障和排障的方法其实简单得不能再简单,却被我搞得一波三折。小故障反应大问题啊,我火候果然还差远了。今天把过程描述如下,与网上各位路过的网管共享——欢迎转载,不过记得注明犯错的猪头是“小江”即可,(更丢人了……)
故事是这样发生滴:
那天被终端组的小王一顿急CALL,硬是放下手头上的活,蹭蹭蹭地蹿去五楼排障——运维部新来了个大大领导,大到我们那栋楼他差不多是拿最大份工资的那种,好死不死,大大领导新办公室的网络出问题了。
常见的网络故障中,“不通”反而是比较好定位故障点的,最痛苦的是“通一点又不通一点”那种半死不活的状态。大大领导的网络是通的,到哪里都通,但就是巨慢无比,同一个办公室,接在同一个HUB下的其它电脑都顺畅无比,爱咋咋地,这不明摆着“新来新猪肉”,不给新领导面子嘛!
可怜的小王同志,担负着给新领导装电脑的重任,之前折腾了一整天,硬是啥也折腾不出来,于是那天把我也拉上当垫背的了。
计算机网络管理中最重要的命令是什么?——ping!!!!拼命的“拼”啊!
按常规的做法,先PING同局域网同网段的电脑,也就是同一个办公室、共用一个HUB的电脑——通!再PING网关——通!PING网关外的服务器——通!PING大包(汗、我老是忘PING大包的命令是什么)——大包也通,且TTL(time to live)正常且稳定。
初步断定网络是通的,问题是慢,为了证明是到局域网外慢还是内部网本身就慢,我在办公室另一台电脑上做了共享,然后分别用领导的机子和另一台测试下载。60M的文件,人家噌一下就下完了,领导的机子半天没反应。
既然内网都那么悲惨了,跟路由器甚至交换机都没有关系了——故障点定位在HUB到终端一段,与ISO三层(网络层)及其以上无关。“老鼠”就在这间办公室里!
做这步定位时整得我惨兮兮的——发现做终端维护的同事很迷信,动不动就喜欢说IP有问题,要求换一个IP试试。天!IP这种东西多么单纯而朴实啊,192.168.1.133和192.168.1.134能有什么区别啊!为无辜的IP哀悼~~~~
故障点可能有三:
其一,网卡坏了。但一般网卡坏了,不会显示“网络已连接”,就算能PING通,也应该多少有些丢包现象。网卡坏的可能性比较小。
其二,系统中毒了。新领导用的是新机子,刚装的系统,如果这样一接上网就中毒,我们的内部局域网也太弱了,我跟师父非被扣工资扣到死不可。
其三,HUB口到终端的网络——最后一段接入网有问题。曾经让小王试着换了N个HUB口,问题依旧。
其实“其三”让我算对了,但我万万没有想到自己会栽在小小的水晶头上!!!我算到了HUB,却没有算到网线这个最最基本的东东!!!我以为水晶头质量不好、网线跟强电走在一起被辐射干扰、用错六类线或五类线之类的物理层上的故障,通常只有在“网络医院”之类的网管大牛写的文章里才会见到——盲点!
为了进一步把故障定位范围缩小,我决定分两方面查,一方面查网络,一方面查终端。因为笃信终端出问题的可能性比较大,先让小王同志千方百计找来手提,想用替换法测试——别的电脑要是能用,就说明问题出在大大领导的电脑上了——结果我被手提玩死。
借来第一台,连开机都开不了的坏机,借来第二台,又不甚顺利。一怒之下,抱着死马当活马医的心态,我决定先测网络,回自己办公室拿了了测线器过来——瞎猫撞上死耗子啊!!!!!!!!!!!!!!!!!!!
补充点小知识:局域网里使用最广泛的是五类非屏蔽双绞线(UTP),一根UTP里有四对绞在一起的铜线,做网线头(也常叫做水晶头)时常用568b的标准来排线序,线序依次为橙白、橙、绿白、蓝、蓝白、绿、棕白、棕。日常网络通信时,四对铜线中,一般只用到1、2、3、6即橙、绿两对双绞线。
除了PING命令,网管另一个最重要的法宝,莫过于测线器——最不起眼的东西,常常是最能帮助你的东西!
测线器一上,第六个灯不亮,线序6不通——一切都清楚了!重做水晶头,万事OK!
故障是这样发生的
大大领导的办公室,是以前空出来的一块空隔间重新收拾后得来的,长久没有人用过,天知道那该死的水晶头被什么猫猫狗狗踩过,被什么猪拽过,被什么门啊桌啊凳子啊夹过——于是没有人知道,那根线的第六根线松了。
网络通信只用到1、2、3、6四根线,3-6一对,6不通,这对也不能用,但1-2正常,所以网络能用、是通的。两对中只有一对通,原来全双工的通信方式变成了半双工,性能减半。该死的网卡和HUB又都是很“知趣”的“自适应模式”——半双工就半双工吧,于是就该死地半双工也通了,于是网速就郁闷了,于是小王郁闷了两天,我跟着也郁闷了一整个下午。
教训
其一,现场排障时,应习惯性地把测线器带在身边,不要小看那些虽然简单却很实用的小工具。
其二,越是复杂的故障现象,出故障的原因可能越是简单。不要小看网络的任何一个层面,就算是网线没插稳,也可能搞出一大堆莫明其妙的问题来。
其三,故障定位时,常使用排除法,要从最简单、可能性最大的地方开始排除,不要迷信“一般应该是这样”的常见故障,以提高效率。
其四,要相信自己的能力与经验,排除非专业人士片言碎语的误导干扰——IP是无罪的!!!
另外,不要太相信一般的网络使用人员,甚至不要太相信终端维护同事的耳朵,他们很可能听错你的话,把IP配错,配代理是没加过滤规则,把网关配错,把地址输错等等,在电话远程支持时,一定要反复跟对方一个字一个字地确认清楚。出现网络故障,大多数时候,都不是你的错。 引用通告此內容的引用通告是: http://angelagod.spaces.live.com/blog/cns!106179100563428B!233.trak 引述這則內容的部落格
|
|
|