Dr.Virintr Mekpraditsin
การตรวจสอบหาจุดเสียบนเครือข่าย
การมี Network Monitoring Tool ที่ดี จะสร้างคุณค่าให้แก่องค์กรเป็นอย่างมาก เนื่องจากจะช่วยตรวจสอบปัญหาจุดเสียบนเครือข่ายได้อย่างมีประสิทธิภาพ
ปัญหาบนเครือข่ายในปัจจุบัน เพิ่มขึ้นตามลักษณะความซับซ้อนของเครือข่าย และความสลับซับซ้อนนี้ นำไปสู่วิธีการที่มีความซับซ้อนเช่นเดียวกัน เครื่องมือตรวจสอบหรือเฝ้าดูระบบเครือข่ายจำพวก Network Monitoring Tool ต่างๆ ที่มีคุณลักษณะการทำงานที่เรียบง่าย รวมทั้ง เครื่องมือประเภท Freeware ก็ไม่อาจรับมือกับปัญหาจุกจิกที่เกิดขึ้นบนเครือข่ายได้ ก่อนที่จะกล่าวถือวิธีการเลือกเครื่องมือที่มีหัวข้อย่อยในการเฝ้าดูและตรวจสอบการทำงานของเครือข่าย ขอกล่าวถึงปัญหาระบบเครือข่ายในเชิงบริบทเสียก่อน

ปัญหาระบบเครือข่ายโดยภาพรวม
ปัญหาที่เกิดขึ้นบนเครือข่ายทั่วไป มักจะมีลักษณะดังนี้
ปัญหาประสิทธิภาพการทำงานที่ลดลง
ปัญหาการเชื่อมต่อ และอุปกรณ์
ปัญหาความผิดพลาด
ปัญหาการให้บริการไม่ต่อเนื่อง (Availability)
ปัญหาความไม่เสถียรของระบบเครือข่าย
ปัญหาความปลอดภัย
ปัญหา ความไม่เข้ากันของอุปกรณ์เครือข่าย
ปัญหาประสิทธิภาพการทำงานที่ลดลง
สิ่งที่เป็นตัวชี้วัดประสิทธิภาพที่ลดลงของระบบเครือข่าย คือค่า Response Time โดยค่า Response Time เป็นค่าที่แสดงให้เห็นถึง การตอบสนอง การสื่อสารระหว่างคอมพิวเตอร์ (เช่น Server) หรือระหว่างคอมพิวเตอร์กับเครือข่ายอื่นๆ Network Monitoring Tool ที่ดี เวลาที่เราตรวจสอบค่า Response Time ควรตรวจสอบในภาพรวมของเครือข่าย อย่าตรวจสอบในระดับคอมพิวเตอร์ เพียงไม่กี่เครื่องเท่านั้น ค่า Response Time ที่น้อย หมายถึงค่า Throughput ที่แสดงถึงอัตราหรือปริมาณของข้อมูลที่สามารถส่งถ่ายได้คิดเป็น Megabit ต่อวินาที Cisco เคยให้ความเห็นว่า ค่า Response Time บนเครือข่าย ไม่ควรเกิน 100 ms หากเกินกว่านี้ ผู้ใช้งานจะเริ่มรู้สึกถึงความล่าช้า โดยมีปัจจัยที่ทำให้เกิดค่า Response ที่สูงขึ้น มีมากมายหลายประการเช่น
ปัญหาการ Error บนเครือข่ายมากเกินไป โดย Error ต่างๆที่เกิดขึ้นนั้นก็มีสาเหตุ หลายประการเช่น การติดตั้งเดินสายสัญญาณไม่ดี เช่นเดินสายสัญญาณผ่านบริเวณที่มีสัญญาณรบกวน ปัญหา Interface ของอุปกรณ์เครือข่ายทำงานผิดพลาด เช่น Network interface card (NIC) เป็นต้น
ปัญหา Bandwidth มีไม่เพียงพอ เกิดปัญหาคอขวด สิ่งนี้มักเกิดขึ้นกับเครือข่ายระดับกลาง และระดับใหญ่ เมื่อนำอุปกรณ์เครือข่าย มาเชื่อมถึงกันเป็นเครือข่ายขนาดใหญ่ขึ้น สิ่งที่ตามมาคือเส้นทางต่างๆที่เชื่อมถึงกันนั้น อาจมี bandwidth ที่ไม่เพียงพอ ต่อการเดินทางของข้อมูลข่าวสาร ที่หลั่งไหลเข้ามาพร้อมๆกัน ปัญหานี้เราสามารถใช้เครื่องมือตรวจพบสาเหตุได้เช่นกัน โดยตรวจสอบดูเส้นทางที่มีปัญหา แล้วดูปริมาณการจราจร ที่วิ่งไปกลับบนเส้นทาง ซึ่งโดยปกติ มาตรฐานไม่ควรเกิน 80% แน่นิ่งตลอด แต่ตัวเลขสามารถแกว่งขึ้นลงได้ หากส่วนใหญ่แกว่งขึ้นมากกว่าแกว่งลงแสดงว่า เส้นทางนี้มีปัญหาคอขวด ซึ่งจะทำให้การจราจรไม่คล่องตัว ส่งผลให้ประสิทธิภาพเครือข่ายโดยรวมช้าลงได้
ปัญหาบางเส้นทางบนเครือข่าย เกิดขัดข้อง : สิ่งนี้จะทำให้การจราจรที่จะเกิดบนเส้นทางดังกล่าว ถูกโยกย้ายไปยังเส้นทางอื่น และทำให้เพิ่มภาระแก่เส้นทางอื่น ส่งผลให้การจราจรติดขัดมากขึ้น
ปัญหาทรัพยากรเครือข่าย ประสิทธิภาพลดลง : คำว่าประสิทธิภาพลดลงในที่นี้ หมายถึง กระแสจราจร และปริมาณข้อมูลข่าวสารที่วิ่งบนเครือข่าย อาจเกินกำลังขีดความสามารถของอุปกรณ์เครือข่าย เช่น ปริมาณการใช้งาน CPU ของอุปกรณ์ Switch หรือ Router ถูกใช้เกินกว่า 80% ตลอดเวลา หรือเป็นส่วนใหญ่ นอกจากนี้ ในกรณีที่ Switch หรือ Router มี Buffer ไม่เพียงพอก็จะส่งผลให้เกิด packet drop นำไปสู่ค่าหน่วงเวลา (Latency) สูง ทำให้ช้าได้
ปัญหาการละเมิดความปลอดภัย : Virus หรือ Malware ก็เป็นอีกสาเหตุหนึ่งที่ทำให้ เกิดปัญหาที่กระทบต่อประสิทธิภาพของเครือข่าย ไม่เพียงแต่สร้างปัญหาให้กับคอมพิวเตอร์เครื่องหนึ่งบนเครือข่ายเท่านั้น แต่ยังส่งผลต่อ การสื่อสารระหว่างคอมพิวเตอร์ หรือคอมพิวเตอร์กับ Server อีกด้วย อีกทั้งยังเกิดขึ้นกับอุปกรณ์เครือข่าย อย่างเช่น Switch ของ Cisco หรือ Router ของ Mikrotik ที่สร้างความฮือฮา เร็วๆนี้ คือ Malware ที่มากับ software ชื่อ Coinhive Cryptocurrency เป็นต้น ซึ่ง Virus หรือ Malware ที่เกิดขึ้นบนอุปกรณ์เครือข่าย จะสามารถสร้างความเสียหาย และลดทอนประสิทธิภาพของเครือข่ายได้ชัดเจนที่สุด
การจงใจกระทำการใดๆ ของผู้ไม่วังดีต่อระบบเครือข่ายขององค์กร ที่ใช้ Application ซึ่งสร้าง Broadcast เป็นจำนวนให้กับเครือข่าย หรืออุปกรณ์เครือข่าย ทำให้ประสิทธิภาพการสื่อสารบนเครือข่ายช้าลง

ภาพ 1 แสดงค่าหน่วงเวลา อันเนื่องมาจาก Buffer ของ Router เต็ม
ปัญหาการเชื่อมต่อ และอุปกรณ์
ปัญหาการเชื่อมต่อ เฉพาะที่ส่งผลต่อประสิทธิภาพโดยรวมของเครือข่าย มักเกิดจาก การตั้งค่าการทำงาน (Configure) ของอุปกรณ์ไม่เหมาะสม และสร้างภาระการทำงานของอุปกรณ์เครือข่าย สูงขึ้น นอกจากนี้ ความไม่เข้ากันของอุปกรณ์เครือข่ายจากผู้ผลิตสองราย นำมาเชื่อมต่อกัน ก็ส่งผลต่อการทำงานที่ไม่เสถียรของอุปกรณ์เครือข่ายทำให้ ประสิทธิภาพลดลงได้ รวมทั้งการติดตั้งที่ผิดพลาดจากน้ำมือของผู้ใช้งาน ก็สามารถทำให้เกิดปัญหาความล่าช้าของอุปกรณ์เครือข่าย เช่น การเชื่อมต่อแบบลูบวน (Loop) หรือการตั้งค่าบน switch ให้เป็น Full Duplex ขณะที่มีการตั้งค่าการทำงานของเครื่องคอมพิวเตอร์เป็น half Duplex ทำให้เกิดปัญหา Duplex mismatch ผลก็คือทำให้เกิด Late Collision ขึ้นบน Switch
ปัญหาความผิดพลาด
ปัญหาความผิดพลาด หมายถึงการทำงานที่ผิดพลาดของอุปกรณ์เครือข่าย เช่น interface ของอุปกรณ์ Switch ตัวอย่างของปัญหาคือ การที่ Port ของ Switch ได้สร้าง Jabber หรือ Runt Frame เกิดขึ้นเป็นจำนวนมาก ลักษณะนี้ เมื่อ Ethernet Frame จากคอมพิวเตอร์ วิ่งเข้ามาที่ Switch แล้ว Frame เหล่านี้ซึ่งแต่เดิม มีลักษณะปกติ แต่เมื่อวิ่งเข้ามาที่ Port ของ Switch แล้ว กลายเป็น Frame ที่เสียหายในทันที
คำว่า jabber หมายถึง Ethernet Frame ที่มีขนาดโตเกินกว่า Frame มาตรฐานคือ ขนาด 1518 ไบต์ และ Runt หมายถึง Frame ที่มีขนาดเล็ก แต่ต้องไม่น้อยกว่า 64 ไบต์
ปัญหาการให้บริการไม่ต่อเนื่อง (Availability)
ปัญหาการบริการไม่ต่อเนื่องหมายถึง ปัญหาอุปกรณ์เครือข่าย หรือเส้นทางการเชื่อมต่อต่างๆ ทั้งภายในหรือภายใน ในบางเส้นทาง หรือเส้นทางหลักเกิดขัดข้อง ไม่สามารถให้บริการได้ ปัญหาเหล่านี้ มักทำให้ประสิทธิภาพการสื่อสารช้าลง หนักเข้าหน่อย ก็ถึงขั้นหยุดชะงักไปเลยก็เป็นได้ ปัญหานี้ สามารถถูกแจ้งเตือนในทันที โดยเครื่องมือ Network Monitoring Tool ที่เฝ้าระวังดูการทำงานของเครือข่าย
ปัญหาความไม่เสถียรของระบบเครือข่าย
ปัญหาความไม่เสถียรของระบบเครือข่าย เป็นปัญหาที่สร้างความปวดหัว แก่ผู้ที่ดูแลระบบเครือข่าย เพราะเป็นปัญหาที่เกิดขึ้นในช่วงเวลาที่ไม่แน่นอน เป็นๆหายๆ และหาสาเหตุได้ยาก ส่วนใหญ่ปัญหานี้ มาจาก ปัญหาไม่กี่อย่างเช่น การติดตั้งเดินสายสัญญาณ หรือการตั้งค่าอุปกรณ์เครือข่ายไม่เหมาะสม ปัญหาเกี่ยวกับ Malware บนอุปกรณ์เครือข่าย ปัญหาเกี่ยวกับ การวางแผนติดตั้งใช้งานระบบเครือข่าย ที่ไม่ได้เผื่อ bandwidth หรือทรัพยากรเครือข่าย อย่างเช่นประสิทธิภาพของอุปกรณ์เครือข่ายไว้เพียงพอ เมื่อเครือข่ายมีขนาดโตขึ้น ขีดความสามารถของอุปกรณ์ไม่สามารถรองรับ การเพิ่มขึ้นของกระแสการจราจรบนเครือข่าย ดังกล่าว
ปัญหาความปลอดภัย
ดังที่ได้กล่าวมาแล้ว ความปลอดภัยส่งผลกระทบต่อการทำงานของระบบเครือข่าย เป็นอย่างมาก โยปัญหาความปลอดภัย มีที่มาจาก internet หรือจากบุคคลภายในได้สร้างขึ้น ทั้งที่รู้ตัว หรือไม่รู้ตัว ตลอดจน ปัญหาความปลอดภัยของอุปกรณ์เครือข่าย ซึ่งในปัจจุบัน จะมีอุปกรณ์เครือข่ายจากค่ายดังๆที่ประสบปัญหาจาก Malware หนทางหนึ่งที่แก้ไขปัญหาได้คือ การ Update security patch หรือ update Firmware จากผู้ผลิตเป็นการด่วน ตัวอย่างเหตุการณ์ที่ผ่านมาของ Mikrotik คือ นักวิจัยด้านความปลอดภัยจาก Tenable Research ได้เผยแพร่รายละเอียดวิธีการโจมตีหรือ Proof-of-Concept แบบรันโค้ดจากระยะไกลแบบใหม่ หลังพบการใช้ประโยชน์ของแฮ็กเกอร์ในวงกว้างจากช่องโหว่บนเราท์เตอร์ Mikrotik ช่องโหว่ดังกล่าวที่ถูกระบุเป็นรหัส CVE-2018-14847 นี้ เป็นบั๊กเกี่ยวกับไดเรกทอรี่ที่ทางผู้ผลิตออกแพทช์มาแก้ไขแทบจะในวันเดียวกันกับที่ค้นพบในเดือนเมษายนที่ผ่านมา แต่จนถึงปัจจุบันก็ยังถือเป็นหนึ่งในช่องโหว่ที่บรรดาอาชญากรไซเบอร์นำมาใช้หาประโยชน์มากที่สุด และมีความร้ายแรงมากที่สุด ล่าสุด ช่องโหว่นี้ถูกเลื่อนความรุนแรงขึ้นมาสู่ระดับวิกฤติ จากเทคนิคการแฮ็กแบบใหม่ที่เปิดให้แฮ็กเกอร์รันโค้ดได้จากระยะไกลบนอุปกรณ์ของเหยื่อ เพื่อให้ได้สิทธิ์เข้าถึงเชลล์ระดับรูท และสามารถฝังพวกภัยคุกคามและมัลแวร์ได้ (ข้อมูลจาก https://www.enterpriseitpro.net/mikrotik-router-vulnerability-hackers-bypass-firewall-malware/)
ปัญหา ความไม่เข้ากันของอุปกรณ์เครือข่าย
เช่นเดียวกับที่ได้อธิบายไว้ก่อนหน้านี้ว่า อุปกรณ์เครือข่ายที่มาจากผู้ผลิตที่ต่างกัน อาจมีปัญหาไม่เข้ากัน (Mismatch) เช่น อุปกรณ์ Transceiver ที่ผลิตจากค่ายอื่น มาติดตั้งบนอุปกรณ์ Cisco ที่มีปัญหาไม่เข้ากันจะเกิด Error บนหน้าจอดังนี้

ภาพ 2 แสดงข่าวสารเกี่ยวกับอุปกรณ์ Transceiver ที่ไม่ match กับอุปกรณ์ switch
ติดตามบทต่อไป ซึ่งจะเกี่ยวข้องกับสาเหตุและแนวทาง วิเคราะห์และแก้ไขปัญหาระบบเครือข่าย
ดร.วิรินทร์ เมฆประดิษฐสิน