Hệ thống mạng của bạn có băng thông Internet rất lớn, nhưng lạ thay, các ứng dụng nội bộ vẫn chậm, video call bị giật và tình trạng rớt gói tin (packet loss) diễn ra như cơm bữa? Rất nhiều kỹ thuật viên khi gặp tình huống này thường đổ lỗi cho dây cáp hoặc nhà mạng mà quên mất một “nút cổ chai” cực kỳ quan trọng nằm ngay trong tủ rack: Khả năng xử lý thực tế của thiết bị chuyển mạch.
Việc hiểu sai hoặc hời hợt về cách một chiếc Switch vận hành ở cấp độ vi mạch thường dẫn đến những sai lầm tai hại trong cấu hình. Bạn có thể vô tình chọn sai chế độ chuyển mạch, cấu hình QoS không hợp lý, khiến hệ thống tê liệt ngay lập tức khi lưu lượng tăng đột biến (Traffic burst). Hiểu được nguyên lý hoạt động của Switch không chỉ là lý thuyết suông, đó là chìa khóa để tối ưu hóa hiệu năng mạng doanh nghiệp.
Tại bài viết này, đội ngũ chuyên gia của Nettek sẽ cùng bạn “mổ xẻ” thiết bị này dưới góc độ vi mạch và luồng dữ liệu (Data Flow). Chúng ta sẽ không nói những chuyện bề nổi. Thay vào đó, ta đi sâu vào hành trình của một Frame từ khi vào cổng (Ingress) đến khi ra cổng (Egress) và vai trò tối thượng của chip ASIC. Nếu bạn chưa nắm rõ các khái niệm cơ bản, hãy xem lại bài viết Thiết bị chuyển mạch là gì trước khi chúng ta bắt đầu hành trình chuyên sâu này.

Những điểm chính
- Sức mạnh phần cứng: Sự khác biệt giữa xử lý bằng CPU (Router) và xử lý bằng chip ASIC (Switch) ở tốc độ Wire-speed.
- Vòng đời Frame: Chi tiết quy trình Ingress (Tiếp nhận) -> Lookup (Tra cứu CAM/TCAM) -> Egress (Xuất dữ liệu).
- Kiến trúc chuyển mạch: Phân tích ưu nhược điểm của Store-and-Forward, Cut-Through và Fragment-Free.
- Quản lý tắc nghẽn: Hiểu về bộ đệm (Buffering), hiện tượng Head-of-Line (HOL) Blocking và tỷ lệ Oversubscription.
Kiến trúc phần cứng: “Động cơ” của quá trình chuyển mạch
Kiến trúc phần cứng Switch dựa trên vi mạch ASIC chuyên dụng và bộ nhớ TCAM tốc độ cao, cho phép xử lý dữ liệu song song ở tốc độ dây (Wire-speed) thay vì dùng CPU.
Vai trò tối thượng của ASIC (Application-Specific Integrated Circuit)
Bạn có bao giờ thắc mắc tại sao một con Switch Layer 3 có giá hàng ngàn đô la lại chuyển mạch nhanh hơn một con Router cùng tầm giá? Bí mật nằm ở ASIC.
Router truyền thống xử lý gói tin dựa trên phần mềm chạy trên CPU đa năng. Mỗi khi có gói tin đến, CPU phải ngắt (interrupt) để xử lý, tạo ra độ trễ. Ngược lại, nguyên lý hoạt động của Switch dựa hoàn toàn vào ASIC (Vi mạch tích hợp chuyên dụng). Đây là những con chip được “đúc cứng” các logic chuyển mạch ngay trên silicon (thường do các hãng như Broadcom hay Realtek sản xuất). Nó cho phép Switch xử lý hàng triệu Frame mỗi giây ở tốc độ đường truyền (Wire-speed) với độ trễ chỉ tính bằng micro giây. Một con CPU dù mạnh đến mấy cũng không thể đua lại tốc độ này.

Hệ thống bộ nhớ: CAM vs. TCAM
Để đưa ra quyết định chuyển tiếp cực nhanh, Switch sử dụng hai loại bộ nhớ đặc biệt:
- CAM (Content Addressable Memory): Đây là bộ nhớ nhị phân (0 và 1). Switch dùng CAM để chứa bảng địa chỉ MAC. Khi một Frame đến, ASIC ném địa chỉ MAC đích vào CAM, và CAM trả về cổng đích ngay lập tức (trong 1 chu kỳ đồng hồ).
- TCAM (Ternary CAM): Đây là bộ nhớ “Tam phân” (0, 1 và Don’t care – X). TCAM đắt đỏ hơn nhiều và là trái tim của các Switch hiện đại. Nó dùng để xử lý các luật phức tạp như ACL (Access Control List) và QoS. Nhờ TCAM, Switch có thể kiểm tra xem gói tin này có được phép đi qua (Permit) hay bị chặn (Deny) ngay lập tức mà không làm chậm tốc độ truyền tải.

Control Plane vs. Data Plane
Một Switch chuyên nghiệp (Enterprise Grade) tách biệt rõ ràng hai luồng xử lý:
- Data Plane (Mặt phẳng dữ liệu): Do ASIC đảm nhiệm. Nhiệm vụ duy nhất là đẩy Frame từ cổng này sang cổng kia nhanh nhất có thể.
- Control Plane (Mặt phẳng điều khiển): Do CPU đảm nhiệm. Xử lý các giao thức phức tạp như Spanning Tree (STP), OSPF, hoặc quản lý đăng nhập SSH/Telnet.
Sự phân tách này đảm bảo rằng ngay cả khi CPU đang quá tải vì tính toán đường đi OSPF, nguyên lý hoạt động của Switch ở tầng Data Plane vẫn chạy mượt mà, không làm rớt gói tin của người dùng. Thật tuyệt vời phải không?
Giải phẫu vòng đời của một Frame (Frame Lifecycle)
Vòng đời Frame trải qua ba giai đoạn: Ingress (nhận và kiểm tra lỗi), Lookup (tra cứu bảng CAM/TCAM để định tuyến) và Egress (xếp hàng và xuất dữ liệu ra cổng đích).
Để thực sự thấu hiểu nguyên lý hoạt động của Switch, hãy theo chân một Ethernet Frame đi qua “nhà máy” xử lý này:
Giai đoạn 1: Ingress (Tiếp nhận & Kiểm tra)
Khi tín hiệu điện hoặc quang đi vào cổng Switch:
- Signal Conversion: PHY chip chuyển đổi tín hiệu vật lý thành các bit nhị phân.
- Error Check (FCS/CRC): Đây là chốt chặn đầu tiên. Switch tính toán lại mã FCS (Frame Check Sequence). Nếu kết quả không khớp với mã trong Frame (tức là dữ liệu bị lỗi do nhiễu đường truyền), Switch sẽ Drop (vứt bỏ) Frame ngay lập tức. Nó không tốn thêm bất kỳ tài nguyên nào để xử lý rác.
- Parsing: Nếu Frame sạch, ASIC sẽ “bóc” Header để đọc các thông tin quan trọng: MAC nguồn, MAC đích, và VLAN ID (nếu có).
Giai đoạn 2: L2/L3 Lookup (Tra cứu & Quyết định)
Đây là giai đoạn “trí tuệ” nhất:
- L2 Forwarding: ASIC tra cứu bảng CAM. Câu hỏi: “MAC đích này nằm ở cổng nào?”. Trả lời: “Cổng 5”.
- VLAN Assignment: Dựa trên cấu hình cổng (Access hay Trunk), Switch sẽ quyết định gán thêm thẻ (Tagging) hoặc gỡ thẻ (Untagging) theo chuẩn IEEE 802.1Q. Bạn có thể tìm hiểu thêm về cách cấu hình tại bài viết Cấu hình VLAN Switch.
- ACL & QoS Engine: Cùng lúc đó, bảng TCAM được kích hoạt. Nó kiểm tra xem Frame này có vi phạm luật bảo mật nào không? Nó có phải là gói tin Voice cần ưu tiên (High Priority) không? Nếu có, Frame sẽ được đánh dấu (Marking) để ưu tiên xử lý.
Giai đoạn 3: Egress (Hàng đợi & Xuất dữ liệu)
Trước khi ra khỏi Switch, Frame phải xếp hàng:
- Queuing (Xếp hàng): Frame được đưa vào hàng đợi của cổng đích (Cổng 5).
- Scheduling (Lập lịch): Nếu cổng 5 đang bận, Switch dùng thuật toán (như Round Robin hoặc Strict Priority) để quyết định ai được đi trước. Gói tin Voice/Video thường được “chen ngang” đi trước gói tin tải file.
- Rewrite: Cuối cùng, Switch đóng gói lại Frame, tính toán lại FCS mới và đẩy ra dây dẫn.

Ba kiến trúc chuyển mạch (Switching Architectures)
Có ba kiến trúc chính là Store-and-Forward (tin cậy nhất), Cut-Through (độ trễ thấp nhất) và Fragment-Free (cân bằng giữa tốc độ và kiểm soát lỗi xung đột).
Tùy vào mục đích sử dụng (Data Center hay văn phòng), nguyên lý hoạt động của Switch sẽ được tinh chỉnh qua các chế độ sau:
Store-and-Forward (Lưu và Chuyển – Tiêu chuẩn)
Đây là chế độ mặc định trên hầu hết các Switch LAN hiện nay.
- Nguyên lý: Switch chờ nhận toàn bộ Frame vào bộ đệm, kiểm tra lỗi CRC xong mới chuyển đi.
- Ưu điểm: Độ tin cậy tuyệt đối. Không bao giờ chuyển tiếp các Frame lỗi (Runt/Giant frames) làm rác mạng.
- Nhược điểm: Độ trễ (Latency) cao hơn vì phải chờ nhận hết gói tin.
Cut-Through (Chuyển ngay – Tốc độ cao)
- Nguyên lý: Switch chỉ cần đọc 6 byte đầu tiên (chứa địa chỉ MAC đích) là lập tức mở cổng chuyển đi, ngay cả khi phần đuôi của Frame chưa đến nơi.
- Ứng dụng: Thường thấy trong các hệ thống High-Frequency Trading (Giao dịch tài chính tần suất cao) hoặc Data Center.
- Rủi ro: Chuyển cả các Frame lỗi. Nếu mạng bị nhiễu, Cut-Through sẽ làm lan truyền lỗi ra toàn hệ thống.
Fragment-Free (Lai ghép – Di sản)
- Nguyên lý: Switch đọc 64 byte đầu tiên của Frame rồi mới chuyển. Tại sao là 64 byte? Vì đây là độ dài tối thiểu để phát hiện xung đột (Collision) trong mạng Ethernet truyền thống.
- Lưu ý: Chế độ này hiện ít phổ biến trên các thiết bị mạng Gigabit hiện đại (Full-Duplex) nhưng vẫn là kiến thức nền tảng quan trọng để hiểu về lịch sử phát triển của Switch.
| Đặc điểm | Store-and-Forward | Cut-Through | Fragment-Free |
| Kiểm tra lỗi | Toàn bộ Frame | Không | 64 bytes đầu |
| Độ trễ | Cao nhất | Thấp nhất | Trung bình |
| Độ tin cậy | Cao nhất | Thấp | Trung bình |
| Ứng dụng | Mạng LAN, Camera | Data Center | Mạng cũ (Legacy) |

Cơ chế quản lý bộ đệm và Tắc nghẽn
Quản lý bộ đệm bao gồm việc lưu trữ Frame trong Shared Memory để xử lý chênh lệch tốc độ, đồng thời giải quyết vấn đề Oversubscription và HOL Blocking.
Một khía cạnh ít người biết trong nguyên lý hoạt động của Switch là cách nó xử lý khi bị “tắc đường”.
Hiện tượng Head-of-Line (HOL) Blocking
Hãy tưởng tượng bạn đang xếp hàng ở siêu thị. Người đứng đầu hàng (Gói tin A) gặp trục trặc thanh toán. Dù bạn (Gói tin B) chỉ mua chai nước và quầy bên cạnh đang trống, bạn vẫn bị kẹt lại phía sau. Đó là Head-of-Line Blocking.
Trong Switch, nếu một gói tin ở đầu hàng đợi bị tắc nghẽn tại cổng đích, nó có thể chặn luôn các gói tin phía sau muốn đi sang các cổng khác. Các Switch hiện đại giải quyết vấn đề này bằng cơ chế Virtual Output Queuing (VOQ) – tạo ra các làn đường ảo riêng biệt ngay từ đầu vào để tránh kẹt xe dây chuyền.
Tỷ lệ Oversubscription (Tỷ lệ chia sẻ băng thông)
Bạn có tin không? Hầu hết các Switch Access 48 cổng không bao giờ cung cấp đủ băng thông 1:1 cho tất cả các cổng cùng lúc.
Ví dụ: 48 cổng 1Gbps (Tổng 48Gbps) nhưng đường Uplink về Core chỉ có 4 cổng 10Gbps (40Gbps). Tỷ lệ Oversubscription ở đây là 1.2:1. Hiểu về tỷ lệ này giúp kỹ sư mạng thiết kế hệ thống không bị nghẽn cổ chai ở đường Uplink, đặc biệt trong các mô hình Spine-Leaf hiện đại.
Hình 2: Minh họa hiện tượng tắc nghẽn Head-of-Line (HOL) Blocking và giải pháp VOQ.
Kinh nghiệm thực chiến: Tối ưu hóa Switch cho Camera giám sát
Tối ưu hóa Switch cho Camera đòi hỏi thiết bị có bộ đệm sâu (Deep Buffer) và cấu hình Flow Control để xử lý luồng dữ liệu liên tục mà không gây mất hình.
Bối cảnh
Tại một dự án Resort mà Nettek tiếp nhận, khách hàng phàn nàn hệ thống Camera (CCTV) 4K liên tục bị giật hình, mất tín hiệu ngẫu nhiên, dù họ đã dùng Switch Gigabit và băng thông tổng vẫn dư thừa.
Phân tích nguyên lý
Sau khi kiểm tra Log và thông số phần cứng, chúng tôi phát hiện vấn đề nằm ở nguyên lý hoạt động của Switch giá rẻ mà họ đang dùng:
- Bộ đệm quá nhỏ (Shallow Buffer): Camera gửi dữ liệu liên tục (Streaming). Khi nhiều Camera cùng gửi về đầu ghi (NVR) một lúc, cổng Uplink bị nghẽn tức thời. Bộ đệm nhỏ bị tràn (Overflow) chỉ trong vài mili-giây, dẫn đến Drop gói tin.
- Độ trễ Store-and-Forward: Với luồng Video thời gian thực, việc chờ nhận đủ Frame rồi mới chuyển gây ra độ trễ tích lũy (Jitter).

Giải pháp kỹ thuật
Chúng tôi đã thay thế bằng dòng Switch chuyên dụng cho CCTV với các thay đổi cốt lõi:
- Sử dụng Switch có Deep Buffer: Bộ đệm lớn (ví dụ 4MB thay vì 512KB) giúp “hứng” trọn vẹn các đợt dữ liệu dồn dập từ Camera.
- Cấp nguồn ổn định: Ngoài vấn đề bộ đệm, việc đảm bảo nguồn điện qua Switch PoE là gì cũng là yếu tố sống còn để camera hoạt động bền bỉ, tránh sụt áp gây treo thiết bị.
- Kích hoạt Flow Control (IEEE 802.3x): Khi bộ đệm sắp đầy, Switch gửi tín hiệu “Pause Frame” ngược lại cho Camera, bảo Camera tạm dừng gửi trong vài micro giây. Điều này ngăn chặn triệt để tình trạng mất hình.
Câu hỏi thường gặp (FAQ)
Tại sao Switch Layer 2 không thể chuyển gói tin giữa các VLAN?
Vì nguyên lý hoạt động của Switch Layer 2 chỉ dựa vào địa chỉ MAC. Bảng CAM không hiểu địa chỉ IP hay Subnet. Để chuyển dữ liệu giữa các VLAN (khác Subnet), bạn cần một thiết bị định tuyến (Router hoặc Switch Layer 3) để thực hiện chức năng Routing. Xem thêm so sánh chi tiết tại bài viết So sánh Switch Layer 2 vs Layer 3.
Khi nào nên dùng chế độ Cut-Through thay vì Store-and-Forward?
Chỉ nên dùng Cut-Through trong các môi trường đặc thù như High-Performance Computing (HPC) hoặc Data Center nội bộ, nơi đường truyền cực sạch và độ trễ thấp là ưu tiên số 1. Với mạng văn phòng hoặc Camera, Store-and-Forward vẫn là lựa chọn an toàn nhất.
Backpressure là gì trong nguyên lý hoạt động của Switch?
Backpressure là một kỹ thuật kiểm soát luồng (Flow Control) trong chế độ Half-Duplex. Khi Switch bị quá tải, nó sẽ cố tình tạo ra các xung đột giả (collisions) để buộc thiết bị gửi phải ngừng truyền dữ liệu, giúp Switch có thời gian xử lý bộ đệm.
Kết luận
Chúng ta vừa đi qua một hành trình thú vị vào bên trong “bộ não” của thiết bị mạng. Có thể thấy, nguyên lý hoạt động của Switch không đơn giản chỉ là nối dây và đèn sáng. Nó là một cỗ máy xử lý logic phức tạp với sự phối hợp nhịp nhàng giữa ASIC, bộ nhớ TCAM và các thuật toán hàng đợi thông minh.
Việc thấu hiểu sâu sắc cơ chế Ingress/Egress, quản lý bộ đệm và các chế độ chuyển mạch chính là ranh giới giữa một hệ thống mạng “chạy được” và một hệ thống mạng “vận hành hoàn hảo”. Đừng để những giới hạn phần cứng vô hình kìm hãm sự phát triển của doanh nghiệp bạn.
Nếu bạn đang cần tư vấn thiết kế hạ tầng mạng chuyên sâu hoặc tìm kiếm các dòng Switch Enterprise có khả năng cấu hình tối ưu, hãy liên hệ ngay với Nettek qua số 0979.300.098. Đội ngũ kỹ sư của chúng tôi luôn sẵn sàng đồng hành cùng bạn.
