Sự tiến hóa của kiến trúc mạng doanh nghiệp & Datacenter (Phần 1)

Thế giới công nghệ chưa bao giờ ngừng thay đổi và xảy ra một cách nhanh chóng như hiện nay. Nhưng có một sự thay đổi rất quan trọng đã diễn ra “âm thầm” trong suốt một thời gian dài, đó là sự thay đổi của kiến trúc mạng. Hiện nay, hệ thống mạng của các doanh nghiệp, đặc biệt là các trung tâm dữ liệu (Data Center), đang đối mặt với yêu cầu mới về băng thông, độ trễ, hiệu suất,  khả năng mở rộng, hiệu quả đầu tư … hay nói cách khác hơn là cần xem xét tái cấu trúc lại hệ thống mạng. Bài viết này mang đến cho các bạn một cái nhìn tổng quan về những gì đã và đang xảy ra đối với kiến trúc  mạng để từ đó có thể định hướng phát triển cho hệ thống của mình đáp ứng những yêu cầu mới.

 

1. Kiến trúc một thời “3-Layers network”

Khi nói đến kiến trúc mạng chúng ta thường nghĩ đến kiến trúc 3 tầng của Cisco hay còn gọi là 3-Tiers network. Trong kiến trúc này mỗi hệ thống mạng được chia làm 3 tầng: Core-Distribution-Access.

  • Lớp Access: Dùng để nối thiết bị người dùng cuối như máy tính, máy in và cả thiết bị phát Wifi. Đối với Data center thì các Switch ở lớp này gọi là Switch TOR (Top of Rack) dùng để nối các Server và thiết bị lưu trữ.
  • Lớp Distribution (hoặc Aggregation): Dùng để trung chuyển lưu lượng giữa các Switch ở lớp Accesss hoặc giữa lớp Access với lớp Core. Lớp này thường không nối với thiết bị người dùng và có tốc độ kết nối cao hơn lớp Access.
  • Lớp Core: Dùng để chuyển lưu lượng đi ra mạng WAN bên ngoài hoặc giữa các lớp Distribution với nhau. Các Switch ở lớp này có tốc độ rất cao, thường hoạt động ở lớp 3 của mô hình OSI và đóng vai trò Default Gateway cho các thiết bị người dùng hoặc Server.

Kiến trúc này đã được triển khai hơn 20 năm và hiện vẫn còn đang được sử dụng phổ biến bởi vì một số ưu điểm như sau:

  • Tính sẳn sàng: một kết nối bị sự cố thì hệ thống không bị ảnh hưởng, một thiết bị bị sự cố sẽ không gây gián đoạn hoạt động của thiết bị khác
  • Bảo mật: Có thể cấu hình VLAN để chia tách các nhóm nhằm bảo mật cao hơn. Việc giới hạn truy cập tại thiết bị Core cũng giúp hạn chế những truy cập trái phép.
  • Hiệu suất: Việc phân tán thiết ở lớp Access bảo đảm băng thông hiệu quả cho các thiết bị cuối.
  • Khả năng mở rộng: Dễ dàng thêm vào Switch Access mới nếu có nhu cầu tăng thêm kết nối.
  • Tính đơn giản: Mỗi lớp Access có số lượng Switch không nhiều nên khi đấu nối hay xử lý sự cố cũng đơn giản hơn.

Chính vì sự phổ biến & ưu điểm của kiến trúc này nên việc thay thế cho kiến trúc này cần phải cân nhắc kỹ. Nhưng trước sự phát triển và tiến bộ của công nghệ thì kiến trúc này cũng bộc lộ một số hạn chế:

  • Đối với Datacenter: các công nghệ ảo hóa, điện toán đám mây, sự phát triển bùng nổ các ứng dụng … nên nhu cầu về băng thông cao hơn, số lượng Server kết nối nhiều hơn, yêu cầu quản lý đơn giản hơn, chất lượng cao hơn …
  • Đối với doanh nghiệp: quy mô ngày càng lớn, số lượng thiết bị kết nối tăng lên, các kết nối Wifi ngày càng nhiều. Xu hướng BYOD (Bring your own device) trong các doanh nghiệp ngày càng phổ biến và đặc biệt việc triển khai áp dụng các thiết bị IoT trong doanh nghiệp sẽ tăng lên. Vì thế nhu cầu về băng thông cũng đặt ra yêu cầu thay đổi kiến trúc đối với doanh nghiệp.

Một số điểm hạn chế của mô hình 3-Tiers Network:

  • Spanning tree protocol (STP): Giao thức STP giúp phòng chống loop ở lớp 2 và bắt buộc sử dụng. Giao thức này sẽ khóa (block) những kết nối dự phòng nên dung lượng kết nối bị giảm ít nhất 50%. Ngoài ra khi có sự cố, thời gian hội tụ, tính toán lại của STP rất lâu. Giao thức MSTP có thể giúp cải thiện nhưng đòi hỏi phải cấu hình thủ công rất nhiều.
  • Broadcast domain: Khi số lượng thiết bị càng nhiều thì lưu lượng BUM (BroadcasstUnknown unicast-Multicast) cũng tăng lên theo, làm ảnh hưởng hiệu suất hoạt động của hệ thống, từ đó làm cho việc mở rộng (scale) bị hạn chế.
  • Tốc độ, độ trễ: Tốc độ truy cập và độ trễ kết nối giữa các Server không bảo đảm. Ví dụ tốc độ & độ trễ của kết nối từ Server A đến Server B sẽ khác so với từ Server A đến Server C, việc này có thể ảnh hưởng đến hoạt động của các ứng dụng.
  • Hướng của lưu lượng: Mô hình 3Tiers phục vụ cho lưu lượng theo hướng vào/ra (into/out of) từ trên xuống dưới (North-South) hoặc ngược lại. Đối với hệ thống có số lượng Server nhiều thì xu hướng lưu lượng đi ngang (West-East) tăng lên nên việc chuyển tiếp (transit) lưu lượng qua nhiều lớp sẽ làm ảnh hưởng tốc độ truy cập.

  • Hỗ trợ SDN (Software Difined Network): Với xu hướng SDN hiện nay, các hệ thống mạng phải đáp ứng được yêu cầu đặt máy ảo (VMVirtual Machine) tại bất kỳ tại vị trí nào trong hệ thống mạng nhưng vẫn giữ được kết nối Layer 2 (Logical Layer 2 network) với các VM khác. Có nghĩa là tách kiến trúc ảo (Virtual topology) ra khỏi kiến trúc vật lý (Physical topology). Kiến trúc mạng 3-Tiers không cho phép tạo ra hệ thống mạng vật lý hạ tầng (Underlay network) để có thể xây dựng hệ thống mạng logic thượng tầng (Overlay network) đáp ứng yêu cầu của kiến trúc mạng SDN.

Trên đây chỉ là một số hạn chế chính, ngoài ra còn nhiều hạn chế khác, chính vì vậy đặt ra yêu cầu tìm giải pháp mới cho kiến trúc 3-Tiers Network.

 

2. Kỹ thuật Multi-chassic LAG

Để khắc phục hạn chế của Spanning-tree người ta đã dùng phương án gom các cổng kết nối thành nhóm có tên LAG (Link aggregation group).

  • Hai cổng trên một Switch sẽ nhóm thành một, loại bỏ sử dụng STP trên 2 cổng.
  • Với Modular Switch thì 2 cổng trên 2 card khác nhau có thể được đưa vào một cùng một nhóm.
  • Với các Stackable Switch thì 2 cổng trên 2 Switch cũng có thể đưa vào cùng một nhóm, thường 2 Stackable Switch phải nằm gần nhau.

Nếu Switch nằm xa nhau như ở 2 tủ Rack hay 2 tòa nhà thì không thể nhóm vào cùng một LAG. Từ đây phát sinh ra kỹ thuật cho phép các port ở trên các Switch khác nhau có thể gom thành một nhóm. Kỹ thuật này được gọi là Multi-chassic LAG hay còn gọi là Layer 2 – Aggregation vì lúc này lớp Core & Distribution đã được nhập lại (Aggregate).

Nhiều hãng (vendor) đã cung cấp giải pháp này và đặt nhiều tên gọi khác nhau như:

Cisco có giải pháp VSS và vPC, Juniper là MC-LAG còn Arista là M-LAG …, thông tin chi tiết một số hãng khác tại link sau:

https://en.wikipedia.org/wiki/Multi-chassis_link_aggregation_group

Với giải pháp này, giao thức STP đã bị loại bỏ, băng thông đã tăng lên những vẫn tồn tại những vấn đề như: Số lượng Switch Access phụ thuộc vào số port của cặp Core Switch, khả năng mở rộng vẫn chưa được giải quyết, vẫn có thể xảy ra nghẽn, số lượng MAC vẫn bị giới hạn ở 4096 địa chỉ, cặp Core Switch phải cùng Vendor vì mỗi Vendor thiết kế riêng chuẩn cho thiết bị của mình, Broadcast domain vẫn không giảm ...

(Xem tiếp phần 2)

Bài viết cùng danh mục