Các Thành Phần Lõi Trong Kiến Trúc Ceph

1. Giới thiệu

Trong hệ thống lưu trữ phân tán Ceph, dữ liệu được phân bổ và quản lý một cách thông minh thông qua nhiều thành phần cốt lõi. Hiểu rõ vai trò của từng thành phần giúp quản trị viên vận hành cluster hiệu quả, dễ dàng mở rộng, và xử lý sự cố.

Bài viết này sẽ phân tích chi tiết 5 thành phần lõi trong kiến trúc Ceph:

  • MON (Monitor)

  • MGR (Manager)

  • OSD (Object Storage Daemon)

  • MDS (Metadata Server)

  • RGW (RADOS Gateway)

2. Ceph MON (Monitor)

Chức năng chính
  • Lưu trữ Cluster Map: thông tin về OSD, pool, PG, CRUSH map.

  • Đảm bảo quorum (sự đồng thuận) trong cluster.

  • Quản lý trạng thái cluster (healthy, degraded, recovering).

Đặc điểm
  • Cần số lẻ MON node (3, 5, 7) để duy trì quorum.

  • Nếu quorum mất, cluster sẽ không ghi/đọc được dữ liệu.

  • Dung lượng lưu trữ nhỏ nhưng cực kỳ quan trọng.

3. Ceph MGR (Manager)

Chức năng chính
  • Bổ sung cho MON với chức năng quản lý cluster runtime.

  • Cung cấp Ceph Dashboard để giám sát.

  • Chạy các module: Prometheus, iostat, orchestrator, balancer.

Đặc điểm
  • Có thể chạy nhiều MGR để dự phòng.

  • Tích hợp giám sát hiệu năng và cảnh báo.

  • Cho phép điều phối container (khi dùng cephadm).

4. Ceph OSD (Object Storage Daemon)

Chức năng chính
  • Mỗi OSD daemon quản lý một ổ đĩa vật lý (HDD, SSD, NVMe).

  • Thực hiện đọc/ghi dữ liệu, replication, recovery, backfilling.

  • Giao tiếp với CRUSH map để xác định vị trí lưu dữ liệu.

Đặc điểm
  • Ceph cluster cần ít nhất 3 OSD để hoạt động.

  • Dữ liệu được chia nhỏ thành object, lưu phân tán trên nhiều OSD.

  • Nếu OSD bị hỏng, cluster sẽ tự động replicate/recover dữ liệu.

5. Ceph MDS (Metadata Server)

Chức năng chính
  • Chỉ phục vụ cho CephFS (Ceph File System).

  • Quản lý metadata: tên file, thư mục, quyền truy cập.

  • Tăng tốc độ truy cập file khi người dùng thao tác với nhiều file nhỏ.

Đặc điểm
  • Không cần thiết nếu chỉ dùng RBD hoặc RGW.

  • Có thể triển khai nhiều MDS để cân bằng tải.

6. Ceph RGW (RADOS Gateway)

Chức năng chính
  • Cung cấp Object Storage qua API S3 (Amazon) và Swift (OpenStack).

  • Tích hợp tốt với ứng dụng cloud-native, AI/ML, và backup.

Đặc điểm
  • Hỗ trợ multi-site replication (geo-replication).

  • Có thể thay thế MinIO trong nhiều bài toán S3-compatible.

  • Cho phép quản lý user, bucket, quota.

7. Bảng So Sánh Các Thành Phần Ceph

Thành phần Vai trò chính Bắt buộc? Dùng cho
MON Quản lý cluster map, quorum Mọi triển khai
MGR Dashboard, module giám sát Mọi triển khai
OSD Lưu dữ liệu, replicate Mọi triển khai
MDS Metadata cho CephFS CephFS
RGW Object Storage (S3/Swift) Object Storage

8. Kết luận

Hiểu rõ các thành phần lõi trong kiến trúc Ceph là bước nền tảng trước khi triển khai cluster thực tế.

  • MON, MGR, OSD là bộ ba bắt buộc.

  • MDS dùng khi triển khai CephFS.

  • RGW dùng khi cần Object Storage S3/Swift.

Trong bài tiếp theo, chúng ta sẽ đi sâu vào Pool, Placement Groups (PGs), Replication và Erasure Coding – yếu tố quyết định hiệu năng và khả năng chịu lỗi của Ceph.

Tác giả: Mạnh Hoàng

Tôi là Hoàng Mạnh, người sáng lập blog SysadminSkills.com. Tôi viết về quản trị hệ thống, bảo mật máy chủ, DevOps và cách ứng dụng AI để tự động hóa công việc IT. Blog này là nơi tôi chia sẻ những gì đã học được từ thực tế – đơn giản, ngắn gọn và áp dụng được ngay.

Một bình luận cho “Các Thành Phần Lõi Trong Kiến Trúc Ceph”

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *