1. Giới thiệu
Trong hệ thống lưu trữ phân tán Ceph, dữ liệu được phân bổ và quản lý một cách thông minh thông qua nhiều thành phần cốt lõi. Hiểu rõ vai trò của từng thành phần giúp quản trị viên vận hành cluster hiệu quả, dễ dàng mở rộng, và xử lý sự cố.
Bài viết này sẽ phân tích chi tiết 5 thành phần lõi trong kiến trúc Ceph:
-
MON (Monitor)
-
MGR (Manager)
-
OSD (Object Storage Daemon)
-
MDS (Metadata Server)
-
RGW (RADOS Gateway)
2. Ceph MON (Monitor)
Chức năng chính
-
Lưu trữ Cluster Map: thông tin về OSD, pool, PG, CRUSH map.
-
Đảm bảo quorum (sự đồng thuận) trong cluster.
-
Quản lý trạng thái cluster (healthy, degraded, recovering).
Đặc điểm
-
Cần số lẻ MON node (3, 5, 7) để duy trì quorum.
-
Nếu quorum mất, cluster sẽ không ghi/đọc được dữ liệu.
-
Dung lượng lưu trữ nhỏ nhưng cực kỳ quan trọng.
3. Ceph MGR (Manager)
Chức năng chính
-
Bổ sung cho MON với chức năng quản lý cluster runtime.
-
Cung cấp Ceph Dashboard để giám sát.
-
Chạy các module: Prometheus, iostat, orchestrator, balancer.
Đặc điểm
-
Có thể chạy nhiều MGR để dự phòng.
-
Tích hợp giám sát hiệu năng và cảnh báo.
-
Cho phép điều phối container (khi dùng
cephadm
).
4. Ceph OSD (Object Storage Daemon)
Chức năng chính
-
Mỗi OSD daemon quản lý một ổ đĩa vật lý (HDD, SSD, NVMe).
-
Thực hiện đọc/ghi dữ liệu, replication, recovery, backfilling.
-
Giao tiếp với CRUSH map để xác định vị trí lưu dữ liệu.
Đặc điểm
-
Ceph cluster cần ít nhất 3 OSD để hoạt động.
-
Dữ liệu được chia nhỏ thành object, lưu phân tán trên nhiều OSD.
-
Nếu OSD bị hỏng, cluster sẽ tự động replicate/recover dữ liệu.
5. Ceph MDS (Metadata Server)
Chức năng chính
-
Chỉ phục vụ cho CephFS (Ceph File System).
-
Quản lý metadata: tên file, thư mục, quyền truy cập.
-
Tăng tốc độ truy cập file khi người dùng thao tác với nhiều file nhỏ.
Đặc điểm
-
Không cần thiết nếu chỉ dùng RBD hoặc RGW.
-
Có thể triển khai nhiều MDS để cân bằng tải.
6. Ceph RGW (RADOS Gateway)
Chức năng chính
-
Cung cấp Object Storage qua API S3 (Amazon) và Swift (OpenStack).
-
Tích hợp tốt với ứng dụng cloud-native, AI/ML, và backup.
Đặc điểm
-
Hỗ trợ multi-site replication (geo-replication).
-
Có thể thay thế MinIO trong nhiều bài toán S3-compatible.
-
Cho phép quản lý user, bucket, quota.
7. Bảng So Sánh Các Thành Phần Ceph
Thành phần | Vai trò chính | Bắt buộc? | Dùng cho |
---|---|---|---|
MON | Quản lý cluster map, quorum | ✅ | Mọi triển khai |
MGR | Dashboard, module giám sát | ✅ | Mọi triển khai |
OSD | Lưu dữ liệu, replicate | ✅ | Mọi triển khai |
MDS | Metadata cho CephFS | ❌ | CephFS |
RGW | Object Storage (S3/Swift) | ❌ | Object Storage |
8. Kết luận
Hiểu rõ các thành phần lõi trong kiến trúc Ceph là bước nền tảng trước khi triển khai cluster thực tế.
-
MON, MGR, OSD là bộ ba bắt buộc.
-
MDS dùng khi triển khai CephFS.
-
RGW dùng khi cần Object Storage S3/Swift.
Trong bài tiếp theo, chúng ta sẽ đi sâu vào Pool, Placement Groups (PGs), Replication và Erasure Coding – yếu tố quyết định hiệu năng và khả năng chịu lỗi của Ceph.
Một bình luận cho “Các Thành Phần Lõi Trong Kiến Trúc Ceph”