Khi triển khai Ceph ở môi trường production, bảo mật và khả năng chịu lỗi (High Availability – HA) là hai yếu tố cốt lõi. Một hệ thống lưu trữ phân tán không chỉ cần đảm bảo dữ liệu an toàn trước các mối đe dọa bên ngoài, mà còn phải duy trì hoạt động liên tục ngay cả khi một số thành phần gặp sự cố.
Bài viết này đi sâu vào 5 khía cạnh quan trọng: Cơ chế Auth CephX, phân tách mạng, quorum & election của MON, multi-site RGW replication, và chiến lược DR & Geo-Replication.
CephX Authentication – Cơ chế xác thực bảo mật
-
CephX là gì?
CephX là hệ thống xác thực mặc định của Ceph, đảm bảo rằng chỉ các client và daemon được cấp phép mới có thể truy cập tài nguyên. Nó hoạt động dựa trên keyring được phát sinh khi tạo user hoặc service. -
Cách hoạt động
-
Client gửi yêu cầu đến MON.
-
MON xác thực bằng cách so khớp keyring với secret lưu trong cluster.
-
Sau khi xác thực, client nhận được capabilities (quyền hạn: read, write, execute).
-
Các request tiếp theo đến OSD, MDS hoặc RGW sẽ được thực thi theo quyền hạn này.
-
-
Best Practices
-
Tạo user riêng cho từng ứng dụng/dịch vụ.
-
Giới hạn quyền theo nguyên tắc least privilege (ví dụ: chỉ
read
đối với backup job). -
Bảo mật file
ceph.client.admin.keyring
.
-
Phân tách mạng: Public & Cluster Network
-
Public Network: nơi client giao tiếp với cluster (đọc/ghi dữ liệu).
-
Cluster Network: nơi trao đổi dữ liệu nội bộ giữa OSDs (replication, recovery, heartbeat).
Lợi ích của việc tách mạng:
-
Giảm tắc nghẽn, tránh việc traffic replication ảnh hưởng đến client.
-
Bảo mật tốt hơn: hạn chế truy cập từ bên ngoài vào mạng nội bộ cluster.
Cấu hình trong ceph.conf
: