Nếu bạn muốn học và nắm vững Ceph thì SysAdmin Skills sẽ cho bạn một roadmap theo chủ đề – đi từ cơ bản đến nâng cao, đủ để triển khai, vận hành và tối ưu.
1. Tổng quan & Kiến trúc
-
Ceph là gì? Các use-case phổ biến (Block, Object, File, Cloud, AI/ML, VM storage).
-
Kiến trúc Ceph: MON, MGR, OSD, MDS, RGW.
-
CRUSH Algorithm (cách Ceph phân phối dữ liệu).
-
So sánh Ceph với các hệ thống lưu trữ khác (SAN, NAS, MinIO, GlusterFS).
2. Cài đặt & Triển khai
-
Yêu cầu phần cứng & kiến trúc mạng.
-
Cài đặt Ceph bằng:
-
cephadm
(dockerized, hiện đại). -
ceph-ansible
(tự động hóa). -
Cài đặt thủ công (manual, để hiểu sâu).
-
-
Cluster bootstrap (cephadm bootstrap).
-
Mở rộng & thu nhỏ cluster.
3. Các thành phần lõi
-
Ceph MON (Monitor): giữ cluster map, quorum.
-
Ceph MGR (Manager): thống kê, dashboard, module (Prometheus, orchestrator).
-
Ceph OSD (Object Storage Daemon): đọc/ghi dữ liệu, replication, recovery.
-
Ceph MDS (Metadata Server): phục vụ CephFS.
-
Ceph RGW (RADOS Gateway): Object Storage (S3/Swift API).
4. Kiểu dữ liệu & Pool
-
RADOS (Reliable Autonomic Distributed Object Store).
-
Pool & Placement Groups (PGs).
-
Replication vs Erasure Coding (EC).
-
Pool tiers: Hot / Cold storage.
5. Ceph Storage Interface
-
Ceph Block (RBD): dùng cho VM (KVM/OpenStack/Proxmox).
-
Ceph File System (CephFS): POSIX file system, dùng cho container.
-
Ceph Object (RGW): API S3/Swift, thay thế MinIO, AWS S3.
6. Quản trị & Vận hành
-
Monitoring (Ceph Dashboard, Prometheus + Grafana).
-
Logging & Alerting.
-
Quản lý pool, PGs, crushmap.
-
Thêm/xóa OSD, node.
-
Nâng cấp cluster Ceph.
7. Bảo mật & High Availability
-
Cơ chế Auth (CephX).
-
Mạng public/private cluster.
-
Quorum & election của MON.
-
Multi-site RGW replication.
-
Disaster Recovery (DR) & Geo-Replication.
8. Hiệu năng & Tối ưu
-
Lựa chọn ổ đĩa: SSD/NVMe vs HDD.
-
Hybrid setup (SSD journal + HDD data).
-
Tối ưu PG count, crushmap.
-
Benchmark:
rados bench
,fio
,cosbench
. -
Tuning network (RDMA, jumbo frame).
9. Tích hợp với Hạ tầng khác
-
OpenStack Cinder, Glance, Nova.
-
Kubernetes Rook (Ceph CSI driver).
-
Proxmox VE (VM storage backend).
-
Backup: Velero, Restic, RGW S3 backup.
10. Nâng cao & Troubleshooting
-
Crash & OSD dump.
-
Data recovery khi OSD/node hỏng.
-
Ceph scrub & deep scrub.
-
Reweight, backfilling, balancing.
-
Debug log Ceph.