CEPH là gì? Giới thiệu về Ceph, tầm quan trọng với Cloud – CEPH Số 1 về storage Open Source

ceph

CEPH là gì?

CEPH là phần mềm nguồn mở (mã nguồn mở) do cộng đồng phát triển. CEPH là giải pháp xây dựng hệ thống lưu trữ phân tán trên Server. CEPH được đánh giá cao bởi tính ổn định, độ tin cậy cao và khả năng mở rộng mạnh mẽ.

Ceph Foundation có rất nhiều tổ chức thành viên từ khắp nơi trên thế giới bao gồm các nền tảng Nguồn mở khác, các tổ chức dẫn đầu ngành, các giải pháp lưu trữ sáng tạo và các tổ chức quý giá.

Ceph có thể được sử dụng để cung cấp Ceph Object Storage cho Cloud Platforms và Ceph có thể được sử dụng để cung cấp dịch vụ Ceph Block Device cho Cloud Platforms . Ceph có thể được sử dụng để triển khai Ceph File System. Tất cả các triển khai Ceph Storage Cluster đều bắt đầu bằng việc thiết lập từng Ceph Node và sau đó thiết lập mạng.

Một Ceph Storage Cluster yêu cầu những điều sau: ít nhất một Ceph Monitor và ít nhất một Ceph Manager, và ít nhất số Ceph Object Storage Daemon (OSD) bằng số bản sao của một đối tượng nhất định được lưu trữ trong cụm Ceph (ví dụ: nếu ba bản sao của một đối tượng nhất định được lưu trữ trong cụm Ceph, thì phải có ít nhất ba OSD trong cụm Ceph đó).

Máy chủ siêu dữ liệu Ceph là cần thiết để chạy các máy khách Hệ thống tệp Ceph.

DataOnline cung cấp dịch vụ VPS sử dụng OpenStack + CEPH. Quý khách tham khảo bảng giá dịch vụ cho thuê VPS (Giá từ 25k)

Monitors : Ceph Monitor ( ceph-mon) duy trì bản đồ trạng thái cụm, bao gồm bản đồ giám sát , bản đồ quản lý, bản đồ OSD, bản đồ MDS và bản đồ CRUSH. Các bản đồ này là trạng thái cụm quan trọng cần thiết để các daemon Ceph phối hợp với nhau. Monitors cũng chịu trách nhiệm quản lý xác thực giữa các daemon và máy khách. Thông thường, cần có ít nhất ba màn hình để dự phòng và có tính khả dụng cao.

Trình quản lý : Một daemon Ceph Manager ( ceph-mgr) chịu trách nhiệm theo dõi các số liệu thời gian chạy và trạng thái hiện tại của cụm Ceph, bao gồm mức sử dụng lưu trữ, số liệu hiệu suất hiện tại và tải hệ thống. Các daemon Ceph Manager cũng lưu trữ các mô-đun dựa trên python để quản lý và hiển thị thông tin cụm Ceph, bao gồm Ceph Dashboard và REST API dựa trên web . Thông thường, cần có ít nhất hai trình quản lý để có tính khả dụng cao.

Ceph OSD : Một Object Storage Daemon ( Ceph OSD , ceph-osd) lưu trữ dữ liệu, xử lý sao chép dữ liệu, phục hồi, cân bằng lại và cung cấp một số thông tin giám sát cho Ceph Monitors và Managers bằng cách kiểm tra các Ceph OSD Daemon khác để biết nhịp tim. Thông thường, cần ít nhất ba Ceph OSD để dự phòng và có tính khả dụng cao.

MDS : Máy chủ siêu dữ liệu Ceph (MDS, ceph-mds) lưu trữ siêu dữ liệu cho hệ thống tệp Ceph . Máy chủ siêu dữ liệu Ceph cho phép người dùng CephFS chạy các lệnh cơ bản (như ls, find, v.v.) mà không gây gánh nặng cho Ceph Storage Cluster.

Ceph lưu trữ dữ liệu dưới dạng các đối tượng trong các nhóm lưu trữ logic. Sử dụng thuật toán CRUSH , Ceph tính toán nhóm vị trí (PG) nào sẽ chứa đối tượng và OSD nào sẽ lưu trữ nhóm vị trí. Thuật toán CRUSH cho phép Ceph Storage Cluster mở rộng quy mô, cân bằng lại và phục hồi động.

ceph là gì

Kho lưu trữ đối tượng Ceph (Ceph Object Store):

  • Giao diện RESTful
  • API tương thích với S3 và Swift
  • Các miền phụ theo kiểu S3
  • Không gian tên S3/Swift thống nhất
  • Quản lý người dùng
  • Theo dõi sử dụng
  • Các vật thể sọc (Striped)
  • Tích hợp giải pháp đám mây
  • Triển khai nhiều trang web
  • Sao chép nhiều trang web

Thiết bị khối Ceph (Ceph Block Device)

  • Cung cấp mỏng
  • Hình ảnh lên đến 16 exabyte
  • Sọc có thể cấu hình
  • Bộ nhớ đệm trong bộ nhớ
  • Ảnh chụp nhanh (Snapshots)
  • Sao chép-ghi-lại
  • Hỗ trợ trình điều khiển hạt nhân
  • Hỗ trợ KVM/libvirt
  • Back-end cho các giải pháp đám mây
  • Sao lưu thay đổi (Incremental backup)
  • Phục hồi thảm họa (sao chép không đồng bộ nhiều trang web)

Hệ thống tập tin Ceph (Ceph File System)

  • Ngữ nghĩa tuân thủ POSIX
  • Tách siêu dữ liệu khỏi dữ liệu
  • Cân bằng động
  • Ảnh chụp nhanh thư mục con
  • Sọc có thể cấu hình
  • Hỗ trợ trình điều khiển hạt nhân
  • Hỗ trợ FUSE
  • Có thể triển khai NFS/CIFS
  • Sử dụng với Hadoop (thay thế HDFS)

CEPH là gì?

Monitor: Ceph Monitor

ceph-mon – duy trì bản đồ trạng thái cụm, bao gồm bản đồ giám sát , bản đồ quản lý, bản đồ OSD, bản đồ MDS và bản đồ CRUSH. Các bản đồ này là trạng thái cụm quan trọng cần thiết để các daemon Ceph phối hợp với nhau. Monitor cũng chịu trách nhiệm quản lý xác thực giữa các daemon và máy khách. Thông thường, cần có ít nhất ba monitor để dự phòng và có tính khả dụng cao.

Trình quản lý: Một daemon Ceph Managerceph-mgr

chịu trách nhiệm theo dõi các số liệu thời gian chạy và trạng thái hiện tại của cụm Ceph, bao gồm việc sử dụng lưu trữ, số liệu hiệu suất hiện tại và tải hệ thống. Các daemon Ceph Manager cũng lưu trữ các mô-đun dựa trên python để quản lý và hiển thị thông tin cụm Ceph, bao gồm cả Ceph Dashboard dựa trên web . Thông thường, cần có ít nhất hai trình quản lý để có tính khả dụng cao.

Ceph OSD: Một Object Storage Daemon

(Ceph OSD, ceph-osd) lưu trữ dữ liệu, xử lý sao chép dữ liệu, phục hồi, cân bằng lại và cung cấp một số thông tin giám sát cho Ceph Monitors và Managers bằng cách kiểm tra Ceph OSD Daemons khác để biết nhịp tim. Thông thường, cần ít nhất ba Ceph OSD để dự phòng và có tính khả dụng cao.

MDS: Máy chủ siêu dữ liệu Ceph

(MDS, ceph-mds) lưu trữ siêu dữ liệu cho Hệ thống tệp Ceph . Máy chủ siêu dữ liệu Ceph cho phép người dùng CephFS chạy các lệnh cơ bản (như ls, find, v.v.) mà không gây gánh nặng cho Ceph Storage Cluster.

Ceph lưu trữ dữ liệu dưới dạng các đối tượng trong các nhóm lưu trữ logic. Sử dụng thuật toán CRUSH , Ceph tính toán nhóm vị trí (PG) nào sẽ chứa đối tượng và OSD nào sẽ lưu trữ nhóm vị trí. Thuật toán CRUSH cho phép Ceph Storage Cluster mở rộng quy mô, cân bằng lại và phục hồi động.

Đọc thêm docs tại đây

Nếu Bạn là lập trình viên, có thể tham gia dự án tại đây

Tham khảo https://ceph.io/en/