私有云和多云管理平臺 | Cloudpods v4.0 發布
?開源社區:https://www.cloudpods.org/zh/
?GitHub:https://github.com/yunionio/cloudpods
Cloudpods v4.0
4.0 為一次大版本更新,最早的 PR 可以追溯到 2024 年春節前后,算下來已經迭代了將近 2 年,共計 3695 個新增提交。 4.0 是 cloudpods 為適應當前技術發展大趨勢做的一次大版本迭代。
近幾年 IT 基礎設施領域主要體現出兩個大的變化:AI 和國產替代。首先是隨著 AI 需求井噴,基礎設施也需要改變去適應 AI 應用。 其次是國產化替代和自主可控的要求進一步落地,基礎設施需要迭代去管理國產化的硬件和技術棧。
4.x 主要變化概覽
基于上述趨勢變化,4.x 的主要變化總結如下:
1、支持 AI 工作負載
順應 AI 技術浪潮,4.0 版本發布了兩個 AI 相關的服務,允許用戶在 cloudpods 管理的服務器上運行 AI 工作負載: 一是提供 cloudpods 的 MCP server,為 AI Agent 提供 cloudpods 管理的云資源查詢與操作能力; 二是基于 4.0 的容器主機能力交付即開即用的 AI 服務實例,主要包括 AI 應用與推理服務兩類。
AI 應用:支持在容器主機內運行 AI 應用,包括:
- OpenClaw:cloudpods 提供預置 OpenClaw 的服務實例,可在服務器上秒級開通“小龍蝦”實例;支持多家模型供應商(Anthropic、月之暗面、MiniMax、Zai 等)與多 IM 通道(QQ、飛書、Discord、Telegram 等)。運行在獨立隔離的 Ubuntu 桌面環境中,安全高效。
- ComfyUI:流行的 AI 圖像生成平臺,支持 Stable Diffusion 等圖像生成模型,可使用服務器上的 GPU 運行模型。
- Dify:完整的 LLM 應用開發平臺,支持工作流編排,可與 ollama 服務實例聯動部署。
推理服務:在 GPU 服務器上一鍵部署 ollama 服務實例,并利用容器主機的“秒裝應用”特性實現模型數據集動態加載:
- 支持模型導入、社區模型倉庫(內置 Qwen3、Qwen2.5-Coder 等主流開源模型)。
- 本地部署的推理服務可作為 MCP server 以及 AI 應用的 LLM 后端,實現完整的本地私有化 AI 服務。
為方便體驗 4.0 的 AI 功能與容器主機功能,cloudpods 4.0 增加了 AI 云部署模式:使用 ocboot 部署 cloudpods 時,可選擇 AI 云部署模式。
2、支持容器主機
為更好運行 AI 工作負載,4.0 的一個重要更新是在虛擬化主機之外提供了容器主機。這是一個完全自研的分布式容器管理平臺,底層基于 containerd 容器運行時,網絡、存儲及管控框架復用了 cloudpods 現有的成熟基礎設施,實現云平臺與容器的深度融合。
雖然 Kubernetes 已是分布式容器平臺事實標準,但 Kubernetes 主要面向無狀態微服務。相比 Kubernetes 的 Pod,cloudpods 容器主機具備更適合運行 AI 應用、云桌面、云游戲等有狀態單機工作負載的特性:
- 有狀態:容器主機分配不變 IP;支持掛載持久本地存儲;支持系統盤 overlay 持久化。
- 支持調整配置:垂直擴容。
- Pod 內多容器可按指定順序啟動。
- 每臺宿主機獨立的網絡端口映射規則(區別于 K8s 的全局 NodePort)。
- 原生支持透傳/共享 GPU 設備;NUMA 拓撲感知與自動均衡(無需額外 device plugin 配置)。
- 原生支持 lxcfs;支持 CPU 仿真等。
容器主機采用 Pod 模型,通過自研 CRI 實現層直接與 containerd 通信,無需依賴 Docker 或 Kubernetes。經過 2 年多迭代,在實際使用中能力逐步完善, 支持 AI 應用的即開即用交付。核心能力包括:
- 全生命周期管理:創建/啟停/重啟/刪除/配置調整/在線磁盤擴容,支持異常崩潰自動恢復。
- 網絡集成:復用 VPC/經典網絡,支持端口映射(TCP/UDP)、彈性公網 IP 綁定。
- 存儲管理:宿主機目錄掛載、Overlay 文件系統、CephFS 卷掛載、容器快照與鏡像提交。
- GPU 設備透傳:NVIDIA GPU、華為昇騰 NPU、瀚博等設備透傳至容器,支持 NVIDIA MPS。
- 資源隔離:CPU Set 綁定、NUMA 感知調度、內存/PID 限制、cgroup 設備權限控制。
- 運維能力:容器終端 exec、日志查詢、文件拷貝、健康探針、監控指標。
- 安全特性:RunAsUser/RunAsGroup、命名空間隔離、no_new_privs。
3、支持更多異構 CPU 架構
cloudpods 在 3.x 版本原生支持了 ARM 架構,實現多 CPU 架構支持從 0 到 1 的飛躍,并已在多個客戶生產環境大規模商用。 在此基礎上,cloudpods 4.0 在軟件構建基礎設施與軟件架構進一步升級,為更容易支持多 CPU 架構做了基礎設施與工具準備,包括:
- 支持打包多架構的 rpm 和 deb 軟件包。
- 支持打包任意架構組合的容器鏡像。
- 升級容器基礎鏡像版本到 alpine 3.19,原生支持 riscv、龍芯等架構。
- 升級 golang 版本到 1.24,原生支持 riscv、龍芯等架構的二進制編譯。
- 升級 QEMU 版本到 10.0.7,為 arm、riscv 架構虛擬機以及 Windows 11 提供更新虛擬硬件特性。
- 支持容器化部署 openvswitch 和 ceph 組件,減少部署的操作系統軟件包依賴。
在 4.x 的后續版本中,隨著 riscv、龍芯等異構 CPU 硬件與生態成熟,cloudpods 會適時推出對這些 CPU 架構服務器的原生支持。
4、全面支持 IPv6
平臺實現從底層網絡到上層業務的全面 IPv6 支持。KVM 虛擬機和容器主機均支持 IPv6 雙棧與 IPv6 單棧模式; 宿主機網絡全面支持 IPv6(網橋、熱遷移、Ceph、NBD)。
多云層面,阿里云、華為云、AWS、騰訊云、火山引擎等主流公有云的 IPv6 地址同步已全部打通; 安全組、VPC、子網、DNS、VIP 等網絡資源均支持 IPv6。部署工具 ocboot 也支持 IPv6 環境部署。
其他更新(v4.0.2)
由于版本管理原因,4.0 版本第一個正式發布的小版本為 v4.0.2。除上述亮點外,v4.0.2 還包含大量新功能、功能改進與問題修復, 覆蓋虛擬機、云管、多云資源納管、費用與報表、ITSM、前端與平臺運維等多個方向。
(以下為 v4.0.2 更新要點摘錄,完整明細可在發布說明中查看。)
開源之夏(2025)
在 2025 年的開源之夏中,以下同學為 cloudpods 貢獻了重要內容,均在 4.0 發布,在此感謝:
- eikohs:貢獻 cloudpods LLM 服務框架以及 ollama 和 dify 應用的完整后端實現。
- PengJingzhao:貢獻 Cloudpods MCP Server 完整后端實現。
- happy-game:貢獻 Kickstart 自動化操作系統安裝完整后端實現。
- Jinyu007:貢獻 cloudpods riscv 架構鏡像構建的初步支持。
如何升級?
升級文檔
https://www.cloudpods.org/zh/docs/setup/upgrade/

