摘自 Kubernetes 实践指南
概述 腾讯云容器服务的超级节点有着隔离性强,扩容快,成本低等特点,天然适合离线任务与大规模压测。
本文分享这种场景的几个真实实践案例。
案例一: CI 系统(某出行客户) gitlab-runner 启动 Pod 运行 CI 任务,任务结束即销毁 Pod,使用常驻节点会造成资源利用率低。任务量大时扩容节点时间长,造成部分 CI 任务过慢。
方案改进: 使用 Serverless 集群(超级节点),无需常驻节点资源,Pod 按量计费,且支持竞价实例,任务结束即停止计费,降低成本。任务量大时也可以快速扩容,提高 CI 效率。
案例二: 游戏 AI 训练(某游戏客户) 使用 GPU Pod 训练游戏 NPC AI 模型,训练完成后,再启动大量 CPU Pod 对模型进行验证。