创建 GN5 型Kubernetes 集群
下面将介绍如何在阿里云容器服务上创建 Kubernetes GPU 集群。
前提条件
您需要申请一个按量付费的GPU计算型gn5。请 提交 ECS 工单申请开通。
背景信息
Kubernetes 深度学习解决方案支持使用云服务器 ECS 的 Kubernetes 集群或者 GPU 服务器 Kubernetes 集群。本文档以 GPU 服务器容器集群为例进行说明。
说明 有关如何创建 ECS 容器集群,参见创建Kubernetes 集群。
而 Kubernetes 全新的 GPU 调度方案基于 Nvidia 官方的设备插件和 nvidia-container-runtime,和之前社区方案相比,最终用户所要做的配置更少。
基于该方案,客户可以将应用程序利用容器技术构建镜像,结合 Kubernetes+GPU 运行机器学习,图像处理等高运算密度等任务,无需安装 nvidia driver
和 CUDA,就能实现一键部署和弹性扩缩容等功能。
使用限制
- 目前,gn5 型 GPU 云服务器只支持专有网络(VPC)。
- 用户账户需有 100 元的余额并通过实名认证,否则无法创建按量付费的 ECS 实例和负载均衡。
- Kubernetes 深度学习解决方案要求 Kubernetes 集群的版本在 1.9.3 及以上。
操作步骤
至此,创建的 Kubernetes 的 GPU 集群已经创建完毕。
发布者:佚, 佚名,转转请注明出处:https://www.cms2.cn/aliyun/csk/5022.html