部署新模型¶
可以从模型广场或者模型部署中进行模型部署。各个参数说明如下:

-
模型选择: 选择需要部署的模型(如 DeepSeek-R1),可通过下拉菜单快速选择符合您业务需求和任务场景的模型。

-
模型服务名称: 需满足以下要求:
- 长度限制:2 - 64 个字符
- 字符限制:仅支持小写字母、数字、短横线(-),且必须以小写字母或数字开头和结尾
- 示例:text-gen-service 或 model-01
-
实例数
- 配置需要部署的实例数量。默认值:1
- 实例说明:实例数量越多,服务的并发能力越强,但成本也会相应增加
-
部署集群: 选择部署到哪个集群,建议优先选择距离较近的集群。
- 命名空间: 指定要部署到的目标命名空间。
- 模型文件检测: 选择模型、集群和命名空间后,系统将自动执行模型文件检测。