模型
目錄
頂級 models 部分聲明瞭您的 Compose 應用程式使用的 AI 模型。這些模型通常以 OCI 製品的形式拉取,由模型執行器執行,並作為您的服務容器可以使用的 API 暴露。
服務只能在頂級元素 services 中透過 models 屬性 明確授予訪問許可權時才能訪問模型。
示例
示例 1
services:
app:
image: app
models:
- ai_model
models:
ai_model:
model: ai/model在這個基本示例中
- 應用程式服務使用
ai_model。 ai_model被定義為一個 OCI 製品 (ai/model),由模型執行器拉取和提供服務。- Docker Compose 將連線資訊(例如
AI_MODEL_URL)注入容器。
示例 2
services:
app:
image: app
models:
my_model:
endpoint_var: MODEL_URL
models:
my_model:
model: ai/model
context_size: 1024
runtime_flags:
- "--a-flag"
- "--another-flag=42"在這個高階設定中
- 服務應用程式使用長語法引用
my_model。 - Compose 將模型執行器的 URL 作為環境變數
MODEL_URL注入。
屬性
model(必填):模型的 OCI 製品識別符號。這是 Compose 透過模型執行器拉取和執行的內容。context_size:定義模型的最大令牌上下文大小。runtime_flags:模型啟動時傳遞給推理引擎的原始命令列標誌列表。
其他資源
有關使用 model 的更多示例和資訊,請參閱 在 Compose 中使用 AI 模型