部署和端點

Vertex AI 上的 Google 和合作夥伴模型與生成式 AI 功能會以特定區域端點和全球端點的形式公開。全球端點涵蓋全球範圍,可提供比單一區域更高的可用性和可靠性。

請注意,模型端點無法保證區域可用性或區域內的 ML 處理作業。如要瞭解資料落地設定,請參閱「資料落地」。

全域端點

為要求選取全球端點,可提升整體可用性,同時減少資源用盡 (429) 錯誤。如果您有機器學習處理需求,請勿使用全球端點,因為您無法控制或得知機器學習處理要求在提出時會傳送至哪個區域。

支援的模型

下列 Google 模型支援使用全球端點:

如要進一步瞭解合作夥伴模型,請參閱 Google Cloud 合作夥伴模型端點位置

使用全域端點

如要使用全域端點,請從端點名稱中排除位置,並將資源位置設定為 global。例如,以下是全域端點網址:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

針對 Google Gen AI SDK,請建立使用 global 位置的用戶端:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

針對 Python 適用的 Vertex AI SDK,請使用 global 位置初始化 SDK:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端點時,無法使用下列功能:

  • 調整
  • 批次預測
  • 脈絡快取
  • 檢索增強生成 (RAG) 語料庫 (支援 RAG 要求)

只有下列模型可使用全球端點搭配預先配置的輸送量:

型號最新支援的模型版本
Gemini 2.5 Flash-Lite (預先發布版)gemini-2.5-flash-lite-preview-06-17
Gemini 2.5 Progemini-2.5-pro
Gemini 2.5 Flashgemini-2.5-flash
Gemini 2.0 Flashgemini-2.0-flash-001
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001

Google 模型端點位置

Vertex AI 上的生成式 AI 適用的 Google 模型端點可在下列區域使用。

美國

俄亥俄州哥倫布 (us-east5)德州達拉斯 (us-south1)愛荷華州 (us-central1)內華達州拉斯維加斯 (us-west4)美國南卡羅來納州蒙克斯科納 (us-east1)北維吉尼亞州 (us-east4)奧勒岡州 (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
圖 4
(imagen-4.0-generate-preview-06-06)
Imagen 4 Ultra Generate 實驗功能
(imagen-4.0-ultra-generate-preview-06-06)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-preview)

加拿大

蒙特婁 (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

南美洲

巴西聖保羅 (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

歐洲

荷蘭 (europe-west4)法國巴黎 (europe-west9)英國倫敦 (europe-west2)德國法蘭克福 (europe-west3)比利時 (europe-west1)瑞士蘇黎世 (europe-west6)西班牙馬德里 (europe-southwest1)義大利米蘭 (europe-west8)芬蘭 (europe-north1)波蘭華沙 (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

亞太地區

日本東京 (asia-northeast1)澳洲雪梨 (australia-southeast1)新加坡 (asia-southeast1)韓國首爾 (asia-northeast3)台灣 (asia-east1)中國香港 (asia-east2)印度孟買 (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

中東

沙烏地阿拉伯達曼 (me-central2)卡達杜哈 (me-central1)以色列特拉維夫 (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

全球

全球 (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini 嵌入物
(gemini-embedding-001)
適用於多模態的嵌入
用於字幕和視訊問答的 Imagen
Imagen
(imagegeneration@002)
圖 2
(imagegeneration@005)
圖 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud 合作夥伴模型端點位置

Google 會為您指定的區域提供要求服務。針對部分型號,Google 也提供全球端點 (預先發布版),以提升整體可用性並降低錯誤率。全域端點可擁有與區域端點不同的配額組合,且不支援資料落地規定。詳情請參閱「MaaS 專用的 Vertex AI 合作夥伴模型」中的「區域和全域端點」一節。

Vertex AI 中的生成式 AI 合作夥伴模型端點可在下列區域使用:

美國

俄亥俄州哥倫布 (us-east5)德州達拉斯 (us-south1)愛荷華州 (us-central1)內華達州拉斯維加斯 (us-west4)美國南卡羅來納州蒙克斯科納 (us-east1)北維吉尼亞州 (us-east4)奧勒岡州 (us-west1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet 2 版
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Opus
Anthropic 的 Claude 3 Haiku
DeepSeek-R1-0528 (預先發布版)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

歐洲

荷蘭 (europe-west4)比利時 (europe-west1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet 2 版
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Opus
Anthropic 的 Claude 3 Haiku
DeepSeek-R1-0528 (預先發布版)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

亞太地區

新加坡 (asia-southeast1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet 2 版
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Opus
Anthropic 的 Claude 3 Haiku
DeepSeek-R1-0528 (預先發布版)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

全球 (預先發布版)

全球 (global)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet 2 版
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Opus
Anthropic 的 Claude 3 Haiku
DeepSeek-R1-0528 (預先發布版)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

後續步驟