Google AI Studio 是接入 Gemini API 开发的最快起点,提供包括 Gemini 2.5 预览版模型在内的最强性能模型,以及 Imagen、Lyria RealTime 和 Veo 等生成式媒体模型。在 Google I/O 大会上,我们宣布推出多项新功能,助您构建和部署完整应用,同时发布新模型能力及 Google Gen AI SDK 的新功能。
Gemini 2.5 Pro 具备令人惊叹的编码能力,我们很高兴将其引入 Google AI Studio 的原生代码编辑器。我们将其与 Gen AI SDK 紧密优化,让您能够更轻松地通过简单的文本、图像或视频提示生成应用。全新的“构建”选项卡现在可让您快速构建和部署 AI 驱动的 Web 应用。我们还推出了新的“展示”示例,方便您尝试新模型并采取更多操作。
除了使用单一提示生成应用外,您还可以通过聊天继续迭代您的 Web 应用。您可借此执行更改、查看差异,甚至还可以跳回之前的检查点来还原编辑内容。
您还可一键将新建应用部署至 Cloud Run。
Google AI Studio 应用及其生成的代码均使用唯一的占位符 API 密钥,允许 Google AI Studio 代理所有 Gemini API 调用。因此,当您将应用共享给 Google AI Studio 时,该应用用户的所有 API 使用量都将计入其 Google AI Studio 的免费使用量,完全不会占用您自己的 API 密钥和配额。您可以阅读我们的常见问题解答以了解更多信息。
此功能尚处于实验阶段,因此在对外共享项目之前,请务必检查代码。我们的一次性生成功能已针对 Gemini 和 Imagen 模型进行了优化,并将很快支持更多模型和工具调用。
我们始终致力于将 Google DeepMind 先进的多模态模型更快地融入开发者工具。全新的“生成媒体”页面一站式呈现 Imagen、Veo、具备原生图像生成能力的 Gemini 模型及全新原生语音生成模型。此外,您还可通过 Google AI Studio 内置的 PromptDJ 应用,体验 Lyria RealTime 的交互式音乐生成功能。
Link to Youtube Video (visible only when JS is disabled)
借助 Live API 中预览版的 Gemini 2.5 Flash 原生音频对话功能,该模型现可支持 30 多种音色,生成更趋自然的响应。我们还新增主动音频处理技术,使模型能够区分演讲者与背景对话,从而精准判断何时应做出应答。这让您能够构建更直观、更自然的对话式 AI 代理和体验。
Link to Youtube Video (visible only when JS is disabled)
除了 Live API 之外,我们还发布了可实现文本转语音的 Gemini 2.5 Pro 和 Flash 预览版,可支持原生音频输出。现在,您可定制单人或多人语音输出,并灵活控制演讲风格。
Link to Youtube Video (visible only when JS is disabled)
前往流式传输选项卡尝试使用 Live API 中的原生音频,并通过生成语音体验新的 TTS 功能。
模型上下文协议 (MCP) 定义现已在 Google Gen AI SDK 中得到原生支持,以便更轻松地与越来越多的开源工具集成。我们提供了一个演示应用,演示如何在 Google AI Studio 中使用结合了 Google 地图和 Gemini API 的 MCP 服务器
网址上下文是一款全新的实验性工具,使模型能够从您提供的链接中检索和引用相关内容。这对于事实核查、比较、总结以及更深入的研究非常有帮助。
我们很高兴将所有这些更新引入 Google AI Studio,以便于开发者在其中探索和构建 Google 提供的最新模型。
从 5 月 22 日起,您可以在 io.google 上探索此公告并浏览所有 2025 年 Google I/O 大会更新。