谷歌Gemini接入 Veo 3 AI模型：照片进去，带音频的视频出来

2025-07-11

IT之家 7 月 10 日消息，谷歌今天在 Gemini 应用中上线了基于 Veo 3 模型的图像转视频功能，用户可以将照片变成带有背景音效、环境声、语音的 8 秒钟短视频。

谷歌表示，这项视频功能现已在部分地区向 AI Ultra 和 AI Pro 用户开放，今起先在网页版推出，移动端将在本周逐步上线。

使用时，Gemini 用户只需点击提示栏的“工具”，选择“视频”，上传照片并添加提示词，描述希望照片如何动起来。用户还可以加入对白、音效或环境声等音频描述，谷歌表示音频和画面会实现“完美同步”。最终视频为 720p、16:9 横屏的 MP4 格式。

谷歌表示，用户可以为日常物品赋予动画效果，让绘画作品“活”起来，或为自然景象添加动态，尽情发挥创意。据IT之家了解，所有生成视频均带有明显的 AI 水印和隐形的 SynthID 数字水印。

像石榴籽一样紧紧相拥 ——评民族舞剧《唱支山歌给党听》

阅读11251

广电总局发文:杜绝抗战“神剧”

阅读12588

“最不苹果” 的折叠iPhone，猛抄三星作业，卖的比华为三折叠便宜

阅读13896

K-Pop词作者“无礼采访”，韩网友怒批：谁给你的资格踩新人？

阅读12180

小沈阳女儿韩国出道、黄奕女儿不想读书，星二代勇闯娱乐圈

阅读19734