首页 > 实用技巧 > 干货教程 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

干货教程更多>>

全景相机第一股上市,影石创新值得申购么 华为nova 14手机天猫旗舰店优惠价2251元 索尼 PS5 / Pro 海外多地优惠:《黑色行动 6》同捆包 399.99 美元等 联想集团AI转型显成效:杨元庆承诺“市场份额不掉、利润不掉” 摄影师终极梦想机?索尼A1M2深度测评:性能炸裂背后藏着啥黑科技 以技术赋能油气,华为2025油气行业峰会在京召开 千元机玩转AI?魅族Note 16 Pro深度体验:防摔天花板,夜景拉跨! 华为携生态伙伴亮相全球人工智能终端展:全方位展示AI生态与应用 多彩氛围感新旗舰,vivo S30系列影像体验再升级 宏碁推出暗影骑士PG271K“可移动”显示器:4K 72Hz/FHD 144Hz 小米15S Pro正式发布,玄戒O1带来优秀表现 苹果官宣:即日起至6月18日换购新iPhone享额外优惠 【vivo X300系列深度解构】直屏旗舰的「不可能三角」如何破局? vivo新机官宣:5月29日,正式发布 TCL发布FLIP 4 5G翻盖功能手机:满电续航超2天,售价80美元 真我GT7深度评测:中端机市场的技术普惠样本 小米15S Pro首发评测:十年造芯,送给米粉的一份礼物 宝马集团董事长:中国是宝马未来发展的重要战略支点 全国汽车以旧换新智能服务平台正式上线,政府补贴一站领取 智己L6预售开启,刘涛详解品牌定位与技术创新,剑指高端市场 宝马齐普策:携新世代概念车亮相,中国速度引领智能未来出行 莲花跑车Theory 1惊艳亮相2025上海车展前夕,性能强悍引期待! 2025年始兴县事业单位招聘工作人员暨“青年人才”和“急需紧缺人才”招聘公告(89人) 2025年广州市番禺区调任科级领导职务公务员公告(10人) 吉利2025新车曝光:9款重磅产品,旗舰SUV、轿车都来了 2025首周,吉利给比亚迪一个下马威 高阶智驾≠高价,丰田开始进场!15万级激光雷达智驾SUV来了 领航穿越美国“死亡公路” 魏牌全新蓝山为何如此勇? “以旧换新”新政落地,这回轮到国四车主换新车了 蜂巢能源第五届电池日大招不断!越野、蜂行电池等重磅新品发布