中国经济观察网 | 手机客户端 |
当前位置: 首页 > 资讯

Meta开源AI语言模型MusicGen,可将文本和旋律转化为完整乐曲

作者:安远    栏目:资讯    来源:IT之家   发布时间:2023-06-12 11:43   阅读量:10990   

内容摘要:,Meta近日在Github上开源了其AI语言模型MusicGen,该模型基于谷歌2017年推出的Transformer模型。如同模型名称所示,MusicGen主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。 研发团队表示:“我...

,Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen,该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示,MusicGen 主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。

研发团队表示:“我们使用了 20000 小时的授权音乐来对训练该模型,并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理,进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”

除此之外,MusicGen 还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的实际表现进行了测试。结果显示,与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比,MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用,并在 Huggingface 上发布了一个供演示用的网页应用。

IT之家附上模型地址:点此前往

演示应用地址:点此前往

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关阅读