音乐ai

  • 腾讯发布多模态音乐模型 M2UGen

    1月3日讯,据 GitHub 页面显示,腾讯联手新加坡国立大学推出一款多模态大模型 M2UGen,具备音乐理解和生成能力。 研究团队表示,M2UGen 模型可以回答音乐相关的问题,还可以已通过文本、图像、视频和音频等多媒体渠道生成音乐,并对音乐进行编辑。该模型利用 MERT 等编码器(用于音乐理解)、ViT(用于图像理解)和 ViViT(用于视频理解),以及…

    2024-01-03
    00