公告:聚站网(www.565865.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:21314
  • 文章:20316

3月6日下午消息,腾讯混元宣布图生视频模型目前已经上线,企业和开发者可在腾讯云申请使用API接口;用户通过混元AI视频官网即可体验。混元视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。

据悉,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。

此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。目前在Github、HuggingFace等主流开发者社区均可下载体验。

混元开源技术报告披露,混元视频生成模型具备灵活的扩展性,图生视频和文生视频在相同的数据集上开展预训练工作。在保持超写实画质、流畅演绎大幅度动作、原生镜头切换等特性的基础上,让模型能够捕捉到丰富的视觉和语义信息,并结合图像、文本、音频和姿态等多种输入条件,实现对生成视频的多维度控制。

目前,混元开源系列模型已经完整覆盖文本、图像、视频和3D生成等多个模态,在Github 累计获得超 2.3 万开发者关注和star。(闫妍)

责任编辑:何俊熹

    关键词: 腾讯 开源 上线 模型
    精彩推荐

    时间:25/07/05

    新浪科技讯3月6日下午消息,腾讯混元宣布图生视频模型目前已经上线,企业...

    时间:25/07/05

    智通财经APP获悉,3月6日港股市场,北水成交净买入65.3亿港元,其中港股通...

    时间:25/07/05

    魏哲家凤凰网科技讯北京时间3月6日,台积电在美国追加投资1000亿美元引...

    时间:25/07/05

    文章介绍了腾讯推出的元宝在短短时间内超越DeepSeek登上下载榜首的情...

    时间:25/07/04

    新浪科技讯3月6日晚间消息,即梦AI上线“动作模仿”功能,用户从“数字人...

    文章分类
    快审网站推荐
    随机网站推荐
    搜狗21/09/29

    中国最领先的中文搜索引擎,支持微信公众号、文章搜索,通过独有的SogouR...

    豆瓣读书21/10/09

    豆瓣读书为豆瓣网的一个子栏目。豆瓣读书自2005年上线,已成为国内信息...

    零目录22/09/26

    零目录(www.dir0.com)专业的网站分类目录平台!为您提供网站分类目录索引...

    飞卢网21/10/02

    飞卢网提供原创小说阅读,包括:轻小说,玄幻小说,同人小说,穿越小说、青...

    1717321/09/28

    17173游戏网是中国游戏第一门户站,全年365天保持不间断更新,您可以在...

    J**a编程21/10/12

    J**a编程是在2003年9月创办的,创始人范凯在学习和研究j**a的开源框架...

    和讯网21/10/02

    和讯网-中国财经网络领袖和中产阶级网络家园,创立于1996年,是中国最早...

    凤凰财经21/10/13

    凤凰财经,全球华人新主流财经门户,第一时间为用户提供专业财经资讯与数...

    39健康网21/09/25

    39健康网是广州启生信息技术有限公司旗下网站,中国领先的健康门户,于20...

    闽南网21/10/09

    闽南网由福建日报报业集团主管,是福建主流媒体,闽南门户网站。实时报道...