起原:证券时报 大模子开源,“卷”到了视频界限。 2月25日晚,阿里巴巴告示全面开源旗下视频生成模子万相2.1模子。据先容,通义万相2.1模子基于Apache2.0条约,14B和1.3B两个参数规格的一谈推理代码和权重一谈开源,同期接济文生视频和图生视频任务,公共建立者可在Github、HuggingFace和魔搭社区下载体验。 通义万相是阿里云通义系列AI画图创作大模子,可辅助东谈主类进行图片创作,于2023年7月7日认真上线。在2024年9月19日的阿里云栖大会上,阿里发布了通义万相视频生
起原:证券时报
大模子开源,“卷”到了视频界限。
2月25日晚,阿里巴巴告示全面开源旗下视频生成模子万相2.1模子。据先容,通义万相2.1模子基于Apache2.0条约,14B和1.3B两个参数规格的一谈推理代码和权重一谈开源,同期接济文生视频和图生视频任务,公共建立者可在Github、HuggingFace和魔搭社区下载体验。
通义万相是阿里云通义系列AI画图创作大模子,可辅助东谈主类进行图片创作,于2023年7月7日认真上线。在2024年9月19日的阿里云栖大会上,阿里发布了通义万相视频生成大模子。该模子不错生成影视级高清视频,况且更能听懂中国话,被外界称为“最懂中国风”的视频大模子。
值得严防的是,就在本年1月初,通义万相视频生成模子告示重磅升级至2.1版,模子全体性能大幅提高,尤其是在经管复杂融会、规复真确物理轨则、提高电影质感及优化辅导撤职方面赢得了显赫进展。通义万相2.1推出后,凭借着优秀的进展,在泰斗评测榜单VBench中登上榜首。
张开剩余69%据了解,VBench是视频生成界限的泰斗评测集,它一共有16个评分维度,从全体一致性、动作开通度、画面闲逸性等方濒临模子进行全主义评估。VBench榜单深远,通义万相在融会幅度、多对象生成、空间相干等要津才智上拿下最高分,并以总分84.7%的收获斩获第一。这意味着,通义万相是国内乃至公共视频生成模子的领跑者。
具体阿里通义团队先容,通义万相2.1模子在图像生成和视频生成两大才智上均有显赫提高。在视频生成方面,通过自研的高效VAE和DiT架构,增强了时空高低文建模才智,可接济无尽长1080P视频的高效编解码,并在翰墨视频生成上终昭着突破,成为首个接济汉文翰墨生成才智、且同期接济中英文翰墨殊效生成的视频生成模子,可倨傲告白想象、短视频等界限的创作需求。
笔据阿里展示的案例,当用户输入:“以红色新年宣纸为布景,出现一滴水墨,晕染墨汁冉冉晕染开来。翰墨的笔画边际无极且当然,跟着晕染的进行,水墨在纸上呈现‘福’字,墨色从深到浅过渡,呈现出特有的东方韵味。布景高档简略,杂志影相感”的辅导时,通义万相2.1模子不错笔据条件,输出具有中国特质及浓郁的新年格调的视频素材,阔气东方韵味。
由于“最懂中国风”,通义万相模子在蛇年春晚上也说明了迫切作用。举例,在春晚每年的保留节目《记起今宵》中,舞台布景中变身为秀好意思花灯的城市地标,恰是由通义万相图像裁剪模子Wanx-ACE生成。另外,在莫文蔚与毛不易齐唱的《岁月里的花》节目中,阿里通义万相运用图像格调化和首尾帧视频生成本领,生成了千里浸式的油画风舞好意思恶果,为不雅众呈现了一场秀好意思的视觉盛宴。
业内东谈主士分析称,2024年春节前后,OpenAI凭借Sora在视频生成界限激勉高涨,让视频生成成为各大AI厂商竞相追赶的焦点。而2025年春节,阿里通义万相则展示了视频生成本领令东谈主瞩想象显赫超越,引颈着视频大模子界限络续迅速上前发展。
现时,DeepSeek正以绽放的姿态参与重构公共AI生态时势,并给大模子开源社区注入了极强的信心与能源。2月24日,DeepSeek认真启动“开源周”,贯穿5天每天开源一个代码库,眩惑了公共建立者极大关怀。在开源公告中,DeepSeek还默示,我方仅仅探索通用东谈主工智能的小公司,动作开源社区的一部分,每共享一瞥代码,皆会成为加快AI行业发展的集体能源。
在DeepSeek的带动下开云kaiyun中国官方网站,越来越多的AI厂商运转拥抱开源。阿里巴巴这次开源旗下视频生成模子万相2.1模子,标记着开源的界限正从大言语模子界限扩张至图像、视频等多模态大模子界限,有助于冲破本领壁垒,让更多的建立者和筹划东谈主员卤莽共同参与到AI篡改的程度中来。
发布于:广东省