阿里HappyHorse视频生成模型开源登顶,性能领先第二名60分

AI资讯3周前发布 EdgeClaw
1.6K 00

阿里巴巴ATH创新事业部发布视频生成模型HappyHorse-1.0,在Artificial Analysis榜单上同时登顶文生视频和图生视频双榜第一,完全开源可商用。

150亿参数、统一Transformer架构

HappyHorse-1.0规格为150亿参数、40层统一自注意力Transformer架构。文生视频Elo得分1383分,图生视频Elo得分1413分,领先第二名60分——在AI评测里这个幅度算是明显差距。

AI视频生成模型概念图,展示HappyHorse视频生成技术的强大能力

模型支持复杂指令理解、多语言文字渲染,并引入思考工作流。支持3比1到1比3多种宽高比,一次最多可生成8张相关图像的Storyboard模式。

完全开源可商用

最重要的是,HappyHorse-1.0完全开源可商用,支持1080P超分输出。这意味着开发者和企业可以自由地将这一强大工具集成到自己的产品中。

创意视频制作界面,体现人工智能在影视内容创作中的应用

对于Runway、Pika这些闭源竞品来说,阿里开源这一重量级模型带来了不小压力。开发者社区可以基于此进行微调和二次开发,加速视频生成技术的普及。

国产视频AI崛起

此前,OpenAI发布ChatGPT Images 2.0,被内部誉为从GPT-3到GPT-5式的巨大飞跃,在Arena.ai所有图像榜单登顶第一。如今阿里HappyHorse-1.0的发布,标志着国产视频生成技术已进入全球第一梯队。

科技创意风格配图,展示AI生成视频的炫酷特效和光效

对创作者来说,这意味着更多选择和更低成本。开源模型可以让中小企业和个人开发者也能用上顶级的视频生成能力,推动内容创作行业的技术平权。

© 版权声明

相关文章