CogVideoX-2B

1年前发布 83 0 0

CogVideoX-2B是一个开源的视频生成模型，由清华大学团队开发。它支持使用英语提示语言生成视频，具有36GB的推理GPU内存需求，并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入，目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署，能够根据文本提示生成视频，具...

收录时间：

2025-05-29

打开网站手机查看

视频生成 # AI创作 # 开源模型 # 视频生成

CogVideoX-2B

CogVideoX-2B

CogVideoX-2B是一个开源的视频生成模型，由清华大学团队开发。它支持使用英语提示语言生成视频，具有36GB的推理GPU内存需求，并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入，目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署，能够根据文本提示生成视频，具有高度的创造性和应用潜力。

数据统计

相关导航

Follow-Your-Pose

Follow-Your-Pose是一个文本到视频生成的模型，它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。这项技术在数字人物创作领域具有重要应用价值，解决了缺乏综合数据集和视频生成先验模型的限制。通过两阶段训练方案，结合预训练的文本到图像模型，实现了姿势可控的视频生成。

Xpression Camera

Xpression Camera是一个屡获殊荣的虚拟摄像机应用程序，允许用户通过一张照片立即变身为任何带有面部的人或物，无需任何处理时间。xpression相机可以让用户在实时聊天（例如Zoom）、在Twitch直播或创建YouTube视频时实时重新定义他们的屏幕角色。

AppMall应用商店

AppMall是一个创新的网页端AI应用商店，致力于为用户打造一个高效、灵活的AI应用生态系统。AppMall提供多种AI应用供用户安装和使用，通过直观的界面以及便捷的操作，用户可以轻松管理AI应用、下载模型。无论是数据处理、模型训练，还是部署智能应用，AppMall AI应用中心都可以为您提供便捷的解决方案。

DeepFuze

DeepFuze是与ComfyUI无缝集成的先进深度学习工具，用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法，DeepFuze使用户能够以无与伦比的真实性结合音频和视频，确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

Darwin Studio

Darwin Studio是一款AI图像、视频和广告生成器，通过使用AI技术和算法，帮助用户快速生成高质量的图像、视频和广告。它具有高效、智能、创新的特点，可以大大提升创意工作效率。

ComfyUI-LumaAI-API

ComfyUI-LumaAI-API是一个为ComfyUI设计的插件，它允许用户直接在ComfyUI中使用Luma AI API。Luma AI API基于Dream Machine视频生成模型，由Luma开发。该插件通过提供多种节点，如文本到视频、图像到视频、视频预览等，极大地丰富了视频生成的可能性，为视频创作者和开发者提供了便捷的工具。

Audiolabs

将您的播客转换为适合TikTok、YouTube Shorts和Reels的短视频。吸引新的播客听众，实现商业目标。在短视频平台上发布视频剪辑，可作为“钩子”吸引听众发现您的内容库，并收听完整的剪辑或其他营销目标。

Dream Machine API

Dream Machine API是一个创意智能平台，它提供了一系列先进的视频生成模型，通过直观的API和开源SDKs，用户可以构建和扩展创意AI产品。该平台拥有文本到视频、图像到视频、关键帧控制、扩展、循环和相机控制等功能，旨在通过创意智能与人类合作，帮助他们创造更好的内容。Dream Machine API的推出，旨在推动视觉探索和创造的丰富性，让更多的想法得以尝试，构建更好的叙事，并让那些以前无法做到的人讲述多样化的故事。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...