TransPixar.proTransPixar 是一款基于先进人工智能技术的透明视频生成工具。它采用创新的 DiT 架构,能够将文本描述快速转化为高质量的透明视频,实现 RGB 和 Alpha 通道的完美对齐。该技术对于创意制作领域具有重要意义,能够极大提升创作效率,降低制作成本,为视觉特效、动画制作等行业带来全新的解决方案。目前,该产品主要面向创意专业人士,提供高效、专业的透明视频生成服务,具体价格未明确提及,但从其定位来看,可能属于付费范畴。
Runway Aleph AIAleph AI是建立在Runway Aleph上的AI视频编辑平台,通过直观的自然语言命令,实现对象编辑、场景角度变化和风格及灯光调整,为用户提供前所未有的创意控制力。价格方面,允许商业使用并提供即时处理,消除了创意愿景与最终输出之间的障碍。
SoraVidsSoraVids是一个基于Hugging Face平台的视频生成模型Sora的存档库。它包含了87个视频和83个对应的提示,这些视频和提示在OpenAI撤销API密钥前被公开展示。这些视频均为MIME类型video/mp4,帧率为30 FPS。SoraVids的背景是OpenAI的视频生成技术,它允许用户通过文本提示生成视频内容。这个存档库的重要性在于它保存了在API密钥被撤销前生成的视频,为研究和教育提供了宝贵的资源。
Kawara AIKawara AI 是一款面向视频创作者的 AI 工具,通过智能组织和搜索视频文件,帮助用户高效管理视频素材。其核心功能包括自动剪辑、视频搜索和无缝集成等,旨在提升视频创作的生产力。产品目前提供免费试用,定位为视频创作者的得力助手,致力于简化视频编辑流程,节省时间和精力。
OmniHuman-1OmniHuman-1 是一个端到端的多模态条件人类视频生成框架,能够基于单张人像和运动信号(如音频、视频或其组合)生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题,支持任意宽高比的图像输入,生成逼真的人类视频。它在弱信号输入(尤其是音频)方面表现出色,适用于多种场景,如虚拟主播、视频制作等。
PPLLaVAPPLLaVA是一个高效的视频大型语言模型,它结合了细粒度视觉提示对齐、用户指令的卷积风格池化的视觉令牌压缩以及CLIP上下文扩展。该模型在VideoMME、MVBench、VideoChatGPT Bench和VideoQA Bench等数据集上建立了新的最先进结果,仅使用1024个视觉令牌,吞吐量提高了8倍。