Diffusion as Shader

1年前发布 46 0 0

Diffusion as Shader (DaS) 是一种创新的视频生成控制模型，旨在通过3D感知的扩散过程实现对视频生成的多样化控制。该模型利用3D跟踪视频作为控制输入，能够在统一的架构下支持多种视频控制任务，如网格到视频生成、相机控制、运动迁移和对象操作等。DaS的主要优势在于其3D感知能力，能够有效提升生成视频的时间一致性，并在短时...

收录时间：

2025-05-29

打开网站手机查看

视频创作 # 3D感知 # 扩散模型 # 控制任务 # 统一架构 # 视频生成

Diffusion as Shader

Diffusion as Shader

Diffusion as Shader (DaS) 是一种创新的视频生成控制模型，旨在通过3D感知的扩散过程实现对视频生成的多样化控制。该模型利用3D跟踪视频作为控制输入，能够在统一的架构下支持多种视频控制任务，如网格到视频生成、相机控制、运动迁移和对象操作等。DaS的主要优势在于其3D感知能力，能够有效提升生成视频的时间一致性，并在短时间内通过少量数据微调即可展现出强大的控制能力。该模型由香港科技大学等多所高校的研究团队共同开发，旨在推动视频生成技术的发展，为影视制作、虚拟现实等领域提供更为灵活和高效的解决方案。

数据统计

相关导航

ASMR.so

ASMR.so是基于先进的 VEO3 AI 技术的平台，用户可以快速生成专业的 ASMR 视频。该产品支持多种 ASMR 类型，包括耳语、敲击、自然声音等，旨在为用户提供放松和享受的体验。其主要优势在于视频生成速度快（通常在 2 分钟内完成），高清质量以及用户友好的操作流程。适合视频创作者、ASMR 爱好者以及需要放松内容的用户。该平台还提供灵活的信用系统，用户可根据需求选择套餐。产品价格方面，有免费试用和付费套餐可供选择。

MM_StoryAgent

MM_StoryAgent 是一个基于多智能体范式的故事视频生成框架，它结合了文本、图像和音频等多种模态，通过多阶段流程生成高质量的故事视频。该框架的核心优势在于其可定制性，用户可以自定义专家工具以提升每个组件的生成质量。此外，它还提供了故事主题列表和评估标准，便于进一步的故事创作和评估。MM_StoryAgent 主要面向需要高效生成故事视频的创作者和企业，其开源特性使得用户可以根据自身需求进行扩展和优化。

OmniHuman-1

OmniHuman-1 是一个端到端的多模态条件人类视频生成框架，能够基于单张人像和运动信号（如音频、视频或其组合）生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题，支持任意宽高比的图像输入，生成逼真的人类视频。它在弱信号输入（尤其是音频）方面表现出色，适用于多种场景，如虚拟主播、视频制作等。

Wan2.1-FLF2V-14B

Wan2.1-FLF2V-14B 是一个开源的大规模视频生成模型，旨在推动视频生成领域的进步。该模型在多项基准测试中表现优异，支持消费者级 GPU，能够高效生成 480P 和 720P 的视频。它在文本到视频、图像到视频等多个任务中表现出色，具有强大的视觉文本生成能力，适用于各种实际应用场景。

Adobe Firefly生成视频

Adobe Firefly 是一款基于人工智能技术的视频生成工具。它能够根据用户提供的简单提示或图像快速生成高质量的视频片段。该技术利用先进的 AI 算法，通过对大量视频数据的学习和分析，实现自动化的视频创作。其主要优点包括操作简单、生成速度快、视频质量高。Adobe Firefly 面向创意工作者、视频制作者以及需要快速生成视频内容的用户，提供高效、便捷的视频创作解决方案。目前该产品处于 Beta 测试阶段，用户可以免费使用，未来可能会根据市场需求和产品发展进行定价和定位。

mochi-1-preview

这是一个先进的视频生成模型，采用 AsymmDiT 架构，可免费试用。它能生成高保真视频，缩小了开源与闭源视频生成系统的差距。模型需要至少 4 个 H100 GPU 运行。

DreamASMR

DreamASMR利用Veo3 ASMR技术创造令人放松的视频内容，提供先进的AI视频生成、双耳声音和巨细靡遗的视觉体验，是终极ASMR体验。

Seedance AI

Seedance AI是由ByteDance推出的视频生成器，利用Seedance 1.0 Pro技术实现专业电影级质量。用户可以通过简单的文本或图像提示生成具有电影感的视频。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...