VideoTetrisVideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。
BookScribiBookScribi是一个非虚构和诗歌书籍创作平台,由人工智能驱动。无需写作。用户可以快速生成完整的书籍,支持任何语言,适用于自我出版平台。BookScribi提供Amazon KDP准备的文件,适用于建立书籍业务或个人品牌。界面简单直观,无需技术技能。
One Shot Talking FaceOne Shot Talking Face是一个基于Hugging Face的应用程序,可以通过上传一张人脸照片,生成一个能够说话的人脸视频。它具有简单易用的界面,支持自定义文本和语音风格,适用于娱乐、教育和广告等领域。