Roll Art Die

1年前发布 42 0 0

在您的Apple Silicon设备上使用StableDiffusion。仅使用文本生成AI艺术品。将您的梦想艺术品变成现实。无需云订阅。

收录时间：

2025-05-30

打开网站手机查看

图像生成 # 图像生成

Roll Art Die

Roll Art Die

在您的Apple Silicon设备上使用StableDiffusion。仅使用文本生成AI艺术品。将您的梦想艺术品变成现实。无需云订阅。

数据统计

相关导航

CAP4D

CAP4D是一种利用可变形多视图扩散模型（Morphable Multi-View Diffusion Models）来创建4D人像化身的技术。它能够从任意数量的参考图像生成不同视角和表情的图像，并将其适配到一个4D化身上，该化身可以通过3DMM控制并实时渲染。这项技术的主要优点包括高度逼真的图像生成、多视角的适应性以及实时渲染的能力。CAP4D的技术背景是基于深度学习和图像生成领域的最新进展，尤其是在扩散模型和3D面部建模方面。由于其高质量的图像生成和实时渲染能力，CAP4D在娱乐、游戏开发、虚拟现实等领域具有广泛的应用前景。目前，该技术是免费提供代码的，但具体的商业化应用可能需要进一步的授权和定价。

Storytelling Chatbot

该产品利用 Gemini 2.0 语言模型和 Google Imagen 图像生成技术，结合语音识别和语音合成，为用户提供一个互动式的故事创作体验。用户可以通过语音输入选择故事走向，系统会实时生成故事内容和相关图像。该产品的主要优点是创新的交互方式和强大的内容生成能力，适合用于教育、娱乐和创意启发。目前该产品处于开源阶段，未明确具体定价，主要面向开发者和教育机构。

Microsoft Copilot for Mac

Microsoft Copilot是一款由微软开发的AI助手应用，基于OpenAI和微软的AI技术，旨在为用户提供高效、便捷的智能助手服务。它能够帮助用户快速获取信息、生成文本和图像，提升工作效率和创造力。该应用支持多种语言，界面简洁易用，适合不同用户群体。它不仅适用于个人生活，还能在商业和教育场景中发挥重要作用，是一款免费的生产力工具。

Stock AI

每次都能获得完美的图片。无论您需要什么样的图片，我们都可以帮您找到，并立即为您创建它。

WHAM

WHAM（World and Human Action Model）是由微软研究院开发的一种生成式模型，专门用于生成游戏场景和玩家行为。该模型基于Ninja Theory的《Bleeding Edge》游戏数据训练，能够生成连贯、多样化的游戏视觉和控制器动作。WHAM 的主要优点在于其能够捕捉游戏环境的3D结构和玩家行为的时间序列，为游戏设计和创意探索提供了强大的工具。该模型主要面向学术研究和游戏开发领域，帮助开发者快速迭代游戏设计。

Dreamer

将稳定扩散集成到Notion中，使用新的削减命令AI生成图像。

NanoBananaAPI.ai

Nano Banana API 提供 AI 图像生成与编辑接口，支持自然语言编辑、角色一致性保障、多图合成等功能。其主要优点在于高效稳定的性能、逼真写实效果和多图合成创意构图。

OminiControl

OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制（如边缘引导和图像修复生成）。OminiControl的设计非常精简，仅引入了基础模型0.1%的额外参数，同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发，代表了人工智能领域中图像生成和控制技术的最新进展。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...