图像生成 - 优选网址大全 - 汇聚全网精品网站，打造高效安全上网体验图像生成官网，图像生成导航为您提供服务，精心挑选，安全无毒，找图像生成网址就来优选网址大全 - 汇聚全网精品网站，打造高效安全上网体验，这里收集全网最全的网站资源。 - 优选网址大全

排序

发布更新浏览点赞

Meta AI 图像生成工具

Meta AI 提供了一个创意激发平台，用户可以通过简单的描述生成各种风格和主题的图像，从未来主义时装秀到抽象绘画，激发无限创意。

010

# AI # AI绘画 # Meta

YouArt

Youart是一体化AI创意工作室，提供强大的AI图像和视频生成器，通过文本提示将您的想法转化为令人惊叹的视觉作品。

020

图像生成 # AI # 图像生成 # 视频生成

nanobananas

NanoBananas使用先进的AI技术，以秒级速度生成高质量图像，无需设计技能。其主要优点包括快速生成、多图像合并编辑、生成迷因等功能。产品定位于为创作者提供快速、简单、高质量的图像生成服务。

020

社交媒体 # AI # 图像生成 # 社交媒体营销

NanoBananaAPI.ai

Nano Banana API 提供 AI 图像生成与编辑接口，支持自然语言编辑、角色一致性保障、多图合成等功能。其主要优点在于高效稳定的性能、逼真写实效果和多图合成创意构图。

020

图像生成 # 写实效果 # 图像生成 # 图片编辑

暗壳 AI

暗壳 AI 是一款专注于设计领域的 AI 工具，致力于提高设计师的工作效率和降低设计成本。通过丰富的功能和专业级的数据支持，暗壳 AI 帮助用户快速生成高质量的设计效果图及营销素材，适合家居行业等多个领域的应用。价格合理，为用户提供了高效的设计解决方案。

020

社交媒体 # AI 设计 # 创意 # 图像生成

FantasyPortrait

FantasyPortrait 是一种高保真、多情感的肖像动画生成框架，使用表达增强学习策略来捕捉细腻的面部动态，适合单角色和多角色场景。该技术的优势在于其独特的掩蔽交叉注意机制，有效防止了特征干扰，提升了动画的质量与表现力。该产品背景源于对现有面部动画方法的不足的反思，尤其是在处理多角色互动时的挑战。未来将以开源形式提供代码与模型，鼓励研究与开发。

020

图像生成 # 动画 # 图像生成 # 多角色

Fluxx.AI

FLUX.1 Kontext是一款革命性的多模态AI模型，将文本指令与图像编辑和生成相结合，实现精准本地化编辑，保持角色一致性和风格连贯性。该产品适用于营销内容创作、电影制作和设计等专业工作流程。

020

文案写作 # AI图像编辑 # 图像生成 # 多模态

Inker AI

Inker.AI 是一个在线的 AI 纹身生成器，允许用户通过上传照片或输入文字来创建个性化的纹身设计。该平台无需设计技能，用户只需简单操作即可生成专业纹身。适合各类人群，特别是艺术爱好者和纹身爱好者。产品免费使用，易于上手，具有极高的灵活性和创造力。

020

图像生成 # AI # 个性化 # 图像生成

Ainanobanana AI

Nano Banana AI是一款使用先进AI技术的图像生成器和编辑器，能够通过简单的文本提示即时将文字转换为图像。它的AI模型领先于其他传统模型，具有高度准确性和速度。

020

艺术创作 # AI # 人脸识别 # 图像增强

AI Banana Image Generator

AI Banana 是一款先进的图像编辑平台，利用 Nano Banana AI 技术，通过自然语言处理实现 1-2 秒内的图像生成与编辑。该产品适合各种创意需求，包括电子商务、市场营销和设计等领域。价格灵活，提供按需购买和订阅服务，满足不同用户的需求。

020

图像生成 # AI # 创意设计 # 图像生成

AI Fiesta

AI Fiesta提供了多个顶级AI模型，让用户可以比较模型回答，并选择最适合每项任务的AI。该产品的主要优点在于聚合了多个顶尖AI模型，提供便捷的比较功能，价格合理且功能强大。

020

图像生成 # 图像生成 # 多模型对比 # 实时回答

UnificAlly

UnificAlly是一家AI API服务平台，提供创新的AI模型和API服务，价格优惠。用户可以访问平台并选择各种先进的AI模型，如GPT 4.1、Suno、Higgsfield等，用于视频生成、图像创作、音乐作曲等。UnificAlly致力于提供高性价比的AI服务，并以快速可靠的API响应、简单易集成的REST API和详尽的文档和示例著称。

020

图像生成 # AI服务 # API # 图像生成

Image FX

ImageFX是由Google强大的AI技术驱动的先进AI图像生成器，将简单的文本提示转化为令人惊叹的图像。其主要优点包括生成高品质、详细的图像、快速操作、精准控制、Google AI支持、广泛应用、用户友好界面。价格分为免费、基础和高级三个选项，适用于艺术家、设计师、营销人员等。

020

图像生成 # AI # Google技术 # 图像生成

OmniGen2

OmniGen2 是一个高效的多模态生成模型，结合了视觉语言模型和扩散模型，能够实现视觉理解、图像生成及编辑等功能。其开源特性为研究人员和开发者提供了强大的基础，助力个性化和可控生成 AI 的探索。

020

图像生成 # 人工智能 # 图像生成 # 图像编辑

Openjourney

Openjourney 是一个高保真的开源项目，旨在模拟 MidJourney 的界面，利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像，以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者，提供了用户友好的界面和实时生成体验，能够助力创意工作与项目开发。

020

图像生成 # AI # Midjourney # 图像生成

Grok Imagine

Grok Imagine是由Aurora引擎驱动的AI图像和视频生成平台，可生成多领域的逼真图像和动态视频内容。其核心技术基于Aurora引擎的自回归图像模型，为用户提供高质量、多样化的视觉创作体验。

020

搜索引擎优化 # AI # Aurora引擎 # 图像生成

SOREAL

SOREAL.AI稳定扩散服务|AI图像生成器|稳定扩散在线工作室|Dreambooth微调和培训|文本到图像AI图像生成

020

AI智能绘画 AI赋能 # AI免费图像 # ai图像生成器 # ai图象

AI Genie

AI Genie是一个图像与艺术生成的应用程序，可以通过连接到Apple Music来生成数字艺术品。

020

AI图像与设计 # AI艺术 # 图像生成 # 应用程序

Diffusion Land

Diffusion Land允许您使用各种AI模型生成图像。他们还提供了几个预先构建的概念，可用于生成某些类型的图像。

020

图像生成 # 图像生成

AI Image Variations Generator

DALL-E AI是一款基于人工智能技术的图像生成工具，能够根据用户提供的文字描述，创造出富有想象力和视觉震撼力的图像作品，适用于艺术创作、设计作品和广告宣传等多个领域。

020

图像AI 图像编辑 # DALL-E AI # 图像生成

PixelCNN

PixelCNN++是一种基于PixelCNN的生成模型，具有可计算的似然函数和易于采样的特点，适用于图像生成和数据增强等应用场景。

020

图像AI 图像生成器 # 图像生成 # 生成模型

神采PromeAI- 让创意照进现实

神采PromeAI是一个非常有用的工具，它可以帮助您将创意变为现实。如果您希望实现自己的设计想法、为品牌形象定制一个设计方案或为企业提供市场推广解决方案，PromeAI会是一个好的选择。

020

AI办公 AI商业 # AI绘画 # 共享平台 # 图像生成

SketchGPT

上传您的产品草图，看看您的产品在不同主题中的外观。100%免费。将阴影应用于草图以增加深度和维度，同时保持干净的背景。

020

AI智能绘画 AI赋能 # AI免费图像 # ai图像生成器 # ai图象

Openjourney Bot

Openjourney是一款强大的AI图像生成工具，能够帮助您生成出色的AI图像，修复人脸，交换人脸，移除背景，进行图像编辑，并提供AI聊天等功能。

020

图像AI 图像生成器 # AI艺术 # 图像生成

ForefrontChat

GPT-4、图像生成、自定义角色、可分享的聊天

010

AIGC互动平台 AI聊天机器人 # GPT-4 # 可分享的聊天 # 图像生成

DALL-E Bro

DALL-E Bro是一款基于OpenAI DALL-E 2算法的Figma和FigJam插件，可以通过输入文字描述快速生成符合要求的图像，帮助设计师提高工作效率。

020

图像AI 图像生成器 # 图像生成 # 查件

达芬奇——你的AI创作大师

达芬奇是一个具有极高创造力和实用性的人工智能创作大师，它可以创建逼真的图像、插图，图形并能够视觉化自然语言的描述，更是一个重大的技术突破，将人工智能技术引入了艺术领域，为数字创意、广告设计、游戏开发等领域的创作者提供了极大的帮助。

020

AI助手 AI图像 # AI绘画 # 图像生成 # 文本转图像

Usp.ai

USP.ai是一款强大的生成式人工智能操作系统，帮助博客作者、文案撰写人员和出版商增强他们的文章和出版物的视觉效果。它提供了一系列功能，包括AI生成的提示和图片、一站式操作面板、AI提示库、高级分享功能等。用户可以轻松创建令人着迷的图片，完美补充其文字内容，并拥有完全的图片拥有权。

020

图像AI 图像生成器 # 图像生成 # 文案

Tinder Glowup

Tinder Glowup是一个AI医疗健康管理网站，可以生成显示腹肌外观的图像。

010

AI医疗与健康 # Tinder Glowup # 图像生成 # 腹肌训练

Dreamlike

Create stunning AI Art in seconds with Stable Diffusion. Upscale your images, create variations, fix faces, share your art, and more.

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI图像生成

Dezgo

Dezgo是一个AI图像艺术创作网站，可以从任何文本提示生成高质量的图像。享受慷慨的免费套餐，提供一般和动漫模型。

020

AI图像与设计 # AI图像创作 # Dezgo # 人工智能

Enterpix

AI生成图像搜索引擎。

020

图像生成 # 图像生成

Awesome GPT-4o Images

Awesome GPT-4o Images 是一个展示 OpenAI 最新多模态模型 GPT-4o 生成的图片和提示的集合。该产品充分展示了 GPT-4o 在文本与图像理解方面的能力，支持多种艺术风格的生成。它适合设计师、艺术创作者和任何对 AI 艺术感兴趣的人。该项目是免费开放的，旨在激发创作灵感并推动 AI 艺术的发展。

020

艺术创作 # AI 艺术 # 创意设计 # 图像生成

shou_xin

shou_xin是一个基于文本到图像的生成模型，它能够根据用户提供的文本提示生成具有手訫风格的铅笔素描图像。这个模型使用了diffusers库和lora技术，以实现高质量的图像生成。shou_xin模型以其独特的艺术风格和高效的图像生成能力在图像生成领域占有一席之地，特别适合需要快速生成具有特定艺术风格的图像的用户。

020

文案写作 # Diffusers # LORA # 图像生成

flux-lora-collection

flux-lora-collection是由XLabs AI团队发布的一系列针对FLUX.1-dev模型的LoRAs训练检查点。该模型集合支持多种风格和主题的图像生成，如动物拟人化、动漫、迪士尼风格等，具有高度的可定制性和创新性。

020

艺术创作 # AI艺术 # 图像生成 # 非商业用途

Blip 3o

Blip 3o 是一个基于 Hugging Face 平台的应用程序，利用先进的生成模型从文本生成图像，或对现有图像进行分析和回答。该产品为用户提供了强大的图像生成和理解能力，非常适合设计师、艺术家和开发者。此技术的主要优点是其高效的图像生成速度和优质的生成效果，同时还支持多种输入形式，增强了用户体验。该产品是免费的，定位于开放给广大用户使用。

010

文案写作 # 人工智能 # 图像生成 # 文本到图像

Stock AI

每次都能获得完美的图片。无论您需要什么样的图片，我们都可以帮您找到，并立即为您创建它。

020

图像生成 # 图像生成

云景AI绘图平台

AI画图工具，输入文本生成图像，二次元、写实、人物、风景、设计素材，支持中文，图像库分享

020

AI智能绘画 AI赋能 # AI绘画 # 人工智能绘画 # 图像处理

魔法AI绘画

020

图像生成 # AI # 创意工具 # 图像生成

SD Image

SD Image的Stable Diffusion 3.5 Image Generator是一个在线图像生成器，它利用最新的Stable Diffusion 3.5模型，包括Medium, Large, Large Turbo，来生成高质量的图像。这项技术的重要性在于它能够通过文本提示（prompt）快速生成图像，为设计师、艺术家和创意工作者提供灵感和便利。产品背景信息显示，SD Image是一个在线平台，用户可以通过它找到灵感、生成图像、探索不同的prompt和模型。目前，该产品提供免费试用，适合需要快速生成图像的用户。

020

艺术创作 # AI艺术 # 免费试用 # 创意工具

Jrnylist

AI绘画是一项创新的技术，通过人工智能的算法和计算机的图像处理技术，可以让我们轻松地创建出美丽的绘画作品。

010

AI在线工具 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

Storytelling Chatbot

该产品利用 Gemini 2.0 语言模型和 Google Imagen 图像生成技术，结合语音识别和语音合成，为用户提供一个互动式的故事创作体验。用户可以通过语音输入选择故事走向，系统会实时生成故事内容和相关图像。该产品的主要优点是创新的交互方式和强大的内容生成能力，适合用于教育、娱乐和创意启发。目前该产品处于开源阶段，未明确具体定价，主要面向开发者和教育机构。

020

图像生成 # AI # 图像生成 # 娱乐

腾讯混元图像 2.0

020

图像生成 # AI # 创作 # 图像生成

Flux Lora Online

Flux Lora Online 是一个在线平台，提供多种 Flux Lora 模型，用于生成各种风格的图像。这些模型包括但不限于写实风格、动漫风格、迪士尼风格等，能够满足不同用户对图像生成的多样化需求。平台采用先进的图像生成技术，提供高分辨率和细节丰富的图像，同时拥有用户友好的界面，简化工作流程，提高生产力。

010

艺术创作 # 图像生成 # 在线平台 # 艺术创作

Problembo Anime Generator

Problembo是一款基于机器学习的动漫形象生成工具，帮助用户创作独特的动漫风格的图片和头像，适用于社交媒体、游戏角色设计和插画创作等场景。

010

AI绘画生成器图像AI # 动漫风格 # 图像生成 # 头像制作

Omni-Zero-Couples

Omni-Zero-Couples是一个使用diffusers管道的零样本风格化情侣肖像创作模型。它利用深度学习技术，无需预先定义的风格样本，即可生成具有特定艺术风格的情侣肖像。这种技术在艺术创作、个性化礼物制作和数字娱乐领域具有广泛的应用前景。

020

艺术创作 # 图像生成 # 情侣肖像 # 深度学习

AI Dreamer

AI梦想家是一款AI艺术生成器APP，可在App Store中下载。用户可通过输入单词、添加风格和艺术家灵感来创作艺术。该应用程序仅需不到3秒即可生成可视化效果，用户可以将其与朋友分享。AI梦想家也可提供俄语版本。

020

AI图像与设计 # AI艺术生成器 # 图像生成 # 艺术创作

ogImage.click

Free OG Image Generator 是一个在线工具，旨在帮助用户快速生成用于社交媒体的高质量预览图像，如 Open Graph 图像、Twitter/X 头图等。该工具的主要优点在于其简单易用且完全免费，用户无需注册即可访问所有功能。它提供了多种专业设计的模板，支持自定义背景、渐变色、网格叠加等高级功能，能够满足不同用户的设计需求。该工具的背景信息显示其由开发者 Jude Wei 创建，旨在为用户提供一个无需复杂软件即可快速制作专业图像的平台。

020

社交媒体 # Open Graph # 免费 # 图像生成

Ideogram.ai

Ideogram由前Google Brain研究人员创立，其图像生成器在生成带有文本的图像方面具有独特优势——它可以以不同的字体、大小、颜色、样式可靠地呈现图像中的字母、词汇和标志，而这一点一直是其他AI图像生成器需要攻克的难题。 Ideogram已经推出了公测版，该公司在其ideogram.ai上提供了多种预设图像生成样式，其中包括一种标记为“版式”的样式，它可以以不同的颜色、字体、大小和样式呈现字母。其他预设风格包括3D 渲染、电影、绘画、时尚、产品、插图、概念艺术、浮世绘等。您可以一次选择多种样式并应用它们。用户可以在其网站ideogram.ai上使用多个预设样式生成图像，其中“排版”样式最显著，可以自定制图像中的文本效果。Ideogram在Discord 服务器和网络应用程序已经提供了很多人们生成文字和带有文字的图像的示例。

010

Logo生成 # LOGO图像生成 # 图像生成 # 插图生成

F Lite

F Lite 是由 Freepik 和 Fal 开发的一个大型扩散模型，具有 100 亿个参数，专门训练于版权安全和适合工作环境 (SFW) 的内容。该模型基于 Freepik 的内部数据集，包含约 8000 万张合法合规的图像，标志着公开可用的模型在这一规模上首次专注于合法和安全的内容。它的技术报告提供了详细的模型信息，并且使用了 CreativeML Open RAIL-M 许可证进行分发。该模型的设计旨在推动人工智能的开放性和可用性。

030

图像生成 # AI 模型 # 图像生成 # 开源

Microsoft Copilot for Mac

Microsoft Copilot是一款由微软开发的AI助手应用，基于OpenAI和微软的AI技术，旨在为用户提供高效、便捷的智能助手服务。它能够帮助用户快速获取信息、生成文本和图像，提升工作效率和创造力。该应用支持多种语言，界面简洁易用，适合不同用户群体。它不仅适用于个人生活，还能在商业和教育场景中发挥重要作用，是一款免费的生产力工具。

010

图像生成 # AI助手 # 创意激发 # 图像生成

Worlds of Frames

Frames 是 Runway 的核心产品之一，专注于图像生成领域。它通过深度学习技术，为用户提供高度风格化的图像生成能力。该模型允许用户定义独特的艺术视角，生成具有高度视觉保真度的图像。其主要优点包括强大的风格控制能力、高质量的图像输出以及灵活的创作空间。Frames 面向创意专业人士、艺术家和设计师，旨在帮助他们快速实现创意构思，提升创作效率。Runway 提供了多种使用场景和工具支持，用户可以根据需求选择不同的功能模块。价格方面，Runway 提供了付费和免费试用的选项，以满足不同用户的需求。

020

艺术创作 # 创意工具 # 图像生成 # 深度学习

DEll-E2

DALL·E是一种基于神经网络的图像生成模型，可以根据文本描述创造逼真的图像，具有高保真度和可控性强的特点，适用于广告设计、艺术创作和产品原型制作等多种应用场景。

020

AI绘画生成器图像AI # 图像生成 # 文本描述 # 文本转图像

高查理

点击一个按钮就可以创建图片、博客广告、网站标题。

020

图像生成 # 图像生成

SLD (Self-correcting LLM-controlled Diffusion Models)

SLD是一个自纠正的LLM控制的扩散模型框架，它通过集成检测器增强生成模型，以实现精确的文本到图像对齐。SLD框架支持图像生成和精细编辑，并且与任何图像生成器兼容，如DALL-E 3，无需额外训练或数据。

020

艺术创作 # AI艺术 # 图像生成 # 扩散模型

Maker AI

Maker AI是一个拥有最强大的AI内容生成工具套件的网站。它提供了多种AI工具，包括AI写作和图像生成。

020

AI写作与文本 # AI写作 # Maker AI # 内容生成

Simagizer

Simagizer是一款浏览器扩展程序，可以帮助用户对网页上的文本进行摘要，并生成可视化的摘要图像，方便分享和保存。

020

AI摘要文本AI # 免费 # 图像生成 # 摘要

迪沃

令人惊叹的摄影和带有 AI 的头像，一个由AI驱动的产品图片生成网站。产品摄影设置、头像、照片背景与AI。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

Adobe Firefly (Beta)

Adobe Firefly (Beta) 尝试最新的生成人工智能，让我们知道你的想法。

020

AI设计工具 AI赋能 # 3D角色设计 # Adobe Firefly # Adobe人工智能

WHAM

WHAM（World and Human Action Model）是由微软研究院开发的一种生成式模型，专门用于生成游戏场景和玩家行为。该模型基于Ninja Theory的《Bleeding Edge》游戏数据训练，能够生成连贯、多样化的游戏视觉和控制器动作。WHAM 的主要优点在于其能够捕捉游戏环境的3D结构和玩家行为的时间序列，为游戏设计和创意探索提供了强大的工具。该模型主要面向学术研究和游戏开发领域，帮助开发者快速迭代游戏设计。

020

图像生成 # 图像生成 # 学术研究 # 游戏开发

Open-MAGVIT2

Open-MAGVIT2是由腾讯ARC实验室开源的一个自回归图像生成模型系列，包含从300M到1.5B不同规模的模型。该项目复现了Google的MAGVIT-v2分词器，实现了在ImageNet 256×256数据集上达到1.17 rFID的先进重建性能。通过引入不对称分词技术，将大词汇表分解为不同大小的子词汇表，并引入'下一个子标记预测'来增强子标记间的交互，以提高生成质量。所有模型和代码均已开源，旨在推动自回归视觉生成领域的创新和创造力。

010

销售管理 # 图像处理 # 图像生成 # 开源项目

Web Stable Diffusion

WebSD是一个将稳定扩散模型带到Web浏览器的项目，可以在浏览器内部自动创建逼真的图像和各种风格的图像。

000

其它AI工具科研助手 # 图像生成 # 稳定扩散模型

ComfyUI_HelloMeme

HelloMeme是一个集成了空间编织注意力（Spatial Knitting Attentions）的扩散模型，用于嵌入高级别和细节丰富的条件。该模型支持图像和视频的生成，具有改善生成视频与驱动视频之间表情一致性、减少VRAM使用、优化算法等优点。HelloMeme由HelloVision团队开发，属于HelloGroup Inc.，是一个前沿的图像和视频生成技术，具有重要的商业和教育价值。

020

图像生成 # 图像生成 # 扩散模型 # 空间编织注意力

EVEAI XYZ

EVEAI XYZ提供便捷的AI图像生成服务，支持多种模型和功能，助力用户高效创作个性化图像。

010

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI图像生成

ComfyUI-KwaiKolorsWrapper

ComfyUI-KwaiKolorsWrapper 是一个为 Kwai-Kolors 文本到图像模型设计的 Diffusers 包装器。它使用户能够通过 Diffusers 库方便地运行 Kwai-Kolors 的文本到图像生成流程。该插件支持从 Hugging Face 直接下载模型，并提供了量化模型以减少 VRAM 使用，适用于需要高效率图像生成的开发者和设计师。

020

艺术创作 # AI艺术 # Diffusers # Hugging Face

稳定扩散

稳定扩散是一个深度学习，文本到图像的模型，于2022年发布。主要用于生成基于文本描述的详细图像，但也可以应用于其他任务，如修复、超出原始边界以及生成由文本提示引导的图像到图像翻译。

020

图像生成 # 图像生成

智普AI

认知预训练模型是一种基于人工智能技术的大模型，具有强大的创造力和智能应答能力，可以用于诗词创作、图片生成、问题回答等多种应用场景。

020

AI绘画生成器图像AI # AI创作 # 图像生成

CreativeSynth

CreativeSynth是一款创新的统一框架，基于扩散模型，具有协调多模态输入和多任务处理的能力。通过将多模态特征与定制的注意力机制相结合，CreativeSynth实现了将现实语义内容导入艺术领域，通过反演和实时风格转换精确操纵图像风格和内容，同时保持原始模型参数的完整性。严格的定性和定量评估凸显了CreativeSynth在增强艺术图像的保真度方面的优势，并保留了它们固有的美学本质。通过弥合生成模型与艺术精髓之间的鸿沟，CreativeSynth成为定制数字调色板。

010

艺术创作 # 图像生成 # 艺术 # 风格转换

FLUX.1-dev

FLUX.1-dev是一个拥有12亿参数的修正流变换器，能够根据文本描述生成图像。它代表了文本到图像生成技术的最新发展，具有先进的输出质量，仅次于其专业版模型FLUX.1 [pro]。该模型通过指导蒸馏训练，提高了效率，并且开放权重以推动新的科学研究，并赋予艺术家开发创新工作流程的能力。生成的输出可以用于个人、科学和商业目的，具体如flux-1-dev-non-commercial-license所述。

020

艺术创作 # AI艺术 # 图像生成 # 文本到图像

Stability Matrix

Stability Matrix 是一个用户友好的桌面客户端，旨在简化 Stable Diffusion 的图像生成过程。它通过一键安装和无缝的模型集成，帮助用户轻松管理和生成图像，无需深入的技术知识。该工具支持多种操作系统，并能有效管理模型资源，降低用户的学习曲线。Stability Matrix 提供稳定性和灵活性，特别适合图像创作者、设计师及数字艺术家使用。

020

艺术创作 # Stable Diffusion # 图像生成 # 模型管理

InfiniteYou

InfiniteYou（InfU）是一个基于扩散变换器的强大框架，旨在实现灵活的图像重构，并保持用户身份。它通过引入身份特征并采用多阶段训练策略，显著提升了图像生成的质量和美学，同时改善了文本与图像的对齐。该技术对提高图像生成的相似性和美观性具有重要意义，适用于各种图像生成任务。

020

图像生成 # AI # 图像生成 # 扩散模型

OminiControl

OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制（如边缘引导和图像修复生成）。OminiControl的设计非常精简，仅引入了基础模型0.1%的额外参数，同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发，代表了人工智能领域中图像生成和控制技术的最新进展。

020

图像生成 # AI # Diffusion Transformer # f.lux

DanAI

DanAi Chat是由非洲人开发的人工智能助手，为非洲定制。它是AfricAi项目的一部分，提供本地语言输入、ChatGPT或Bard的强大功能，以及图像生成、PDF上传、电子商务、汇款等功能。体验非洲的人工智能未来。

020

电子商务 # PDF上传 # 人工智能 # 图像生成

DiscoDiffusion

DiscoDiffusion是一个分享AI图像艺术创作的社区，提供了使用Disco Diffusion进行艺术创作的指南。

020

AI图像与设计 # AI模型 # AI艺术 # Disco Diffusion

Interax

InteraxAI是一个无代码白标平台,提供可监控和可嵌入的AI小组件,无需编写任何代码。它允许无缝集成AI功能如文本补全、聊天机器人、图像生成等到网站、博客或SaaS平台中,开发者可以通过配置API和定制样式来 DIY AI小组件,同时可以通过会员计划或按使用次数收费来获利。关键词:聊天机器人、文本生成、图像生成、无代码、SaaS、API、嵌入式。

020

低代码/无代码 # API # SaaS # 图像生成

Artedge AI

Artedge AI是一个提供前沿AI工具的平台，旨在提升用户的创意过程。平台提供AI艺术生成器和AI亲吻生成器等工具，以快速生成高分辨率、高质量的艺术作品。这些工具不仅能够加速创意实现，还能提供独特的艺术体验，适合设计师、艺术家和创意爱好者。平台还提供定价计划，用户可以根据自己的需求选择合适的服务。

020

艺术创作 # AI艺术 # 创意工具 # 图像生成

Instantgen AI

Instantgen AI是一个基于人工智能的工具，可快速创建令人惊叹的内容，提高10倍的效率。使用Instantgen AI即可即时生成高质量的图像和文本，无需花费数小时进行设计和文案编写。

010

AI图像与设计 # Instantgen AI # 人工智能 # 图像生成

Image GPT

Image GPT是一种基于大型Transformer模型的生成模型，通过无监督学习可以生成高质量的图像，并提取出优秀的特征。

020

图像AI 图像生成器 # 图像生成 # 无监督学习

Qwen2vl-Flux

Qwen2vl-Flux是一个结合了Qwen2VL视觉语言理解能力的FLUX框架的先进多模态图像生成模型。该模型擅长基于文本提示和视觉参考生成高质量图像，提供卓越的多模态理解和控制。产品背景信息显示，Qwen2vl-Flux集成了Qwen2VL的视觉语言能力，增强了FLUX的图像生成精度和上下文感知能力。其主要优点包括增强的视觉语言理解、多种生成模式、结构控制、灵活的注意力机制和高分辨率输出。

020

图像生成 # 图像生成 # 多模态 # 深度学习

EasyControl

EasyControl 是一个为 Diffusion Transformer（扩散变换器）提供高效灵活控制的框架，旨在解决当前 DiT 生态系统中存在的效率瓶颈和模型适应性不足等问题。其主要优点包括：支持多种条件组合、提高生成灵活性和推理效率。该产品是基于最新研究成果开发的，适合在图像生成、风格转换等领域使用。

020

图像生成 # Diffusion Transformer # 图像生成 # 深度学习

Midlibrary 2.0

010

AI赋能 AI趣站 # 3D角色设计 # AI优化 # AI水彩画

atAI.world

atAI是一个全方位的人工智能平台，提供文本生成、图像生成、代码生成、聊天机器人、语音转文字等多种功能，帮助用户快速生成高质量的内容。

020

其它AI工具有趣的工具 # 人工智能 # 图像生成 # 文本生成

ImageKit AI

ImageKit AI是一个结合了人工智能和生成式AI的媒体处理和数字资产管理平台。它通过AI技术，如图像扩展、智能裁剪、背景移除、添加阴影、通过文本提示生成图像等，帮助用户提升媒体内容的质量和处理效率。ImageKit AI的背景是满足现代数字媒体管理的需求，它通过AI技术简化了图像处理流程，降低了成本，并提高了内容的个性化和质量。产品定位于为企业提供高效、智能的媒体内容管理解决方案。

010

社交媒体 # AI # 图像处理 # 图像生成

HiDream-I1

HiDream-I1 是一款新型的开源图像生成基础模型，拥有 170 亿个参数，能够在几秒内生成高质量图像。该模型适用于研究和开发，并在多个评测中表现优异，具有高效性和灵活性，适合用于各种创意设计和生成任务。

020

图像生成 # AI 技术 # 图像生成 # 开源模型

BrainFever

BrainFever.ai是一个应用程序，利用人工智能技术从文本描述中生成图像。它允许用户通过简单地描述他们想要看到的内容来创建独特而有趣的图像。PRO月费每月9.99美元，PRO年费每年49.99美元，两种选项每月包括200个信用点、访问所有内容和免费支持。

020

AI图像与设计 # AI # BrainFever # DALL-E

PicAI Image&Avatar Generator

PicAI Image&Avatar Generator是一款利用MJ的原生图像生成技术的应用。只需简单的描述，即可快速获得令人惊叹的高清AI图像，可用于创建标志、漫画、风景图片、照片、插图、头像、物品、角色、场景等各种场景和风格。此外，为了方便用户体验，我们预设了数十个MJ AI绘画指令。只需点击您喜欢的模板，即可获得您想要的图像，无需复杂的指令。经过多次迭代，我们的图像生成已经变得非常稳定和高效，而且我们的年度订阅费用仅为官方MJ费用的十分之一。

010

头像生成 # AI # 图像生成 # 图片生成

霍拉拉

霍拉拉，在几秒钟内使用 AI 创建动漫艺术品。

020

AI智能绘画 AI赋能 # AI免费图像 # ai图像生成器 # ai图象

Mann-E Art

Mann-E Art是由Mann-E公司开发的一款基于Stable Diffusion XL的图像生成模型，专注于生成接近midjourney艺术风格的图像。该模型在训练过程中使用了约1000个midjourney输出以及团队收集的照片，擅长生成照片、艺术作品和数字绘画，但在像素艺术或矢量插画方面可能表现一般。

020

艺术创作 # AI艺术 # Stable Diffusion XL # 图像生成

Image Variations: AI Generator

Image Variations: AI Generator是一款基于人工智能技术的图像生成工具，可以根据任何输入图像生成惊人的变体，帮助用户创造出独一无二的作品。

020

图像AI 图像编辑 # 人工智能 # 付费 # 图像生成

Brat Generator.design

Brat Generator是一个以Charli XCX的专辑封面风格为灵感的在线图像生成工具。它允许用户通过输入文本和选择背景颜色，快速生成具有个性化的专辑封面风格图像。该工具的主要优点是操作简单、快速生成图像，并且可以自定义字体风格和颜色。它适合那些希望在社交媒体上分享个性化图像的用户，尤其是音乐爱好者和创意内容创作者。目前该工具是免费的，旨在为用户提供一种轻松创建独特图像的方式。

020

社交媒体 # 个性化 # 创意 # 图像生成

稳定的扩散

众包的分布式集群稳定扩散的工人。还提供了一个客户端接口不需要安装和没有技术专长。

020

图像生成 # 图像生成

豆包桌面 AI 助手

豆包桌面 AI 助手是一款集成了多种 AI 功能的桌面应用程序，豆包电脑版客户端旨在提升用户的工作和学习效率。它通过 AI 划词翻译、搜索、AI 伴读 PDF 等功能，帮助用户快速获取信息，节省时间，提高生产力。产品由北京春田知韵科技有限公司开发，拥有简洁的界面和强大的功能，是现代办公和学习的得力助手。

030

智能翻译 # AI # pdf # 创作

Aperture (by Lexica)

Lexica Aperture是一款能够快速生成逼真图像的人工智能应用程序，适用于设计、游戏开发和虚拟现实等领域。

020

图像AI 图像编辑 # 人工智能 # 图像生成

TokenVerse

TokenVerse 是一种创新的多概念个性化方法，它利用预训练的文本到图像扩散模型，能够从单张图像中解耦复杂的视觉元素和属性，并实现无缝的概念组合生成。这种方法突破了现有技术在概念类型或广度上的限制，支持多种概念，包括物体、配饰、材质、姿势和光照等。TokenVerse 的重要性在于其能够为图像生成领域带来更灵活、更个性化的解决方案，满足用户在不同场景下的多样化需求。目前，TokenVerse 的代码尚未公开，但其在个性化图像生成方面的潜力已经引起了广泛关注。

020

图像生成 # 个性化 # 图像生成 # 多概念

ChatPlayground

ChatPlayground AI是一个集成了多种AI模型的在线平台，提供多角度的AI对话体验。它通过一个界面集成了多个AI聊天机器人，支持用户在不同场景下获取更准确、更多样化的答案。平台还提供实时网页搜索、图像生成、历史记录回顾等功能，支持多语言，满足不同用户的需求。

020

智能聊天机器人 # AI # 图像生成 # 多语言支持

Canva文本转图像

这是一种全新的技术，它能够根据您所描述的内容生成任何您需要的图像。

020

图像生成 # 图像生成

Frames

Frames是Runway Research推出的最新图像生成基础模型，它在风格控制和视觉保真度方面迈出了一大步。该模型擅长保持风格一致性，同时允许广泛的创意探索，能够为项目建立特定的外观，并可靠地生成忠实于您美学的变化。Frames的推出标志着在创意工作流程中，用户可以构建更多属于自己的世界，实现更大、更无缝的创意流程。

020

图像生成 # 世界构建 # 创意探索 # 图像生成

Xno.ai

探索19个顶尖的文本到图像AI，使用39个GPU。

020

图像生成 # 图像生成

Text Behind Image AI

Text Behind Image是一个在线工具，允许用户在图片上添加文字，创造出文字背后效果，增强视觉冲击力。这种技术在广告、社交媒体和个人项目中尤为重要，因为它能够吸引观众的注意力并传达信息。产品背景信息表明，这是一个简单、快速且专业的解决方案，用户无需复杂的设计技能即可实现出色的设计效果。目前，该工具提供免费使用，适合个人和商业项目。

020

图像生成 # 图像生成 # 图片编辑 # 在线服务

AI Art Generator Pro（Free） – ArtGenius

ArtGenius是一款利用人工智能技术的图像创作工具，不仅模仿各种绘画风格，还能通过文本识别场景和对象生成高质量逼真的图像。独特之处在于，您可以轻松创建各种令人惊叹的视觉图像，无需专业的绘画技能。

020

艺术创作 # 人工智能 # 创作 # 图像生成

Mochi Diffusion

MochiDiffusion是一款在Mac上本地运行稳定扩散的应用程序，它使用苹果的Core ML稳定扩散实现，提供极快速和内存高效的图像生成和编辑功能。

020

图像AI 图像生成器 # 免费 # 图像生成 # 神经网络

Artaist AI

用无限的AI生成的视觉效果来促进你的销售，为你的业务。Artaist AI艺术生成器是专业用途的完美选择。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

Luma Photon

Luma Photon 是一个创新的图像生成模型，以其高度创造性、智能化和个性化而著称。它建立在一个新的突破性架构之上，能够提供超高画质的图像，并且成本效率提高了10倍。Luma Photon 在大规模双盲评估中超越了市场上的所有模型，无论是在质量、创造力还是理解力方面都表现出色，同时在效率上也有了革命性的提升。

020

图像生成 # AI # 创意工具 # 图像生成

CP Chat

CP Chat是一个基于AI技术的内容创作工具，通过WhatsApp聊天平台，可以快速生成图像、解决数学问题、生成内容等，节省时间和精力。

010

商业AI 生产效率 # AI内容生成 # 图像生成

Toy Box Flux

Toy Box Flux是一个基于AI生成图像训练的3D渲染模型，它结合了现有的3D LoRA模型和Coloring Book Flux LoRA的权重，形成了独特的风格。该模型特别适合生成具有特定风格的玩具设计图像。它在物体和人物主体上表现最佳，动物的表现则因训练图像中的数据不足而不稳定。此外，该模型还能提高室内3D渲染的真实感。计划在v2版本中通过混合更多生成的输出和预先存在的输出来加强这种风格的一致性。

020

设计助手 # 3D渲染 # AI生成图像 # LoRA模型

Grok for iOS

Grok是由xAI开发的AI助手，旨在提供真实、有用且富有好奇心的交互体验。它能够回答各种问题、生成引人注目的图像，并通过上传图片帮助用户更深入地了解世界。Grok强调隐私保护，所有数据交互都以用户隐私为重，确保安全体验。它集成了X平台的数据，专注于实时信息，是寻求AI助手用户的理想选择。该应用免费提供给用户，适合需要高效获取信息和创意灵感的人群。

010

图像生成 # AI助手 # 图像生成 # 实时信息

PCM

Phased Consistency Model（PCM）是一种新型的生成模型，旨在解决Latent Consistency Model（LCM）在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量，并通过广泛的实验验证了其在不同步骤（1步、2步、4步、8步、16步）下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

020

视频生成 # 图像生成 # 文本条件生成 # 生成模型

ImageGen AI- Image Generator

ImageGen是一款利用人工智能技术快速生成定制图像的工具，帮助设计师、营销人员和创作者轻松获得高质量的视觉效果。

020

图像AI 图像生成器 # 人工智能 # 图像生成

Dreamlike Art

Dreamlike Art提供免费AI艺术生成服务，支持多种模型和快速生成，助力用户高效创作高质量艺术作品。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI图像生成

Roll Art Die

在您的Apple Silicon设备上使用StableDiffusion。仅使用文本生成AI艺术品。将您的梦想艺术品变成现实。无需云订阅。

030

图像生成 # 图像生成

Regional-Prompting-FLUX

Regional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型，它能够在无需训练的情况下，为扩散变换器（如FLUX）提供细粒度的组合文本到图像生成能力。该模型不仅效果显著，而且与LoRA和ControlNet高度兼容，能够在保持高速度的同时减少GPU内存的使用。

020

文案写作 # AI # Controlnet # LORA

Grok App

Grok是一个由X.AI Corp开发的AI助手应用，旨在提供最真实、有用和好奇的答案。用户可以通过Grok获取任何问题的答案、生成引人注目的图像，并上传图片以更深入地了解世界。Grok以其高质量的图像生成、实时更新的数据、对话式的幽默语气和注重隐私的特性，为用户提供了一个安全、高效的AI体验平台。

020

图像生成 # AI助手 # 信息查询 # 图像生成

Aragon – 图像生成

使用AI可以比以前快10倍地创建惊人的艺术和图像。

030

图像生成 # 图像生成

AI ContentCraft

AI ContentCraft 是一个强大的内容创作平台，旨在帮助创作者快速生成故事、播客脚本和多媒体内容。它通过集成文本生成、语音合成和图像生成技术，为创作者提供一站式的解决方案。该工具支持中英文内容转换，适合需要高效创作的用户。其技术栈包括 DeepSeek AI、Kokoro TTS 和 Replicate API，确保高质量的内容生成。产品目前开源免费，适合个人和团队使用。

020

文案写作 # AI # 内容创作 # 图像生成

SD3.5-Large-IP-Adapter

SD3.5-Large-IP-Adapter是一个基于Stable Diffusion 3.5 Large模型的IP适配器，由InstantX Team研发。该模型能够将图像处理工作类比于文本处理，具有强大的图像生成能力，并且可以通过适配器技术进一步提升图像生成的质量和效果。该技术的重要性在于其能够推动图像生成技术的发展，特别是在创意工作和艺术创作领域。产品背景信息显示，该模型是由Hugging Face和fal.ai赞助的项目，并且遵循stabilityai-ai-community的许可协议。

020

图像生成 # AI模型 # Hugging Face # IP适配器

FLUX.1-dev-LoRA-One-Click-Creative-Template

FLUX.1-dev-LoRA-One-Click-Creative-Template 是一个基于 LoRA 训练的图像生成模型，由 Shakker-Labs 提供。该模型专注于创意照片生成，能够将用户的文本提示转化为具有创意性的图像。模型使用了先进的文本到图像的生成技术，特别适合需要快速生成高质量图像的用户。它是基于 Hugging Face 平台，可以方便地进行部署和使用。模型的非商业使用是免费的，但商业使用需要遵守相应的许可协议。

020

设计助手 # LORA # 创意设计 # 图像生成

Image To Caption Tool

使用我们的人工智能图像到字幕工具，轻松将图像转换为迷人的字幕。增强数字内容，无缝吸引受众。

020

AI设计工具 AI赋能 # AI绘画 # AI绘画关键词生成器 # AI绘画关键词网站

FLUX.1-dev-IP-Adapter

FLUX.1-dev-IP-Adapter是一个基于FLUX.1-dev模型的IP-Adapter，由InstantX Team研发。该模型能够将图像工作处理得像文本一样灵活，使得图像生成和编辑更加高效和直观。它支持图像参考，但不适用于细粒度的风格转换或角色一致性。模型在10M开源数据集上训练，使用128的批量大小和80K的训练步骤。该模型在图像生成领域具有创新性，能够提供多样化的图像生成解决方案，但可能存在风格或概念覆盖不足的问题。

020

文案写作 # FLUX.1-Dev # Hugging Face # IP-Adapter

人脸生成器

人工智能生成的图像从未如此好看。从我们的生产准备数据库中探索和下载我们多样的、无版权的头像图片。使用完全由 AI 生成的照片增强您的创意作品。通过我们分类和标记的应用程序查找模型图像，或通过 API 集成图像。

020

AI赋能 AI趣站 # AI生成 # API集成 # 下载

RodinHD

RodinHD是一个基于扩散模型的高保真3D头像生成技术，由Bowen Zhang、Yiji Cheng等研究者开发，旨在从单一肖像图像生成细节丰富的3D头像。该技术解决了现有方法在捕捉发型等复杂细节时的不足，通过新颖的数据调度策略和权重整合正则化项，提高了解码器渲染锐利细节的能力。此外，通过多尺度特征表示和交叉注意力机制，优化了肖像图像的引导效果，生成的3D头像在细节上显著优于以往方法，并且能够泛化到野外肖像输入。

010

头像生成 # 3D头像 # AI技术 # 图像生成

EVEAI .XYZ

以人工智能驱动的速度和风格的一致性，为你的创意项目生成生产质量的资产。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

FLUX.1 Tools

FLUX.1 Tools是Black Forest Labs推出的一套模型工具，旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性，使得对真实和生成的图像进行修改和再创造成为可能。该工具套件包含四个不同的特性，以开放访问模型的形式在FLUX.1 [dev]模型系列中提供，并作为BFL API的补充，支持FLUX.1 [pro]。FLUX.1 Tools的主要优点包括先进的图像修复和扩展能力、结构化引导、图像变化和重构等，这些功能对于图像编辑和创作领域具有重要意义。

010

文案写作 # 人工智能 # 图像生成 # 图像编辑

涂鸦扩散

使用 AI 将您的草图转换为精致的图像

010

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

ArtBlast AI

人工智能图像生成器。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

Darwin Studio

Darwin Studio是一款AI图像、视频和广告生成器，通过使用AI技术和算法，帮助用户快速生成高质量的图像、视频和广告。它具有高效、智能、创新的特点，可以大大提升创意工作效率。

020

视频生成 # AI # 创意工具 # 图像生成

Imgcreator

创建带有文本的图像。生成基于文本的图像以帮助您思考和创造。

020

图像生成 # 图像生成

Accomplice

Accomplice是一款AI驱动的平台，帮助企业生成100％免版税的徽标、照片和图形，同时节省时间、削减成本并简化工作流程。

020

AI图像与设计 # 免版税 # 图像生成 # 爱设计

Free Midjourney AI Art Generator

Midjourney V6 API是一款通过人工智能将文本描述转化为生动艺术品的先进平台。它提供了多种模型选择，高度逼真的效果，以及灵活的尺寸适应。该产品的主要优点包括增强的现实感、丰富的功能和用户友好的界面。

020

艺术创作 # 人工智能 # 图像生成 # 艺术

Iterate

Iterate是一位友好的AI艺术家，可以将您的想法转化为图像。Iterate.World 是一起制作图像的地方。给迭代一个提示，它将为你绘制一个图像。迭代可能需要几次尝试才能正确，因此请随时要求提供许多图像，并删除您不喜欢的任何图像。

020

AI智能绘画 AI赋能 # 3D角色设计 # AI优化 # AI水彩画

Clio Sketch

FidelityBalanced是一款结合了人工智能和手绘草图的创作工具，可以帮助用户快速实现想法的可视化，具有高保真度、简单易用和多样化风格等特点。

020

图像AI 图像生成器 # 人工智能 # 免费 # 图像生成

Illustration Generator

Illustration Generator是Icons8推出的AI图像生成器，由专业艺术家和工程师团队打造。它能够根据用户提供的文本提示或参考图像，生成具有一致艺术风格的插图，满足网页、桌面和移动应用、社交媒体、市场营销等设计需求。AI模型基于Icons8艺术家制作的视觉素材进行训练，确保生成的AI艺术作品具有一致性和专业外观。

020

艺术创作 # AI艺术 # 专业插图 # 图像生成

Art Hub

Art Hub 是一个在线艺术社区，旨在提供一个平台，让艺术家、设计师和创意人士分享他们的作品，交流和获得灵感，并与其他人联系和合作。

020

AI图像 AI开放平台 # AI绘画 # 共享平台 # 图像生成

Diffusion Self-Distillatio

Diffusion Self-Distillation是一种基于扩散模型的自蒸馏技术，用于零样本定制图像生成。该技术允许艺术家和用户在没有大量配对数据的情况下，通过预训练的文本到图像的模型生成自己的数据集，进而微调模型以实现文本和图像条件的图像到图像任务。这种方法在保持身份生成任务的性能上超越了现有的零样本方法，并能与每个实例的调优技术相媲美，无需测试时优化。

010

图像生成 # 图像生成 # 扩散模型 # 自蒸馏

Arteus AI

Arteus AI Image Generator是一款由Arteus AI开发的尖端工具，利用先进的人工智能技术从文本提示中创建图像。只需描述您想生成的内容，Arteus AI就能产生出来。该工具采用了生成对抗网络（GANs）或变分自编码器（VAEs）等复杂的深度学习算法，通过学习数据集中的模式并根据输入参数生成图像，从而确保高质量输出。Arteus AI Image Generator非常灵活，可以创建各种类型的图像，包括逼真的照片、抽象艺术、风景、肖像等。用户可以通过调整参数或提供具体指令来定制生成的图像。

020

艺术创作 # 人工智能 # 图像生成 # 艺术

Flex.1-alpha

Flex.1-alpha 是一个强大的文本到图像生成模型，基于80亿参数的修正流变换器架构。它继承了FLUX.1-schnell的特性，并通过训练指导嵌入器，使其无需CFG即可生成图像。该模型支持微调，并且具有开放源代码许可（Apache 2.0），适合在多种推理引擎中使用，如Diffusers和ComfyUI。其主要优点包括高效生成高质量图像、灵活的微调能力和开源社区支持。开发背景是为了解决图像生成模型的压缩和优化问题，并通过持续训练提升模型性能。

020

文案写作 # 图像生成 # 开源 # 微调

1.58-bit FLUX

1.58-bit FLUX是一种先进的文本到图像生成模型，通过使用1.58位权重（即{-1, 0, +1}中的值）来量化FLUX.1-dev模型，同时保持生成1024x1024图像的可比性能。该方法无需访问图像数据，完全依赖于FLUX.1-dev模型的自监督。此外，开发了一种定制的内核，优化了1.58位操作，实现了模型存储减少7.7倍，推理内存减少5.1倍，并改善了推理延迟。在GenEval和T2I Compbench基准测试中的广泛评估表明，1.58-bit FLUX在保持生成质量的同时显著提高了计算效率。

020

图像生成 # 图像生成 # 模型优化 # 自监督学习

混元-DiT

混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型，专注于中文元素理解，具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息，并生成相应的艺术作品，包括但不限于人物写真、创意创作等。混元-DiT的推出，对于提升中文文本理解的深度和广度，以及促进中英双语交流具有重要意义。

010

艺术创作 # 中英双语 # 人工智能 # 图像生成

SliderSpace

SliderSpace 是一项创新技术，旨在提高扩散模型的可控性和可解释性。它通过自动发现模型内部的视觉知识，将其分解为直观的滑块，用户可以通过这些滑块轻松调整图像生成的方向。该技术不仅能够揭示模型对不同概念的理解，还能显著提高图像生成的多样性。SliderSpace 的主要优点包括自动化发现方向、语义正交性和分布一致性，使其成为探索和利用扩散模型视觉能力的强大工具。该技术目前处于研究阶段，尚未明确具体的价格和商业定位。

020

艺术创作 # 图像生成 # 多样性 # 模型解释

Leffa

Leffa是一个用于可控人物图像生成的统一框架，它能够精确控制人物的外观（例如虚拟试穿）和姿态（例如姿态转移）。该模型通过在训练期间引导目标查询关注参考图像中的相应区域，减少细节扭曲，同时保持高图像质量。Leffa的主要优点包括模型无关性，可以用于提升其他扩散模型的性能。

020

图像生成 # 图像生成 # 姿态转移 # 扩散模型

In-Context LoRA for Diffusion Transformers

In-Context LoRA是一种用于扩散变换器（DiTs）的微调技术，它通过结合图像而非仅仅文本，实现了在保持任务无关性的同时，对特定任务进行微调。这种技术的主要优点是能够在小数据集上进行有效的微调，而不需要对原始DiT模型进行任何修改，只需改变训练数据即可。In-Context LoRA通过联合描述多张图像并应用任务特定的LoRA微调，生成高保真度的图像集合，更好地符合提示要求。该技术对于图像生成领域具有重要意义，因为它提供了一种强大的工具，可以在不牺牲任务无关性的前提下，为特定任务生成高质量的图像。

020

图像生成 # LORA # 任务无关性 # 图像生成

flux-controlnet-canny

flux-controlnet-canny是由XLabs AI团队开发的基于FLUX.1-dev模型的ControlNet Canny模型，用于文本到图像的生成。该模型通过训练，能够根据文本提示生成高质量的图像，广泛应用于创意设计和视觉艺术领域。

020

艺术创作 # AI艺术 # 创意工具 # 图像生成

ComfyUI-IF_MemoAvatar

ComfyUI-IF_MemoAvatar是一个基于记忆引导扩散的模型，用于生成表达性的视频。该技术允许用户从单一图像和音频输入创建富有表现力的说话头像视频。这项技术的重要性在于其能够将静态图像转化为动态视频，同时保留图像中人物的面部特征和情感表达，为视频内容创作提供了新的可能性。该模型由Longtao Zheng等人开发，并在arXiv上发布相关论文。

020

图像生成 # AI # 图像生成 # 情感表达

UltrAvatar

UltrAvatar是一款逼真可动的3D头像生成模型，旨在缩小虚拟与现实世界体验之间的差距。它采用Score Distillation Sampling (SDS) loss和可微分渲染器以及文本条件来引导扩散模型生成3D头像。与现有作品相比，UltrAvatar通过增强几何保真度和优越的物理渲染纹理质量，提出了一种新颖的3D头像生成方法。它通过扩散色彩提取模型和真实性引导纹理扩散模型，去除不需要的光照效果，呈现真实的扩散颜色，使生成的头像能够在各种光照条件下呈现。我们在实验证明了该方法的有效性和鲁棒性，在实验中大幅优于现有最先进的方法。

010

头像生成 # 3D头像 # 图像生成 # 虚拟现实

A1

A1.art是一个平台，每个人都可以轻松构建和发现AI艺术应用。A1.art致力于成为每个人的艺术工作站，让艺术的掌握变得简单如言。

020

艺术创作 # AI # 创作 # 图像生成

ChatDesigner

ChatDesigner是一个AI设计代理，可以通过与其聊天来生成和编辑任何图像。它提供了30多种AI图像生成和编辑工具，可以帮助你创建和编辑照片、生成相似的图像、AI肖像、产品照片、更改背景等。

020

图像AI 图像生成 # AI设计代理 # 免费增值。# 图像生成

vivago.ai

vivago.ai 是一个免费的 AI 生成工具和社区，提供文本转图像、图像转视频等功能，让创作变得更加简单高效。用户可以免费生成高质量的图像和视频，支持多种 AI 编辑工具，方便用户进行创作和分享。该平台的定位是为广大创作者提供易用的 AI 工具，满足他们在视觉创作上的需求。

020

图像生成 # 4K 增强 # ai 工具 # 创作工具

MergeML

MergeML是一款人工智能图像生成工具，使用机器学习模型名为StyleGAN2，生成高质量的图像。

020

AI图像与设计 # MergeML # 图像生成 # 机器学习

AskVia

Ask Via是一款基于AI技术的聊天机器人，可以帮助用户回答问题、完成任务。通过与WhatsApp无缝集成，使用GPT-3.5技术，Ask Via能够随时准备回答您的问题。无论是工作、学校还是个人使用，Ask Via都是一个全能的AI助手，随时为您提供帮助。享受智能助手带来的未来体验吧！

010

户外旅行 # AI助手 # 代码调试 # 写作助手

FLUX Pro Finetuning API

FLUX Pro Finetuning API 是由 Black Forest Labs 推出的生成式文本到图像模型的定制化工具。它允许用户通过少量示例图像（1-5张）对 FLUX Pro 模型进行微调，从而生成符合特定品牌、风格或视觉需求的高质量图像内容。该技术的主要优点在于其高度的定制化能力、对品牌一致性的保持以及与 FLUX 工具套件的无缝集成。它适用于专业创意人员、设计师和品牌方，帮助他们在营销、品牌建设和故事叙述中实现个性化内容创作。目前尚无明确价格信息，但其定位为高端创意工具，适合对生成内容质量有较高要求的用户。

020

图像生成 # 内容创作 # 创意设计 # 品牌定制

Stable Diffusion 3.5 Medium

Stable Diffusion 3.5 Medium是一个基于文本到图像的生成模型，由Stability AI开发，具有改进的图像质量、排版、复杂提示理解和资源效率。该模型使用了三个固定的预训练文本编码器，通过QK-规范化提高训练稳定性，并在前12个变换层中引入双注意力块。它在多分辨率图像生成、一致性和各种文本到图像任务的适应性方面表现出色。

020

文案写作 # AI艺术 # 图像生成 # 多模态

API.box

API.box是一个提供先进AI接口的平台，旨在帮助开发者快速集成AI功能到他们的项目中。它提供全面的API文档和详细的调用日志，确保高效开发和系统性能稳定。API.box具备企业级安全性和强大可扩展性，支持高并发需求，同时提供免费试用和商业用途的输出许可，是开发者和企业的理想选择。

020

文案写作 # AI接口 # 图像生成 # 文本生成

PixelHaha

PixelHaha是一个AI艺术图像生成器，它允许用户通过文本提示（prompt）来创造各种风格的AI艺术作品。用户可以根据自己的灵感来描述想要的图像，然后由AI将这些描述转化为图像。这个产品的重要性在于它能够快速将创意转化为视觉作品，极大地降低了艺术创作的门槛，并且提供了一个独特的AI角色来与用户的灵魂伴侣相结合。

020

艺术创作 # AI艺术 # 创意工具 # 图像生成

Mamouth

Mamouth是一个集成了多种先进AI模型和图像生成服务的平台，旨在帮助用户保持在人工智能技术的前沿。平台提供包括GPT-4o、Claude、Llama、Mistral、Gemini等在内的AI语言模型，以及Dall-E、Midjourney和Stable Diffusion等图像生成工具。Mamouth通过订阅服务模式，为用户提供高效、便捷的AI使用体验，同时支持团队管理和工作空间功能，满足不同用户的需求。

020

团队协作 # AI模型 # 团队协作 # 图像生成

Graydient AI

Graydient AI提供顶级开放模型、无限制创作、强大的客户支持和云存储，助力用户高效生成AI图像和视频。

020

AI智能绘画 AI赋能 # AI # AI图像生成 # AI智能绘画

SDXL_EcomID_ComfyUI

SDXL_EcomID_ComfyUI是一个为ComfyUI提供原生SDXL-EcomID支持的插件。它通过增强肖像表示，提供更真实、审美上更令人愉悦的外观，同时确保语义一致性和更大的内部ID相似性。这个插件完全集成于ComfyUI，并且不使用diffusers，而是本地实现EcomID。它的重要性在于能够提升图像生成的质量和一致性，特别是在处理人物肖像时，能够保持不同年龄、发型、眼镜等物理变化下的内部特征一致性。

020

图像生成 # ComfyUI # EcomID # 图像生成

Draw Things: AI Generation

Draw Things: AI Generation是一款AI生成的绘画应用程序，适用于iPhone，iPad和Mac。免费下载。

020

AI图像与设计 # AI Generation # AI绘画 # Draw Things

DALL E

DALL·E是一种基于神经网络的图像生成模型，能够根据文本描述生成高质量的图像，为创意设计和广告营销等领域提供了更多的创作可能性。

020

图像AI 图像编辑 # 免费增值。# 图像生成 # 文本描述

AILIBRI

AILIBRI是一个汇集了超过2000个AI神经网络工具的目录网站，涵盖了文本、图像、视频、音频等多个领域的工具。它为用户寻找合适的AI工具提供了极大的便利，无论是专业人士还是初学者，都能在这里找到满足其需求的工具。该网站提供了详细的分类和搜索功能，帮助用户快速定位到所需的工具。

010

音频处理 # AI工具 # 图像生成 # 文本处理

LlamaGen

LlamaGen是一个新的图像生成模型家族，它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展，无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

020

艺术创作 # AI艺术 # 图像生成 # 自回归模型

RocketAI

设计的未来是可编程的。Rocket AI是一个SaaS平台，使用AI创建和编辑产品图像，并使用AI提高电子商务销售和广告表现。我们为电子商务企业提供AI解决方案，以改善其产品图像，并从简单的文本提示中生成新的想法和设计概念。

020

图像生成 # 图像生成

Procyon AI Image Generation Benchmark

Procyon AI Image Generation Benchmark 是一款由 UL Solutions 开发的基准测试工具，旨在为专业用户提供一个一致、准确且易于理解的工作负载，用以测量设备上 AI 加速器的推理性能。该基准测试与多个关键行业成员合作开发，确保在所有支持的硬件上产生公平且可比较的结果。它包括三个测试，可测量从低功耗 NPU 到高端独立显卡的性能。用户可以通过 Procyon 应用程序或命令行进行配置和运行，支持 NVIDIA® TensorRT™、Intel® OpenVINO™ 和 ONNX with DirectML 等多种推理引擎。产品主要面向工程团队，适用于评估推理引擎实现和专用硬件的通用 AI 性能。价格方面，提供免费试用，正式版为年度场地许可，需付费获取报价。

020

图像生成 # AI # 专业用户 # 图像生成

Dreamer

将稳定扩散集成到Notion中，使用新的削减命令AI生成图像。

020

图像生成 # 图像生成

Baseten

这是一个用于生成图像的开源模型Stable Diffusion的网站，由Stability AI开发。它可以根据文本提示生成图像，例如戴牛仔帽的狮子或宇宙飞船上安静图书馆的超逼真数字艺术。使用受CreativeML开放RAIL M许可证的管理。生成的图像由Baseten驱动。

020

AI图像与设计 # AI图像艺术创作 # Stable Diffusion # 图像生成

AISEO AI ART Generator

create stunning images from text prompts using artificial intelligence. AISEO provides the best Ai art generator to bring your visual game to the next level.使用AISEO艺术，您可以描绘自己的想象力。

020

AI智能绘画 AI赋能 # 3D角色设计 # AISEO # AISEO AI ART Generator

Facetune

Facetune是一款面部美容修图软件，主要功能包括磨皮、美白、修复、美化、红眼修复等。Facetune有两个版本，分别是Facetune2和Facetune Video。

020

AI办公 AI助手 # AI绘画 # 图像处理 # 图像生成

CogView4-6B

CogView4-6B 是由清华大学知识工程组开发的文本到图像生成模型。它基于深度学习技术，能够根据用户输入的文本描述生成高质量的图像。该模型在多个基准测试中表现优异，尤其是在中文文本生成图像方面具有显著优势。其主要优点包括高分辨率图像生成、支持多种语言输入以及高效的推理速度。该模型适用于创意设计、图像生成等领域，能够帮助用户快速将文字描述转化为视觉内容。

010

文案写作 # 创意设计 # 图像生成 # 多语言支持

PSHuman

PSHuman是一个创新的框架，它利用多视图扩散模型和显式重构技术，从单张图片中重建出逼真的3D人体模型。这项技术的重要性在于它能够处理复杂的自遮挡问题，并且在生成的面部细节上避免了几何失真。PSHuman通过跨尺度扩散模型联合建模全局全身形状和局部面部特征，实现了细节丰富且保持身份特征的新视角生成。此外，PSHuman还通过SMPL-X等参数化模型提供的身体先验，增强了不同人体姿态下的跨视图身体形状一致性。PSHuman的主要优点包括几何细节丰富、纹理保真度高以及泛化能力强。

010

图像生成 # 3D重建 # 人体模型 # 人工智能

FLUX.1-dev LoRA Outfit Generator

FLUX.1-dev LoRA Outfit Generator是一个文本到图像的AI模型，能够根据用户详细描述的颜色、图案、合身度、风格、材质和类型来生成服装。该模型使用了H&M Fashion Captions Dataset数据集进行训练，并基于Ostris的AI Toolkit进行开发。它的重要性在于能够辅助设计师快速实现设计想法，加速服装行业的创新和生产流程。

020

文案写作 # AI # 图像生成 # 文本到图像

CAP4D

CAP4D是一种利用可变形多视图扩散模型（Morphable Multi-View Diffusion Models）来创建4D人像化身的技术。它能够从任意数量的参考图像生成不同视角和表情的图像，并将其适配到一个4D化身上，该化身可以通过3DMM控制并实时渲染。这项技术的主要优点包括高度逼真的图像生成、多视角的适应性以及实时渲染的能力。CAP4D的技术背景是基于深度学习和图像生成领域的最新进展，尤其是在扩散模型和3D面部建模方面。由于其高质量的图像生成和实时渲染能力，CAP4D在娱乐、游戏开发、虚拟现实等领域具有广泛的应用前景。目前，该技术是免费提供代码的，但具体的商业化应用可能需要进一步的授权和定价。

010

图像生成 # 3D面部建模 # 4D化身 # 人像建模

Pandora Avatars

Pandora Avatars指的是Pandora官网上的一项个性化服务，用户可以使用自己的图片或选择Pandora提供的形象来创建自己的虚拟形象，并在Pandora社交媒体平台上使用。

020

AI助手 AI图像 # AI绘画 # 图像生成 # 虚拟形象

Mobile Diffusion

Mobile Diffusion是一款创新的图像生成应用，利用最新的人工智能技术，将您的想象力变为现实。无需互联网连接，可以随时随地使用，操作简单方便。快来体验吧！

020

图像AI 图像生成器 # 人工智能 # 免费 # 图像生成

Janus-Pro-7B

Janus-Pro-7B 是一个强大的多模态模型，能够同时处理文本和图像数据。它通过分离视觉编码路径，解决了传统模型在理解和生成任务中的冲突，提高了模型的灵活性和性能。该模型基于 DeepSeek-LLM 架构，使用 SigLIP-L 作为视觉编码器，支持 384x384 的图像输入，并在多模态任务中表现出色。其主要优点包括高效性、灵活性和强大的多模态处理能力。该模型适用于需要多模态交互的场景，例如图像生成和文本理解。

020

文案写作 # 人工智能 # 图像生成 # 多模态

Brain Pod AI

Brain Pod AI是一个AI驱动的工具，可以帮助用户轻松、快速地撰写高质量的文章。它在Trustpilot上获得了客户的高度评价，是一个用于内容生成、图像生成和音乐生成的平台。

020

AI写作与文本 # AI写作 # Brain Pod AI # 内容生成

FaceMimic AI

FaceMimic AI是一款利用先进AI技术将自拍照片转换成专业头像的服务。无需专业摄影师或昂贵设备，用户只需上传自拍，即可在60秒内获得高质量的头像，适用于LinkedIn、社交媒体、个人使用等多种场景。产品背景信息显示，该技术能显著提升个人在职业网络中的可见度，增加面试机会，适用于职业发展、商业形象构建、社交分享和约会应用等多个领域。价格方面，提供免费试用，并根据不同的使用需求提供不同的套餐。

010

社交媒体 # AI # 商业形象 # 图像生成

手绘头像定制

头像定制是一个提供个性化手绘头像服务的网站。它允许用户上传自己的照片，由专业的绘画师根据照片绘制出风格独特的头像。这种服务不仅满足了用户在社交平台上展示个性化形象的需求，也因其艺术性和独特性而受到欢迎。产品背景信息显示，该服务由经验丰富的绘画师提供，包括首席绘画师jissacos和新秀kiki等，他们擅长捕捉面部表情和个人特色。价格方面，根据绘画师的不同，提供不同价位的服务，用户可以根据自己的预算和喜好选择合适的服务。

010

社交媒体 # 个性化 # 图像生成 # 手绘

猴子无限｜AI 生成引擎

猴子无限是一款AI生成引擎，可以帮助用户快速生成图像、文本等内容，提高工作效率。

020

AI办公 AI图像 # AI办公 # 图像生成 # 图形生成

Pew AI

Pew AI 是一个面向电子商务的AI摄影平台，提供完美的摄影助手。用户可以上传他们的产品图片，提供有关所需图像构图和设置的详细信息，即可即时获得精美的内容。

030

AI图像与设计 # AI摄影 # 产品展示 # 图像生成

Janus Pro

Janus Pro 是由 DeepSeek 技术驱动的先进 AI 图像生成与理解平台。它采用革命性的统一变换器架构，能够高效处理复杂的多模态操作，实现图像生成和理解的卓越性能。该平台训练了超过 9000 万个样本，其中包括 7200 万个合成美学数据点，确保生成的图像在视觉上具有吸引力且上下文准确。Janus Pro 为开发者和研究人员提供强大的视觉 AI 能力，帮助他们实现从创意到视觉叙事的转变。平台提供免费试用，适合需要高质量图像生成和分析的用户。

010

图像生成 # AI # 创意 # 图像理解

Aiartapps

Aiartapps为设计师和创意工程师提供各种AI艺术相关的资源和工具，包括生成艺术、人物头像创作、儿童故事生成、图像创作等。用户可通过该平台使用各种AI模型进行创作，无需具备机器学习知识。产品提供API接口、SDK、稳定的扩散生成等功能，同时还有创作灵感、社区交流、优惠活动等。定价灵活，涵盖免费、付费和免费试用等多种模式。

020

艺术创作 # AI # 创作工具 # 图像生成

flux-condensation

fofr/flux-condensation是一个基于文本生成图像的AI模型，使用Diffusers库和LoRAs技术，能够根据用户提供的文本提示生成相应的图像。该模型在Replicate上训练，具有非商业性质的flux-1-dev许可证。它代表了文本到图像生成技术的最新进展，能够为设计师、艺术家和内容创作者提供强大的视觉表现工具。

020

文案写作 # AI模型 # Diffusers库 # LoRAs技术

Journey.io

输入一个图片提示和你想链接的任何URL，我们将生成一个美丽的生成艺术QR码。

020

AI设计工具 AI赋能 # AI绘画 # Journey.io # 人工智能绘画

Pirate Diffusion

最好的免费AI图片生成器是Pirate Diffusion。可笑的强大--免费AI图片生成器--最好的AI图片生成器，敢于比较。

020

AI智能绘画 AI赋能 # AI # AI绘画 # Pirate Diffusion

Snowpixel App

生成媒体平台，从文本生成图像、音频、视频和 3D 对象，上传您自己的数据以训练自定义模型。

010

AI智能绘画 AI赋能 # AI免费图像 # ai图像生成器 # ai图象

SDXL Flash

SDXL Flash是由SD社区与Project Fluently合作推出的文本到图像生成模型。它在保持生成图像质量的同时，提供了比LCM、Turbo、Lightning和Hyper更快的处理速度。该模型基于Stable Diffusion XL技术，通过优化步骤和CFG（Guidance）参数，实现了图像生成的高效率和高质量。

020

艺术创作 # AI艺术 # 图像生成 # 文本到图像

AI Anime Girl Studio

AI AnimeGirl Creator是一个免费的AI生成二次元美少女的工具。它可以轻松生成令人惊叹的二次元美少女艺术品。

020

艺术创作 # AI # 二次元 # 图像生成

StoryScape

释放你的创造力，定制属于你自己的故事。StoryScape AI让你成为真正的创作者，摆脱社交媒体的束缚，创作出令人沉浸的故事体验。

020

AI说故事文本AI # AI技术 # 免费增值。# 图像生成

Stable Diffusion提示搜索引擎

Stable Diffusion 提示搜索引擎是一个强大的资源，适用于希望利用 AI 技术生成视觉内容的艺术家和创意专业人士。

020

AI搜索引擎 # AI图像搜索引擎 # AI图片搜索 # AI搜索引擎

DALL·E mini

DALL·E mini是一款强大的机器学习应用，通过将文本描述转化为逼真的图像，帮助您创造出令人惊叹的视觉内容。

020

图像AI 图像生成器 # 图像生成 # 机器学习

IMM

Inductive Moment Matching (IMM) 是一种先进的生成模型技术，主要用于高质量图像生成。该技术通过创新的归纳矩匹配方法，显著提高了生成图像的质量和多样性。其主要优点包括高效性、灵活性以及对复杂数据分布的强大建模能力。IMM 由 Luma AI 和斯坦福大学的研究团队开发，旨在推动生成模型领域的发展，为图像生成、数据增强和创意设计等应用提供强大的技术支持。该项目开源了代码和预训练模型，方便研究人员和开发者快速上手和应用。

030

图像生成 # 人工智能 # 图像生成 # 开源

NUWA-Infinity

NUWA-Infinity是微软推出的一个艺术作品生成平台，它能够创作西方油画、自然风景、抽象艺术等多种风格的艺术作品。该平台支持文本到图像、图像到视频、图像外扩等多种创作方法。

010

艺术创作 # AI艺术创作 # 创意工具 # 图像处理

MV-Adapter

MV-Adapter是一种基于适配器的多视图图像生成解决方案，它能够在不改变原有网络结构或特征空间的前提下，增强预训练的文本到图像（T2I）模型及其衍生模型。通过更新更少的参数，MV-Adapter实现了高效的训练并保留了预训练模型中嵌入的先验知识，降低了过拟合风险。该技术通过创新的设计，如复制的自注意力层和并行注意力架构，使得适配器能够继承预训练模型的强大先验，以建模新的3D知识。此外，MV-Adapter还提供了统一的条件编码器，无缝整合相机参数和几何信息，支持基于文本和图像的3D生成以及纹理映射等应用。MV-Adapter在Stable Diffusion XL（SDXL）上实现了768分辨率的多视图生成，并展示了其适应性和多功能性，能够扩展到任意视图生成，开启更广泛的应用可能性。

020

文案写作 # 3D几何 # 图像到图像 # 图像生成

Janus-Pro-1B

Janus-Pro-1B 是一个创新的多模态模型，专注于统一多模态理解和生成。它通过分离视觉编码路径，解决了传统方法在理解和生成任务中的冲突问题，同时保持了单个统一的 Transformer 架构。这种设计不仅提高了模型的灵活性，还使其在多模态任务中表现出色，甚至超越了特定任务的模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建，使用 SigLIP-L 作为视觉编码器，支持 384x384 的图像输入，并采用特定的图像生成 tokenizer。其开源性和灵活性使其成为下一代多模态模型的有力候选。

030

图像生成 # Transformer # 图像生成 # 多模态

Tingo.ai

用户能够根据自己的喜好创建和互动一个AI女友。这个工具以其定制化选项、深度学习能力和灵活的互动功能为主要特点，为用户提供了一个可以进行情感交流和个性化互动的虚拟伴侣。

030

AIGC智能对话 AI女友 # AI伴侣 # AI女友 # Tingo.ai

Fashion-Hut-Modeling-LoRA

Fashion-Hut-Modeling-LoRA是一个基于Diffusion技术的文本到图像生成模型，主要用于生成时尚模特的高质量图像。该模型通过特定的训练参数和数据集，能够根据文本提示生成具有特定风格和细节的时尚摄影图像。它在时尚设计、广告制作等领域具有重要应用价值，能够帮助设计师和广告商快速生成创意概念图。模型目前仍在训练阶段，可能存在一些生成效果不佳的情况，但已经展示了强大的潜力。该模型的训练数据集包含14张高分辨率图像，使用了AdamW优化器和constant学习率调度器等参数，训练过程注重图像的细节和质量。

020

文案写作 # diffusion # 图像生成 # 文本到图像

Random Animal

Random Animal Generator是一个利用先进人工智能技术的网站，用户可以在短时间内生成高质量、独特的动物图像。这项技术的重要性在于它能够快速满足用户对动物图像的需求，无论是用于娱乐、教育还是设计灵感。产品背景信息显示，该网站由专业的机器学习算法支持，能够提供即时的结果和多样化的动物种类及风格选择。价格方面，网站提供了不同层次的服务选项，以满足不同用户的需求。

030

图像生成 # AI # 动物 # 图像生成

Sana_600M_512px

Sana是一个由NVIDIA开发的文本到图像的生成框架，能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度和强大的文本图像对齐能力，可以在笔记本电脑GPU上部署，代表了图像生成技术的一个重要进步。该模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，能够根据文本提示生成和修改图像。Sana的开源代码可在GitHub上找到，其研究和应用前景广阔，尤其在艺术创作、教育工具和模型研究等方面。

020

文案写作 # Nvidia # 图像生成 # 文本到图像

Image Recursor

Image Recursor是一个基于 DALL-E 3 和 GPT-4 Vision 的图像生成工具。它通过输入一个起始图像和一些参数，可以生成一系列经过修改的图像。用户可以自定义生成的图像风格，例如恐怖、随机、神秘、强烈、有趣等。图像递归生成器可以用于创造艺术作品、设计概念图、玩具设计等多种场景。

030

艺术创作 # DALL-E # GPT-4 # 图像生成

Flux_小红书真实风格

Flux_小红书真实风格模型是一款专注于生成极度真实自然日常照片的AI模型。它利用最新的人工智能技术，通过深度学习算法，能够生成具有小红书真实感风格的照片。该模型特别适合需要在社交媒体上发布高质量、真实感照片的用户，以及进行艺术创作和设计工作的专业人士。模型提供了多种参数设置，以适应不同的使用场景和需求。

030

社交媒体 # AI # 图像生成 # 小红书风格

VisualCloze

VisualCloze 是一个通过视觉上下文学习的通用图像生成框架，旨在解决传统任务特定模型在多样化需求下的低效率问题。该框架不仅支持多种内部任务，还能泛化到未见过的任务，通过可视化示例帮助模型理解任务。这种方法利用了先进的图像填充模型的强生成先验，为图像生成提供了强有力的支持。

030

图像生成 # 图像生成 # 图像编辑 # 多任务

BharatDiffusion

BharatDiffusion是一个基于AI的图像生成模型，专门针对印度的多样化景观、文化和遗产进行微调，能够生成反映印度丰富文化和特色的高质量图像。该模型使用Stable Diffusion技术处理所有图像生成，确保内容与印度的多样性和活力相呼应。

030

图像生成 # AI # Stable Diffusion # 创意工具

Wookeys AI

Ultimate AI Assistant是一款综合AI助手，可帮助您简化任务，提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能，具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐，Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定，详情请访问官方网站。

020

音频处理 # AI助手 # 代码生成 # 图像生成

Stable Diffusion 3.5 Medium 2.6B

Stable Diffusion 3.5 Medium 是由 Stability AI 提供的一款基于人工智能的图像生成模型，它能够根据文本描述生成高质量的图像。这项技术的重要性在于它能够极大地推动创意产业的发展，如游戏设计、广告、艺术创作等领域。Stable Diffusion 3.5 Medium 以其高效的图像生成能力、易用性和较低的资源消耗而受到用户的青睐。目前，该模型在 Hugging Face 平台上以免费试用的形式提供给用户。

030

文案写作 # AI # 创意工具 # 图像生成

智趣AI甄选

智趣AI甄选是一个专注于人工智能领域的综合性平台，旨在洞察行业发展前景，精选并展示国内外的AI产品与应用。平台提供丰富的学习资源，行业融合案例分析，助力用户洞悉AI发展趋势，与AI技术同行，共创未来。

080

智能聊天机器人 # AI搜索 # AI数字人 # 代码生成

KLING AI

KLING AI, tools for creating imaginative images and videos, based on state-of-art generative AI methods.

040

交通旅游 # AIGC # Generative AI # itotii导航

Grok

介绍 Grok 是一个免费的 AI 助手，旨在提升生产力。 ...

080

生活助手 # AI 助手 # 免费工具 # 创造性头脑风暴

Vegeta AI

介绍 Vegeta AI 是一个用于创建令人惊叹的 AI 生...

090

设计与艺术 # AI 艺术生成器 # 创意工具 # 图像生成

The Next AI Tool

介绍发现终极AI工具目录。什么是The Next AI ...

080

目录 # AI工具 # AI目录 # 创意工具

即梦Dreamina – 一站式AI创作平台

介绍即梦Dreamina 是一个将想象力转化为现实的 AI...

080

设计与艺术 # AI艺术 # 内容创作 # 创意平台

Gnomic智能体平台

提示词工程师之家

060

AI工具工具大全 # AI写作 # AI社区 # Gnomic

没有了