Janus-Pro-1B

1年前发布 46 0 0

收录时间：

2025-05-29

打开网站手机查看

图像生成 # Transformer # 图像生成 # 多模态 # 开源 # 深度学习 # 自然语言处理

Janus-Pro-1B

打开网站

Janus-Pro-1B 是一个创新的多模态模型，专注于统一多模态理解和生成。它通过分离视觉编码路径，解决了传统方法在理解和生成任务中的冲突问题，同时保持了单个统一的 Transformer 架构。这种设计不仅提高了模型的灵活性，还使其在多模态任务中表现出色，甚至超越了特定任务的模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建，使用 SigLIP-L 作为视觉编码器，支持 384×384 的图像输入，并采用特定的图像生成 tokenizer。其开源性和灵活性使其成为下一代多模态模型的有力候选。

数据统计

F Lite

F Lite 是由 Freepik 和 Fal 开发的一个大型扩散模型，具有 100 亿个参数，专门训练于版权安全和适合工作环境 (SFW) 的内容。该模型基于 Freepik 的内部数据集，包含约 8000 万张合法合规的图像，标志着公开可用的模型在这一规模上首次专注于合法和安全的内容。它的技术报告提供了详细的模型信息，并且使用了 CreativeML Open RAIL-M 许可证进行分发。该模型的设计旨在推动人工智能的开放性和可用性。

魔法AI绘画

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

Janus-Pro-1B

数据统计

相关导航

F Lite

魔法AI绘画

Stock AI

Luma Photon

Janus Pro

Roll Art Die

face_anon_simple

Enterpix

暂无评论

网址

FeedAl翻译站点

789影视导航

大米星球

毒舌

FIX字幕侠主页

好片网

热门推荐