图像识别

共 6 篇网址

排序

发布更新浏览点赞

百度识图

百度识图通过图像识别和检索技术，为你提供全网海量、实时的图片信息；你可以通过上传，粘贴图片网址等方式寻找目标图片的高清大图，相似美图；通过猜词了解和认知图片内容（如花卉、宠物、名人等）；百度识图还拥有全网检索的人脸技术，帮你找到最相似的人脸。

070

效率工具 # 以图搜图 # 以图搜图在线识别 # 图像检索

Cubox

Cubox是一款专为深度阅读与学习设计的智能工具，利用先进的人工智能技术自动解读文章内容，充分释放用户在高亮标 […]

050

AI办公工具 AI工具导航 # AI # annotation # bookmark

在线图片文字识别转换

打赏赞微海报分享

050

在线工具文字工具 # pdf识别 # pdf转word # 图像识别

AI应用导航网

打赏赞微海报分享

030

一为导航导航网站 # AI # AI applications # AIGC

DeepSeek-VL2-Tiny

DeepSeek-VL2是一系列先进的大型混合专家（MoE）视觉语言模型，相较于前代DeepSeek-VL有显著提升。该模型系列在视觉问答、光学字符识别、文档/表格/图表理解、视觉定位等多项任务中展现出卓越的能力。DeepSeek-VL2由三种变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2，分别拥有1.0B、2.8B和4.5B激活参数。DeepSeek-VL2在激活参数相似或更少的情况下，与现有的开源密集型和基于MoE的模型相比，达到了竞争性或最先进的性能。

010

图像生成 # 图像识别 # 多模态理解 # 混合专家

Aquila-VL-2B-llava-qwen

Aquila-VL-2B模型是一个基于LLava-one-vision框架训练的视觉语言模型（VLM），选用Qwen2.5-1.5B-instruct模型作为语言模型（LLM），并使用siglip-so400m-patch14-384作为视觉塔。该模型在自建的Infinity-MM数据集上进行训练，包含约4000万图像-文本对。该数据集结合了从互联网收集的开源数据和使用开源VLM模型生成的合成指令数据。Aquila-VL-2B模型的开源，旨在推动多模态性能的发展，特别是在图像和文本的结合处理方面。

000

文案写作 # 图像识别 # 多模态 # 文本生成