语言模型

排序

发布更新浏览点赞

LMSYS Org

LMSYS组织，大型模型系统组织，是一个致力于使大型模型及其系统基础设施的技术民主化的组织。

0320

pen

Pen.el是一个基于Emacs的docker应用程序，集成了多种语言模型，支持文本、代码、图像、音频和视频的处理，提供丰富的功能和灵活的应用场景。

0330

开发者工具编程AI # Emacs # 语言模型

智谱AI 开放平台

基于领先的千亿级多语言、多模态预训练模型，打造高效率、通用化的“模型即服务”AI开发新范式

0380

AIGC开发平台 AI应用接口API # AI # API # API应用接口

gpt-4-api

GPT-4接口申请地址

0290

ChatGPT # AI模型 # ChatGPT GPT4 # GPT4使用方法

OuteTTS-0.1-350M

OuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术，它不需要外部适配器或复杂架构，通过精心设计的提示和音频标记实现高质量的语音合成。该模型基于LLaMa架构，使用350M参数，展示了直接使用语言模型进行语音合成的潜力。它通过三个步骤处理音频：使用WavTokenizer进行音频标记化、CTC强制对齐创建精确的单词到音频标记映射、以及遵循特定格式的结构化提示创建。OuteTTS的主要优点包括纯语言建模方法、声音克隆能力、与llama.cpp和GGUF格式的兼容性。

0340

文案写作 # 声音克隆 # 文本到语音 # 语言模型

Xwen-Chat

Xwen-Chat由xwen-team开发，为满足高质量中文对话模型需求而生，填补领域空白。其有多个版本，具备强大语言理解与生成能力，可处理复杂语言任务，生成自然对话内容，适用于智能客服等场景，在Hugging Face平台免费提供。

0430

文案写作 # 中文对话 # 人工智能 # 文本生成

Dolly

Dolly是Databricks开发的大型语言模型，可以根据指令进行语言生成，适用于智能客服、文本生成等场景。

0570

其它AI工具科研助手 # 免费 # 指令遵循 # 语言模型

Vicuna-13B

Lmsys.org提供聊天机器人服务，包括Vicuna、Koala、OpenAssistant、Dolly和ChatGLM等不同模型。其中，Vicuna是一个具有出色性能的开源聊天机器人。

0410

AI 聊天与助手 # Twitter # Vicuna # WebLLM

Text Generation WebUI

text-generation-webui是一个用于大型语言模型的Gradio Web UI，支持多种模型和多种语言，可用于文本生成和语言模型研究。

0310

开发者工具编程AI # 免费 # 文本生成 # 语言模型

AMD-Llama-135m

AMD-Llama-135m是一个基于LLaMA2模型架构训练的语言模型，能够在AMD MI250 GPU上流畅加载使用。该模型支持生成文本和代码，适用于多种自然语言处理任务。

0330

代码辅助 # 代码生成 # 文本生成 # 机器学习

AskReddit But AI

AskReddit But AI是一款训练GPT-2模型的工具，通过自动生成有趣的问题，为用户提供了一个全新的互动体验。

0260

商业AI 客户支持 # 人工智能 # 语言模型

BioMedLM

BioMedLM是由斯坦福大学和DataBricks团队合作开发的基于GPT风格的生物医学语言模型，具有2.7亿参数，通过在生物医学领域的专业知识上训练，可以有效地回答有关医学和生物学的复杂问题。可以在单个A100 GPU上方便地进行微调，并在笔记本电脑上运行推理。在MedMCQA上达到57.3%的得分，在MMLU医学遗传学考试上达到69.0%的得分。产品功能包括生物医学问答系统、患者咨询回答、文献检索与总结、数据隐私与内部部署、模型训练数据的完全记录。BioMedLM已在Hugging Face Hub上公开发布，允许任何人下载并微调模型。

0280

医疗健康 # 医疗信息 # 生物医学 # 语言模型

BioMedLM

0370

医疗健康 # 医疗信息 # 生物医学 # 语言模型

Ollama.ai

Ollama是一款强大的本地语言模型工具，提供了Llama 2、Code Llama等模型的运行环境，用户可以自定义和创建自己的模型，适用于自然语言处理研究和应用开发。

0340

开发者工具编程AI # 免费 # 本地运行 # 语言模型

Llama3.1-8B-Chinese-Chat

Llama3.1-8B-Chinese-Chat是一个基于Meta-Llama-3.1-8B-Instruct模型的指令式调优语言模型，专为中文和英文用户设计，具有角色扮演和工具使用等多种能力。该模型通过ORPO算法进行微调，显著减少了中文问题用英文回答和回答中中英文混合的问题，特别是在角色扮演、功能调用和数学能力方面有显著提升。

0370

智能聊天机器人 # 中英文对话 # 工具使用 # 指令式调优

DeepSeek模型-QQ浏览器专线版

DeepSeek模型-QQ浏览器专线版，我可以帮你搜索、答疑、写作，请把你的任务交给我吧～

0350

智能AI 语言模型 # AI # AIGC # AI写作

Exa & Deepseek Chat App

Exa & Deepseek Chat App是一个开源的聊天应用，旨在通过Exa的API进行实时网络搜索，并结合Deepseek R1语言模型进行推理，以提供更准确的聊天体验。该应用基于Next.js、TailwindCSS和TypeScript构建，使用Vercel进行托管。它允许用户在聊天中获取最新的网络信息，并通过强大的语言模型进行智能对话。该应用免费开源，适合开发者和企业用户使用，可作为聊天工具的开发基础。

0370

智能聊天机器人 # AI # Next.js # tailwindcss

Fin-R1

Fin-R1 是一个专为金融领域设计的大型语言模型，旨在提升金融推理能力。由上海财经大学和财跃星辰联合研发，基于 Qwen2.5-7B-Instruct 进行微调和强化学习，具有高效的金融推理能力，适用于银行、证券等核心金融场景。该模型免费开源，便于用户使用和改进。

0440

金融 # 人工智能 # 开源 # 数据科学

Humanloop官网

Humanloop语言模型平台是一个基于最先进的机器学习技术构建的平台，旨在提高人工智能的效率和准确性。它能够训练和部署大型语言模型，从而提供更加智能化的语言处理能力，让AI应用更加接近人类。

0340

AI提示词 AI文本生成 # AIGC写作平台 # AI写作提示 # 人工智能

Transformer-XL

Transformer-XL是一种超越固定长度上下文的注意力语言模型，支持单节点多GPU和多主机TPU训练，取得了最新的最佳结果。

0230

商业AI 生产效率 # 注意力机制 # 语言模型

Proofreading AI

Proofreading AI是一个在线AI校对工具，它利用先进的语言模型GPT-4/4o来校对文档，提供精确的结果。这个工具不仅可以纠正语法错误、拼写错误，还能检测抄袭、去除抄袭内容、检测AI生成文本、人性化AI文本、生成引用和改写文本。Proofreading AI的主要优点包括无缝上传文档、即时下载校正后的文档、以及提供多种写作辅助工具。它的背景信息显示，Proofreading AI提供了比传统校对工具更多的功能，并且价格相对实惠。

0440

文案写作 # AI技术 # 写作辅助 # 文档处理

MiniMax-Text-01

MiniMax-Text-01是一个由MiniMaxAI开发的大型语言模型，拥有4560亿总参数，其中每个token激活459亿参数。它采用了混合架构，结合了闪电注意力、softmax注意力和专家混合（MoE）技术，通过先进的并行策略和创新的计算-通信重叠方法，如线性注意力序列并行主义加（LASP+）、变长环形注意力、专家张量并行（ETP）等，将训练上下文长度扩展到100万token，并能在推理时处理长达400万token的上下文。在多个学术基准测试中，MiniMax-Text-01展现出了顶级模型的性能。

0550

文案写作 # 并行策略 # 文本生成 # 混合架构

CAG

CAG（Cache-Augmented Generation）是一种创新的语言模型增强技术，旨在解决传统RAG（Retrieval-Augmented Generation）方法中存在的检索延迟、检索错误和系统复杂性等问题。通过在模型上下文中预加载所有相关资源并缓存其运行时参数，CAG能够在推理过程中直接生成响应，无需进行实时检索。这种方法不仅显著降低了延迟，提高了可靠性，还简化了系统设计，使其成为一种实用且可扩展的替代方案。随着大型语言模型（LLMs）上下文窗口的不断扩展，CAG有望在更复杂的应用场景中发挥作用。

0540

文案写作 # 文本生成 # 知识缓存 # 自然语言处理

Yandex YaLM

YaLM-100B是一款拥有1000亿参数的预训练语言模型，具备强大的文本生成和处理能力，适用于自然语言处理、机器翻译、对话系统等多个领域。

0370

商业AI 生产效率 # 文本生成 # 语言模型

Azure OpenAI Service

Azure OpenAI Service是一项先进的语言模型服务，提供了业界领先的编码和语言AI模型，可用于代码生成、文本生成、翻译服务和语义理解等应用。

0290

大模型API 开发者工具 # AI # 语言模型

AI21 Labs

AI21实验室是一个人工智能实验室；一家产品公司，其使命是通过让机器成为人类的思维伙伴来重新想象我们的阅读和写作方式。

0380

AI模型框架 AI赋能 # AI21 # AI技术 # 人工智能

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型，基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色，是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用，允许修改和衍生作品，适合学术研究和企业应用。

0400

代码辅助 # 代码生成 # 多语言 # 开源

Show-Me

Show-Me是一个开源应用程序，旨在提供传统大型语言模型(如ChatGPT)交互的可视化和透明替代方案。它通过将复杂问题分解成一系列推理子任务，使用户能够理解语言模型的逐步思考过程。该应用程序使用LangChain与语言模型交互，并通过动态图形界面可视化推理过程。

0330

代码辅助 # 可视化 # 开源 # 推理

MiniCPM3-4B

MiniCPM3-4B是MiniCPM系列的第三代产品，整体性能超越了Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125，与许多近期的7B至9B模型相当。与前两代相比，MiniCPM3-4B具有更强大的多功能性，支持函数调用和代码解释器，使其能够更广泛地应用于各种场景。此外，MiniCPM3-4B拥有32k的上下文窗口，配合LLMxMapReduce技术，理论上可以处理无限上下文，而无需大量内存。

0460

智能聊天机器人 # 对话系统 # 文本生成 # 机器学习

Llama-3-Patronus-Lynx-70B-Instruct

PatronusAI/Llama-3-Patronus-Lynx-70B-Instruct是一个基于Llama-3架构的大型语言模型，旨在检测在RAG设置中的幻觉问题。该模型通过分析给定的文档、问题和答案，评估答案是否忠实于文档内容。其主要优点在于高精度的幻觉检测能力和强大的语言理解能力。该模型由Patronus AI开发，适用于需要高精度信息验证的场景，如金融分析、医学研究等。该模型目前为免费使用，但具体的商业应用可能需要与开发者联系。

0310

文案写作 # 幻觉检测 # 开源 # 文本生成

Browsing by Open AI

0290

视频AI 视频编辑 # 查件 # 语言模型

Gopher by DeepMind

DeepMind发布了三篇关于语言模型的论文，其中包括对一个2800亿参数的语言模型Gopher的详细研究，以及大型语言模型的伦理和社会风险研究。

0260

商业AI 客户支持 # Gopher # 语言模型

AudioLM

AudioLM是由Google Research开发的一个框架，用于高质量音频生成，具有长期一致性。它将输入音频映射到离散标记序列，并将音频生成视为这一表示空间中的语言建模任务。AudioLM通过在大量原始音频波形上训练，学习生成自然且连贯的音频续篇，即使在没有文本或注释的情况下，也能生成语法和语义上合理的语音续篇，同时保持说话者的身份和韵律。此外，AudioLM还能生成连贯的钢琴音乐续篇，尽管它在训练时没有使用任何音乐的符号表示。

0360

音乐创作 # 神经编解码器 # 语言模型 # 音乐制作

LLaVA++

LLaVA++是一个开源项目，旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发，通过结合最新的大型语言模型，增强了模型在遵循指令和学术任务导向数据集上的表现。

0440

销售管理 # 人工智能 # 开源项目 # 机器学习

DeepHermes-3-Llama-3-8B-Preview

DeepHermes 3 是 NousResearch 开发的先进语言模型，能够通过系统性推理提升回答准确性。它支持推理模式和常规响应模式，用户可以通过系统提示切换。该模型在多轮对话、角色扮演、推理等方面表现出色，旨在为用户提供更强大和灵活的语言生成能力。模型基于 Llama-3.1-8B 微调，参数量达 80.3 亿，支持多种应用场景，如推理、对话、函数调用等。

0470

智能聊天机器人 # JSON 输出 # 函数调用 # 多轮对话

AlphaMaze-v0.2-1.5B

AlphaMaze 是一个专注于提升大型语言模型（LLM）视觉推理能力的项目。它通过文本形式描述的迷宫任务来训练模型，使其能够理解和规划空间结构。这种方法不仅避免了复杂的图像处理，还通过文本描述直接评估模型的空间理解能力。其主要优点是能够揭示模型如何思考空间问题，而不仅仅是能否解决问题。该模型基于开源框架，旨在推动语言模型在视觉推理领域的研究和发展。

0460

学习教育 # 人工智能 # 开源 # 教育

Krasp

KraspAI是一款强大的语言模型测试工具，帮助用户快速比较不同模型的性能，无需编写代码，轻松创建自定义测试套件。

0290

开发者工具生产效率 # 免费增值。# 性能比较 # 测试套件

Hello AI

Hello AI是一款最先进的聊天机器人应用，为您提供个性化、直观的对话体验，帮助您解决各种问题，无论是学习、工作还是生活。

0490

其它AI工具有趣的工具 # 聊天机器人 # 语言模型

Tülu 3

Tülu 3是一系列开源的先进语言模型，它们经过后训练以适应更多的任务和用户。这些模型通过结合专有方法的部分细节、新颖技术和已建立的学术研究，实现了复杂的训练过程。Tülu 3的成功根植于精心的数据管理、严格的实验、创新的方法论和改进的训练基础设施。通过公开分享数据、配方和发现，Tülu 3旨在赋予社区探索新的和创新的后训练方法的能力。

0370

数据分析 # AI # 后训练 # 开源

YuLan-Mini

YuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型，具有2.4亿参数，尽管仅使用1.08T的预训练数据，但其性能可与使用更多数据训练的行业领先模型相媲美。该模型特别擅长数学和代码领域，为了促进可复现性，团队将开源相关的预训练资源。

0310

代码辅助 # 开源 # 数学 # 编程

Chat Ever After

Chat Ever After是一款AI驱动的悲伤预防疗法产品，让您能够与已故的亲人进行对话，保持联系，缓解痛苦。

0290

其它AI工具卫生保健 # 免费增值。# 语言模型

PowerInfer

PowerInfer 是一个在个人电脑上利用消费级 GPU 进行高速大型语言模型推理的引擎。它利用 LLM 推理中的高局部性特点，通过预加载热激活的神经元到 GPU 上，从而显著降低了 GPU 内存需求和 CPU-GPU 数据传输。PowerInfer 还集成了自适应预测器和神经元感知的稀疏运算符，优化神经元激活和计算稀疏性的效率。它可以在单个 NVIDIA RTX 4090 GPU 上以平均每秒 13.20 个标记的生成速率进行推理，比顶级服务器级 A100 GPU 仅低 18%。同时保持模型准确性。

0310

搜索引擎优化 # 推理引擎 # 消费级 GPU # 语言模型

Metaphor Systems

Metaphor是一个使用AI提供即时搜索结果的搜索引擎，它旨在通过发现新的搜索方式来重新发现互联网，通过任何查询搜索人类知识的整个知识库。

0270

AI 聊天与助手 # ai应用 # Metaphor Systems # 搜索引擎

podscript

Podscript 是一个强大的音频转录工具，它利用语言模型和语音到文本（STT）API，为播客和其他音频内容生成高质量的转录文本。该工具支持多种流行的STT服务，如Deepgram、AssemblyAI和Groq，并且可以处理YouTube视频的自动生成字幕。Podscript的主要优点是其灵活性和易用性，用户可以通过简单的命令行界面或方便的Web界面来操作。它适用于播客创作者、内容制作者以及需要快速转录音频的用户。Podscript是开源的，用户可以根据自己的需求进行定制和扩展。

0440

音频处理 # STT # 开源工具 # 播客

WebGPT

WebGPT是一款基于GPT-3的语言模型，通过模拟人类在网页浏览器上搜索答案的方式，提高了回答开放性问题的准确性和可靠性。

0520

商业AI 生产效率 # 事实准确性 # 语言模型

LLM Codenames

LLM Codenames 是一个基于语言模型的创意命名工具。它利用先进的自然语言处理技术，能够根据用户输入的关键词或主题，快速生成一系列独特且富有创意的名称。这种工具对于需要进行品牌命名、产品命名或创意写作的用户来说非常实用。它可以帮助用户节省大量时间和精力，避免命名过程中的重复劳动。LLM Codenames 的主要优点是其高效性和创意性，能够提供多样化的命名选择，满足不同用户的需求。该工具目前以网站形式提供服务，用户可以通过浏览器直接访问使用，无需安装任何软件。

0330

文案写作 # 创意 # 协作 # 命名

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite 是 Google 推出的高效语言模型，专为长文本处理和复杂任务优化。它在推理、多模态、数学和事实性基准测试中表现出色，具备简化的价格策略，使得百万级上下文窗口更加经济实惠。Gemini 2.0 Flash-Lite 已在 Google AI Studio 和 Vertex AI 中全面开放，适合企业级生产使用。

0300

文案写作 # AI # 多模态 # 数据分析

Jamba 1.6

Jamba 1.6 是 AI21 推出的最新语言模型，专为企业私有部署而设计。它在长文本处理方面表现出色，能够处理长达 256K 的上下文窗口，采用混合 SSM-Transformer 架构，可高效准确地处理长文本问答任务。该模型在质量上超越了 Mistral、Meta 和 Cohere 等同类模型，同时支持灵活的部署方式，包括在本地或 VPC 中私有部署，确保数据安全。它为企业提供了一种无需在数据安全和模型质量之间妥协的解决方案，适用于需要处理大量数据和长文本的场景，如研发、法律和金融分析等。目前，Jamba 1.6 已在多个企业中得到应用，如 Fnac 使用其进行数据分类，Educa Edtech 利用其构建个性化聊天机器人等。

0310

文案写作 # 企业部署 # 数据安全 # 灵活部署

Meditron

Meditron 是一套开源的医学大型语言模型（LLM）套件。它通过对一份经过综合筛选的医学语料库进行持续预训练，包括选定的 PubMed 论文和摘要、一份新的国际认可的医学指南数据集以及一个通用领域语料库，将 Llama-2 适应到医学领域。Meditron-70B 在相关数据上进行了微调，性能优于 Llama-2-70B、GPT-3.5 和 Flan-PaLM。

0420

医疗健康 # 人工智能 # 医学 # 医疗保健

Eurus-2-7B-SFT

Eurus-2-7B-SFT是基于Qwen2.5-Math-7B模型进行微调的大型语言模型，专注于数学推理和问题解决能力的提升。该模型通过模仿学习（监督微调）的方式，学习推理模式，能够有效解决复杂的数学问题和编程任务。其主要优点在于强大的推理能力和对数学问题的准确处理，适用于需要复杂逻辑推理的场景。该模型由PRIME-RL团队开发，旨在通过隐式奖励的方式提升模型的推理能力。

0230

代码辅助 # 人工智能 # 推理 # 数学推理

AI Playground by Vercel

AI Playground是一个集成了OpenAI GPT-3.5 Turbo和Meta/llama-v2-70b-chat两个强大的AI语言模型的平台，帮助用户轻松完成各种文案内容创作和自然语言处理任务。

0260

文本AI 社交媒体助理 # 人工智能 # 免费 # 语言模型

GPTionary官网

GPTionary是一款基于GPT及其它先进自然语言处理技术的下一代同义词库，它提供的同义词映射关系可以有效提高人们的语言表达能力和写作效率。

0280

ai学习平台 AI教育应用 # NLP技术 # 同义词库 # 自然语言处理

OPT-175B

Meta AI共享了OPT-175B，这是一个1750亿参数的语言模型，旨在促进对大规模语言模型的研究和改进，提供更多社区参与。

0340

商业AI 生产效率 # 自然语言处理 # 语言模型

OpenPlayground Compare

OpenPlayground Compare是一个用于比较不同语言模型的开源工具，你可以在网站上注册一个免费账户，并通过在右侧面板更改设置来免费使用ChatGPT 4模型。

0280

AI 聊天与助手 # ChatGPT-4 # OpenPlayground Compare # 比较

GPT-2

GPT-2是一种大规模无监督语言模型，能够生成连贯的段落文本，并在多个语言任务上表现出色。

0270

商业AI 生产效率 # 生成文本 # 语言模型

MiniCPM-o-2_6

MiniCPM-o 2.6是MiniCPM-o系列中最新且功能最强大的模型。该模型基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建，拥有8B参数。它在视觉理解、语音交互和多模态直播方面表现出色，支持实时语音对话和多模态直播功能。该模型在开源社区中表现优异，超越了多个知名模型。其优势在于高效的推理速度、低延迟、低内存和功耗，能够在iPad等终端设备上高效支持多模态直播。此外，MiniCPM-o 2.6易于使用，支持多种使用方式，包括llama.cpp的CPU推理、int4和GGUF格式的量化模型、vLLM的高吞吐量推理等。

0270

语音处理 # 多模态 # 实时直播 # 视觉理解

HuatuoGPT-o1-70B

HuatuoGPT-o1-70B是由FreedomIntelligence开发的医疗领域大型语言模型（LLM），专为复杂的医疗推理设计。该模型在提供最终响应之前，会生成一个复杂的思考过程，反映并完善其推理。HuatuoGPT-o1-70B能够处理复杂的医疗问题，提供深思熟虑的答案，这对于提高医疗决策的质量和效率至关重要。该模型基于LLaMA-3.1-70B架构，支持英文，并且可以部署在多种工具上，如vllm或Sglang，或者直接进行推理。

0510

医疗健康 # 医疗 # 大型模型 # 推理

ChatGPT Everywhere

ChatGPT for Gmail and Google是一款Chrome浏览器扩展，可以在Google搜索和Gmail中使用ChatGPT智能助手，帮助用户获取准确、全面的答案和信息，提高工作效率。

0370

写作助手文本AI # 免费 # 智能助手 # 语言模型

Eurus-2-7B-PRIME

PRIME-RL/Eurus-2-7B-PRIME是一个基于PRIME方法训练的7B参数的语言模型，旨在通过在线强化学习提升语言模型的推理能力。该模型从Eurus-2-7B-SFT开始训练，利用Eurus-2-RL-Data数据集进行强化学习。PRIME方法通过隐式奖励机制，使模型在生成过程中更加注重推理过程，而不仅仅是结果。该模型在多项推理基准测试中表现出色，相较于其SFT版本平均提升了16.7%。其主要优点包括高效的推理能力提升、较低的数据和模型资源需求，以及在数学和编程任务中的优异表现。该模型适用于需要复杂推理能力的场景，如编程问题解答和数学问题求解。

0480

文案写作 # 强化学习 # 推理能力 # 数学

Flush AI

Flush AI是一款全面的AI艺术工作室，提供云端一站式解决方案，集成了各种AI图像模型和语言模型，帮助创作者们实现无限的创作可能性。

0240

AI绘画生成器图像AI # Model as a Service # 语言模型

Scribble AI

Scribble AI是一款可以在App Store上下载的文本生成器应用程序，使用OpenAI的GPT-3语言模型自动生成文本。

0460

AI写作与文本 # App store # GPT-3 # ipad

InstructGPT

InstructGPT是一种强大的语言模型，经过训练后能够更好地遵循用户的指令，提供准确、真实和无毒的回答。它可以应用于在线客服、内容生成和语言理解研究等多个领域。

0220

商业AI 生产效率 # AI技术 # 语言模型

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

该产品是一个基于Qwen2.5-32B的4位量化语言模型，通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时，显著降低了模型的存储和计算需求，适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景，如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。

0300

代码辅助 # 内容创作 # 多语言 # 开源

Google GLaM

GLaM是一种高效的语言模型，通过混合专家的方法，实现了在训练和使用过程中的高效性，具有多任务学习的能力。

0380

商业AI 生产效率 # 深度学习 # 语言模型

LLMWare

LLMWare.ai是一个为金融、法律、合规和监管密集型行业设计的AI工具，专注于私有云中的小型专业化语言模型和专为SLMs设计的AI框架。它提供了一个集成的、高质量的、组织良好的框架，用于开发AI代理工作流、检索增强生成（RAG）和其他用例的LLM应用程序，包括许多核心对象，以便开发者可以立即开始。

0320

金融 # AI # 企业 # 合规

SayCan by Google

SayCan是一种将语言模型与机器人操作相结合的方法，通过预训练的行为将语言模型与机器人的能力和环境联系起来，实现基于自然语言的复杂任务执行。

0290

商业AI 生产效率 # 机器人操作 # 语言模型

Peach-9B-8k-Roleplay

Peach-9B-8k-Roleplay是一个经过微调的大型语言模型，专门用于角色扮演对话。它基于01-ai/Yi-1.5-9B模型，通过数据合成方法在超过100K的对话上进行训练。尽管模型参数较小，但可能在34B以下参数的语言模型中表现最佳。

0360

智能聊天机器人 # 对话生成 # 角色扮演 # 语言模型

Llama3-Aloe-8B-Alpha

Aloe是由HPAI开发的一款医疗领域的语言模型，基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略，达到了与其规模相匹配的最先进水平。Aloe在好好看的和事实性指标上得分较高，这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估，以促进这些系统的安全使用和部署。

0350

医疗健康 # 事实性 # 伦理 # 医疗

DeepSeek Japanese

DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型，专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色，采用强化学习和混合专家框架优化性能，以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新，同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛，适合广泛的应用场景。

0500

代码辅助 # AI # 多模态 # 开源

INTELLECT-1 Chat

INTELLECT-1 Chat是一个由全球合作训练的10B参数语言模型驱动的聊天工具。它代表了人工智能领域中大规模语言模型的最新进展，通过分散式训练，提高了模型的多样性和适应性。这种技术的主要优点包括能够理解和生成自然语言，提供流畅的对话体验，并且能够处理大量的语言数据。产品背景信息显示，这是一个首次展示分散式训练可能性的演示，易于使用且富有趣味性。价格方面，页面提供了登录以保存和重访聊天的功能，暗示了可能的付费或会员服务模式。

0460

智能聊天机器人 # 人工智能 # 全球合作 # 分散式训练

OLMo-2-1124-13B-DPO

OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型，主要针对英文，旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分，旨在推动语言模型的科学研究。模型训练基于Dolma数据集，并公开代码、检查点、日志和训练细节。

0320

文案写作 # 人工智能 # 文本生成 # 机器学习

HuatuoGPT-o1-7B

HuatuoGPT-o1-7B是由FreedomIntelligence开发的医疗领域大型语言模型（LLM），专为高级医疗推理设计。该模型在提供最终回答之前，会生成复杂的思考过程，反映并完善其推理。HuatuoGPT-o1-7B支持中英文，能够处理复杂的医疗问题，并以'思考-回答'的格式输出结果，这对于提高医疗决策的透明度和可靠性至关重要。该模型基于Qwen2.5-7B，经过特殊训练以适应医疗领域的需求。

0470

文案写作 # 中英文支持 # 医疗 # 推理

Llama 3.1 Nemotron Ultra 253B

Llama-3.1-Nemotron-Ultra-253B-v1 是一个基于 Llama-3.1-405B-Instruct 的大型语言模型，经过多阶段的后训练以提升推理和聊天能力。该模型支持高达 128K 的上下文长度，具备较好的准确性和效率平衡，适用于商业用途，旨在为开发者提供强大的 AI 助手功能。

0460

开发者工具 # AI # 开发工具 # 推理

没有了

LMSYS Org

pen

智谱AI 开放平台

gpt-4-api

OuteTTS-0.1-350M

Xwen-Chat

Dolly

Vicuna-13B

Text Generation WebUI

AMD-Llama-135m

AskReddit But AI

BioMedLM

BioMedLM

Ollama.ai

Llama3.1-8B-Chinese-Chat

DeepSeek模型-QQ浏览器专线版

Exa & Deepseek Chat App

Fin-R1

Humanloop官网

Transformer-XL

Proofreading AI

MiniMax-Text-01

CAG

Yandex YaLM

Azure OpenAI Service

AI21 Labs

DeepSeek-R1-Distill-Llama-8B

Show-Me

MiniCPM3-4B

Llama-3-Patronus-Lynx-70B-Instruct

Browsing by Open AI

Gopher by DeepMind

AudioLM

LLaVA++

DeepHermes-3-Llama-3-8B-Preview

AlphaMaze-v0.2-1.5B

Krasp

Hello AI

Tülu 3

YuLan-Mini

Chat Ever After

PowerInfer

Metaphor Systems

podscript

WebGPT

LLM Codenames

Gemini 2.0 Flash-Lite

Jamba 1.6

Meditron

Eurus-2-7B-SFT

AI Playground by Vercel

GPTionary官网

OPT-175B

OpenPlayground Compare

GPT-2

MiniCPM-o-2_6

HuatuoGPT-o1-70B

ChatGPT Everywhere

Eurus-2-7B-PRIME

Flush AI

Scribble AI

InstructGPT

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

Google GLaM

LLMWare

SayCan by Google

Peach-9B-8k-Roleplay

Llama3-Aloe-8B-Alpha

DeepSeek Japanese

INTELLECT-1 Chat

OLMo-2-1124-13B-DPO

HuatuoGPT-o1-7B

Llama 3.1 Nemotron Ultra 253B

热门网址