热门

PocketFlow

12个月前发布 38 00

PocketFlow是一个极简的LLM框架，仅用100行代码实现，旨在让LLM能够自主编程。它强调高级编程范式，去除低级实现细节，使LLM能专注于重要部分。该框架可作为LLM的学习资源，因其简洁性，易于理解和上手。它采用嵌套有向图的核心抽象，将任务分解为多个LLM步骤，支持分支和递归决策。PocketFlow是开源项目，采用MIT许可证...

收录时间：

2025-05-29

打开网站手机查看

代码辅助 # LLM框架 # 开源 # 极简代码 # 自主编程

PocketFlow

PocketFlow

PocketFlow是一个极简的LLM框架，仅用100行代码实现，旨在让LLM能够自主编程。它强调高级编程范式，去除低级实现细节，使LLM能专注于重要部分。该框架可作为LLM的学习资源，因其简洁性，易于理解和上手。它采用嵌套有向图的核心抽象，将任务分解为多个LLM步骤，支持分支和递归决策。PocketFlow是开源项目，采用MIT许可证，具有高度的灵活性和可扩展性。

数据统计

相关导航

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术，旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制，优化模型的推理能力，使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用，为软件工程领域带来了新的可能性。该技术目前处于研究阶段，尚未明确商业化定价，但其在提升开发效率和代码质量方面具有显著潜力。

MCP Directory

MCP Directory是一个为MCP服务器提供目录服务的网站，它允许用户发现和共享MCP服务器资源。该网站使用TypeScript开发，并且提供了一个友好的用户界面，方便用户快速找到所需的MCP服务器。它的重要性在于为MCP服务器用户提供了一个集中的平台，促进了资源共享和技术交流。

YuLan-Mini

YuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型，具有2.4亿参数，尽管仅使用1.08T的预训练数据，但其性能可与使用更多数据训练的行业领先模型相媲美。该模型特别擅长数学和代码领域，为了促进可复现性，团队将开源相关的预训练资源。

Scira

Scira 是一个基于 AI 技术的搜索引擎，旨在通过强大的语言模型和搜索能力，为用户提供更高效、更精准的信息检索体验。它支持多种语言模型，如 Grok 2.0 和 Claude 3.5 Sonnet，并集成了 Tavily 等搜索工具，能够提供网页搜索、编程代码运行、天气查询等多种功能。Scira 的主要优点在于其简洁的界面和强大的功能集成，适合对传统搜索引擎不满意、希望借助 AI 提升搜索效率的用户。该项目开源免费，用户可以根据自己的需求进行本地部署或使用其提供的在线服务。

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B 是一个经过强化学习优化的推理模型，基于 Qwen-7B 进行了蒸馏优化。它在数学、代码和推理任务上表现出色，能够生成高质量的推理链和解决方案。该模型通过大规模强化学习和数据蒸馏技术，显著提升了推理能力和效率，适用于需要复杂推理和逻辑分析的场景。

Vibe Coder

Vibe Coder 是由 Deepgram 开发的一款开源 VS Code 扩展，旨在探索语音驱动编程的可能性。它利用语音识别技术，让用户通过语音指令与 AI 编程助手进行交互，快速将想法转化为代码原型。这种创新的编程方式被称为‘vibe coding’，旨在提高编程效率并改变未来软件开发的方式。Vibe Coder 目前处于实验阶段，Deepgram 希望通过社区反馈不断完善该工具。

DeepCoder

DeepCoder-14B-Preview 是一个基于强化学习的代码推理大型语言模型，能够处理长上下文，具有 60.6% 的通过率，适用于编程任务和自动化代码生成。该模型的优势在于其训练方法的创新，提供了比其他模型更优的性能，且完全开源，支持广泛的社区应用和研究。

Qwen2.5-Coder-7B

Qwen2.5-Coder-7B是基于Qwen2.5的大型语言模型，专注于代码生成、代码推理和代码修复。它在5.5万亿的训练令牌上进行了扩展，包括源代码、文本代码接地、合成数据等，是目前开源代码语言模型的最新进展。该模型不仅在编程能力上与GPT-4o相匹配，还保持了在数学和一般能力上的优势，并支持长达128K令牌的长上下文。

暂无评论

您必须登录才能参与评论！

none

暂无评论...