代码评估

共 4 篇网址

排序

发布更新浏览点赞

Codei

Codei是一个专注于帮助软件工程师追踪工作申请、提升技术技能和编码能力的平台。它通过ApplicationAI模型简化了申请跟踪流程，通过QuestionAI模型生成针对个人和职位的技术面试问题，并通过EvalAI模型对代码进行评分和反馈，以提高编码技能和风格。

0710

人力资源 # 代码评估 # 技术面试 # 申请跟踪

Skywork-o1-Open-PRM-Qwen-2.5-7B

Skywork-o1-Open-PRM-Qwen-2.5-7B是由昆仑科技Skywork团队开发的一系列模型，这些模型结合了o1风格的慢思考和推理能力。这个模型系列不仅在输出中展现出天生的思考、规划和反思能力，而且在标准基准测试中显示出推理技能的显著提升。它代表了AI能力的战略进步，将一个原本较弱的基础模型推向了推理任务的最新技术（SOTA）。

0690

代码辅助 # AI推理 # 代码评估 # 多语言支持

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型，这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力，适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同，Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力，而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步，将原本较弱的基础模型推向了推理任务的最新技术（SOTA）。

0740

代码辅助 # AI推理 # Hugging Face # 代码评估

FullStack Bench

FullStack Bench是一个多语言的全栈编程基准测试，涵盖了广泛的应用领域和16种编程语言的3K测试样本，显著推动了代码语言模型在现实世界代码开发场景中的相关能力。该产品代表了编程语言模型在全栈开发领域的应用，其重要性在于能够评估和提升模型在实际编程任务中的表现，对于开发者和AI研究者来说都是一个宝贵的资源。

0770

代码辅助 # 代码评估 # 全栈开发 # 多语言支持