Open-Sora-PlanOpen-Sora-Plan是一个开源项目,旨在复现OpenAI的Sora(T2V模型),并构建关于Video-VQVAE(VideoGPT)+ DiT的知识。项目由北京大学-兔展AIGC联合实验室发起,目前资源有限,希望开源社区能够贡献力量。项目提供了训练代码,并欢迎Pull Request。
avp_teleoperate这是一个开源项目,用于实现人形机器人Unitree H1_2的遥控操作。它利用了Apple Vision Pro技术,允许用户通过虚拟现实环境来控制机器人。该项目在Ubuntu 20.04和Ubuntu 22.04上进行了测试,并且提供了详细的安装和配置指南。该技术的主要优点包括能够提供沉浸式的遥控体验,并且支持在模拟环境中进行测试,为机器人遥控领域提供了新的解决方案。
RL4VLMRL4VLM是一个开源项目,旨在通过强化学习微调大型视觉-语言模型,使其成为能够做出决策的智能代理。该项目由Yuexiang Zhai, Hao Bai, Zipeng Lin, Jiayi Pan, Shengbang Tong, Alane Suhr, Saining Xie, Yann LeCun, Yi Ma, Sergey Levine等研究人员共同开发。它基于LLaVA模型,并采用了PPO算法进行强化学习微调。RL4VLM项目提供了详细的代码库结构、入门指南、许可证信息以及如何引用该研究的说明。
ChatRWKVChatRWKV是一种基于100%RNN的RWKV语言模型构建的开源聊天助手,它可以像ChatGPT一样进行人机对话,但具有更快的速度和更低的显存消耗。该项目由Stability EleutherAI提供训练赞助,最新版RWKV-6已经达到了Mamba级别的性能。
WordPecker AppWordPecker App是一款创新的语言学习工具,旨在通过个性化学习体验帮助用户高效掌握新语言。它结合了Duolingo风格的互动课程和用户自定义的词汇表,支持从书籍、文章或视频中无缝添加单词,并通过LLM生成的课程进行复习。该产品利用最新的AI技术,为用户提供沉浸式学习体验,同时支持多种语言偏好设置,适合不同语言学习者的需求。其开源特性也鼓励社区参与和持续改进。
Argmax WhisperKitWhisperKit由Argmax公司推出,是一个基于Whisper项目的推理工具包,它允许在iOS和macOS应用程序中进行语音识别和转录。该项目的目标是收集开发者反馈,并在几周内发布一个稳定的候选版本,以加速设备上推理的生产化。
LBM该产品是基于格子玻尔兹曼方法(LBM)的项目,格子玻尔兹曼方法是一种用于计算流体动力学的数值技术,通过模拟微观粒子的运动来描述宏观流体行为。其重要性在于可以对复杂流体系统进行高效模拟,例如多相流、多孔介质中的流动等。主要优点包括计算效率较高、边界条件处理相对简单、易于并行化等。从项目页面来看,该项目是开源项目,托管于GitHub,适合研究人员、学生等进行相关的流体动力学模拟研究和学习,定位为科研和学术用途,目前免费使用。