开源强化学习框架rLLM:复现DeepSeek R1与OpenAI O3的完整指南

9天前 高效码农

开源代码推理模型DeepCoder-14B:14B参数媲美o3-mini的技术突破与实践路径 引言:代码生成模型的进化挑战与开源突破 在软件开发复杂度指数级增长的今天,智能代码生成技术已成为提升开发者 …

KnowSelf:基于知识自认知的LLM智能体训练框架解析

13天前 高效码农

Agentic Knowledgeable Self-awareness:探索KnowSelf技术框架的创新实践 突破传统AI代理局限的新范式 一、为什么我们需要自我感知的AI代理? 在AI技术飞速发 …