技术/人工智能/机器学习归档

2天前高效码农

强化学习在工具使用任务中的应用：ToolRL 的奖励设计在人工智能领域，大型语言模型（LLMs）近年来取得了显著的进步。这些模型不仅能生成自然语言，还能通过与外部工具（如搜索引擎、计算器或代码解释器 …