使用unsloth在kaggle上微调 DeepSeek R1

在本教程中，我们将在 Hugging Face 的医疗思路链数据集上对模型进行微调DeepSeek-R1-Distill-Llama-8B。这个精简的 DeepSeek-R1 模型是通过在使用 DeepSeek-R1 生成的数据上对 Llama 3.1 8B 模型进行微调而创建的。它展示了与原始模型类似的推理能力。如果您是 LLM 和微调的新手，我强烈建议您参加Python 中的 LLM 简...

高效码农 in DeepSeek

February 19, 2025

本地Deepseek添加知识库：回答不准确、不按照知识库回答、知识库乱码

本地Deepseek添加知识库：回答不准确、不按照知识库回答、知识库乱码问题背景近期有开发者反馈，在使用本地部署的Deepseek大模型对接自定义知识库时，遇到了以下三类典型问题：回答内容不准确：模型输出的答案与知识库内容存在明显偏差不按知识库回答：模型完全忽略知识库内容，仅根据自身训练数据生成回答知识库乱码现象：加载的文档出现大量乱码字符，影响模型理解问题分析经过实际测试和日志分析，我们发...

高效码农 in DeepSeek

February 8, 2025

3个DeepSeek隐藏玩法，99%的人都不知道！

3个DeepSeek隐藏玩法，99%的人都不知道！最近，DeepSeek-R1 这款号称“中国版O1”的 AI 模型刷屏了！它在数学和编程领域表现出色，中文写作能力强，对提示词的理解也有很大突破。但许多用户在使用后，发现它似乎并没有想象中那么好用。别急！今天给大家分享 3 个小技巧，帮你正确解锁 DeepSeek-R1 的隐藏玩法。1. 不要用结构化提示词对话以往我们用的 AI 模型，都需要...

高效码农 in DeepSeek

February 8, 2025

零基础使用DeepSeek高效提问技巧

零基础使用DeepSeek高效提问技巧核心原则DeepSeek 是「模式匹配专家」，清晰的指令能激活更精准的知识关联。以下技巧助你高效对话：技巧1：明确具体目标反例与改进❌ 反例：帮我写个方案缺陷诊断：缺少行业/场景/格式等关键约束条件✅ 正例：作为跨境电商创业者，我需要制定亚马逊新品推广方案，请按以下框架展开：市场调研方法（要求包含3种低成本工具）推广阶段划分（分预热期/爆发期/长...

标签 DeepSeek 下的文章

使用unsloth在kaggle上微调 DeepSeek R1

本地Deepseek添加知识库：回答不准确、不按照知识库回答、知识库乱码

3个DeepSeek隐藏玩法，99%的人都不知道！

零基础使用DeepSeek高效提问技巧