
使用unsloth在kaggle上微调 DeepSeek R1
在本教程中,我们将在 Hugging Face 的医疗思路链数据集上对模型进行微调DeepSeek-R1-Distill-Llama-8B。这个精简的 DeepSeek-R1 模型是通过在使用 DeepSeek-R1 生成的数据上对 Llama 3.1 8B 模型进行微调而创建的。它展示了与原始模型类似的推理能力。如果您是 LLM 和微调的新手,我强烈建议您参加Python 中的 LLM 简...

本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码
本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码问题背景近期有开发者反馈,在使用本地部署的Deepseek大模型对接自定义知识库时,遇到了以下三类典型问题:回答内容不准确:模型输出的答案与知识库内容存在明显偏差不按知识库回答:模型完全忽略知识库内容,仅根据自身训练数据生成回答知识库乱码现象:加载的文档出现大量乱码字符,影响模型理解问题分析经过实际测试和日志分析,我们发...

3个DeepSeek隐藏玩法,99%的人都不知道!
3个DeepSeek隐藏玩法,99%的人都不知道!最近,DeepSeek-R1 这款号称“中国版O1”的 AI 模型刷屏了!它在数学和编程领域表现出色,中文写作能力强,对提示词的理解也有很大突破。但许多用户在使用后,发现它似乎并没有想象中那么好用。别急!今天给大家分享 3 个小技巧,帮你正确解锁 DeepSeek-R1 的隐藏玩法。1. 不要用结构化提示词对话以往我们用的 AI 模型,都需要...

零基础使用DeepSeek高效提问技巧
零基础使用DeepSeek高效提问技巧核心原则DeepSeek 是「模式匹配专家」,清晰的指令能激活更精准的知识关联。以下技巧助你高效对话:技巧1:明确具体目标反例与改进❌ 反例:帮我写个方案 缺陷诊断:缺少行业/场景/格式等关键约束条件✅ 正例: 作为跨境电商创业者,我需要制定亚马逊新品推广方案,请按以下框架展开:市场调研方法(要求包含3种低成本工具)推广阶段划分(分预热期/爆发期/长...