DeepSeek开源周第五日:探秘3FS与SmallPond的黄金组合

12天前 高效码农

当AI遇上海量数据:探秘3FS与SmallPond的黄金组合 一、Fire-Flyer文件系统(3FS)——AI时代的存储引擎 核心设计理念 这个被命名为”萤火虫”的分布式文件 …

DeepSeek开源周第四日:双向并行+智能负载均衡,训练效率飙升!

13天前 高效码农

技术全景概述 DeepSeek在V3/R1系列大模型训练中开源了三项核心技术:双向管道算法DualPipe实现全量计算通信重叠,专家负载均衡器EPLB解决万卡级MoE训练负载不均问题,配套开源性能分析 …

DeepSeek开源周第三日:DeepGEMM如何让矩阵计算快如闪电?

14天前 高效码农

揭秘AI加速黑科技:DeepGEMM如何让矩阵计算快如闪电? 一、为什么我们需要更快的“数学计算器”? 想象一下,AI模型(比如ChatGPT)做一次推理,就像用超大型计算器做亿万次加减乘除。而矩阵乘 …

DeepSeek开源周第二日-DeepEP

15天前 高效码农

DeepEP 是一个专为 混合专家模型(MoE) 和 专家并行(EP) 设计的通信库,旨在提供高效的 GPU 通信能力,支持高吞吐、低延迟的分布式计算,适用于训练和推理场景。 核心功能 高性能通信内核 …

DeepSeek开源周第一日-FlashMLA

16天前 高效码农

FlashMLA [](#flashmla) FlashMLA 是适用于 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列服务进行了优化。 目前已发布: BF16 块大小为 64 的分 …

windows安装部署DeepSeek模型兼容性检测

18天前 高效码农

如果想快速检测,请移步点击:DeepSeek模型兼容性检测检查设备能否运行不同规模的DeepSeek模型 硬件信息获取与模型支持判断 获取硬件信息的关键点 获取硬件信息的关键点包括: CPU 内存 G …

使用unsloth在kaggle上微调 DeepSeek R1

21天前 高效码农

在本教程中,我们将在 Hugging Face 的医疗思路链数据集上对模型进行微调DeepSeek-R1-Distill-Llama-8B。这个精简的 DeepSeek-R1 模型是通过在使用 Dee …

本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码

21天前 高效码农

本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码 问题背景 近期有开发者反馈,在使用本地部署的Deepseek大模型对接自定义知识库时,遇到了以下三类典型问题: 回答内容不准确 …

3个DeepSeek隐藏玩法,99%的人都不知道!

1个月前 高效码农

3个DeepSeek隐藏玩法,99%的人都不知道! 最近,DeepSeek-R1 这款号称“中国版O1”的 AI 模型刷屏了! 它在数学和编程领域表现出色,中文写作能力强,对提示词的理解也有很大突破。 …

零基础使用DeepSeek高效提问技巧

1个月前 高效码农

零基础使用DeepSeek高效提问技巧 核心原则 DeepSeek 是「模式匹配专家」,清晰的指令能激活更精准的知识关联。以下技巧助你高效对话: 技巧1:明确具体目标 反例与改进 ❌ 反例:帮我写个方 …