DeepSeek开源周第五日:探秘3FS与SmallPond的黄金组合

12天前 高效码农

当AI遇上海量数据:探秘3FS与SmallPond的黄金组合 一、Fire-Flyer文件系统(3FS)——AI时代的存储引擎 核心设计理念 这个被命名为”萤火虫”的分布式文件 …

程序员转行大模型开发避坑指南:大模型应用开发转型知识大纲

12天前 高效码农

以下是专为普通程序员设计的 大模型应用开发转型知识大纲 ,聚焦 快速上手+实战应用 ,帮你避开底层算法深坑,直达高薪岗位需求 一、基础认知篇(1周) 大模型核心概念 了解LLM能做什么(文本生成/摘要 …

DeepSeek开源周第四日:双向并行+智能负载均衡,训练效率飙升!

13天前 高效码农

技术全景概述 DeepSeek在V3/R1系列大模型训练中开源了三项核心技术:双向管道算法DualPipe实现全量计算通信重叠,专家负载均衡器EPLB解决万卡级MoE训练负载不均问题,配套开源性能分析 …

DeepSeek开源周第三日:DeepGEMM如何让矩阵计算快如闪电?

14天前 高效码农

揭秘AI加速黑科技:DeepGEMM如何让矩阵计算快如闪电? 一、为什么我们需要更快的“数学计算器”? 想象一下,AI模型(比如ChatGPT)做一次推理,就像用超大型计算器做亿万次加减乘除。而矩阵乘 …

DeepSeek开源周第二日-DeepEP

15天前 高效码农

DeepEP 是一个专为 混合专家模型(MoE) 和 专家并行(EP) 设计的通信库,旨在提供高效的 GPU 通信能力,支持高吞吐、低延迟的分布式计算,适用于训练和推理场景。 核心功能 高性能通信内核 …

DeepSeek开源周第一日-FlashMLA

16天前 高效码农

FlashMLA [](#flashmla) FlashMLA 是适用于 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列服务进行了优化。 目前已发布: BF16 块大小为 64 的分 …

通俗易懂的关于 MCP 协议介绍

17天前 高效码农

什么是 MCP?给大模型装个”万能接口”的新协议 最近AI圈有个新协议火了,它有个像机器人编号的名字叫 MCP(Model Context Protocol)。简单来说,它就像 …

windows安装部署DeepSeek模型兼容性检测

18天前 高效码农

如果想快速检测,请移步点击:DeepSeek模型兼容性检测检查设备能否运行不同规模的DeepSeek模型 硬件信息获取与模型支持判断 获取硬件信息的关键点 获取硬件信息的关键点包括: CPU 内存 G …

使用unsloth在kaggle上微调 DeepSeek R1

20天前 高效码农

在本教程中,我们将在 Hugging Face 的医疗思路链数据集上对模型进行微调DeepSeek-R1-Distill-Llama-8B。这个精简的 DeepSeek-R1 模型是通过在使用 Dee …

本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码

21天前 高效码农

本地Deepseek添加知识库:回答不准确、不按照知识库回答、知识库乱码 问题背景 近期有开发者反馈,在使用本地部署的Deepseek大模型对接自定义知识库时,遇到了以下三类典型问题: 回答内容不准确 …

3个DeepSeek隐藏玩法,99%的人都不知道!

1个月前 高效码农

3个DeepSeek隐藏玩法,99%的人都不知道! 最近,DeepSeek-R1 这款号称“中国版O1”的 AI 模型刷屏了! 它在数学和编程领域表现出色,中文写作能力强,对提示词的理解也有很大突破。 …

零基础使用DeepSeek高效提问技巧

1个月前 高效码农

零基础使用DeepSeek高效提问技巧 核心原则 DeepSeek 是「模式匹配专家」,清晰的指令能激活更精准的知识关联。以下技巧助你高效对话: 技巧1:明确具体目标 反例与改进 ❌ 反例:帮我写个方 …

ollama部署DeepSeek报错

1个月前 高效码农

报错信息 pull model manifest: 500: {"errors":[{"code":"INTERNAL_ERROR",&qu …