DeepEP 是一个专为 混合专家模型(MoE) 和 专家并行(EP) 设计的通信库,旨在提供高效的 GPU 通信能力,支持高吞吐、低延迟的分布式计算,适用于训练和推理场景。 核心功能 高性能通信内核 …