开源项目
Search-R1,开源版的DeepSeek-R1(-Zero)的复现,用于训练推理和搜索(工具调用)交错LLMs
Search-R1,开源版的DeepSeek-R1(-Zero)的复现,用于训练...
DeepSeek开源第五天,3FS,所有DeepSeek数据访问的推进器,使用现代SSD和RDMA网络的完整带宽的并行文件系统
DeepSeek开源第五天,3FS,所有DeepSeek数据访问的推进器,使用现...
DeepSeek开源第四天,优化的并行性策略,DualPipe,EPLB,Profiling Data 3款优化的开源项目
DeepSeek开源第四天,优化的并行性策略,DualPipe,EPLB,Pro...
DeepSeek开源第三天,DeepGemm,一个支持密集和Moe Gemms的FP8 GEMM库,为V3/R1训练和推理提供动力
DeepSeek开源第三天,DeepGemm,一个支持密集和Moe Gemms的...
DeepSeek开源第一天,FlashMLA,Hopper GPU的有效的MLA解码内核,可用于可变长度序列,现在在生产中进行了优化
DeepSeek开源第一天,FlashMLA,Hopper GPU的有效的MLA...