More than code

More Than Code
The efficiency of your iteration of reading, practicing and thinking decides your understanding of the world.
未分类

AI集群网络相关知识

文章:https://zhuanlan.zhihu.com/p/673903240 通信的实现方式分为两种类型:机器内通信与机器间通信。 机器内通信: * 共享内存(QPI/UPI),比如:CPU与CPU之间的通信可以通过共享内存。 * PCIe,通常是CPU与GPU之间的通信。 * NVLink,通常是GPU与GPU之间的通信,也可以用于CPU与GPU之间的通信。 机器间通信: * TCP/IP 网络协议。 * RDMA (Remote Direct Memory Access) 网络协议。 * InfiniBa…

2026年2月20日 0条评论 133点热度 0人点赞 sheep 阅读全文
未分类

2025年终总结

过年回家正好前两天有点萎靡不太想学东西,来整理整理写一写25年的年终总结。 今年事比较多,不过大体还是就两大块,工作,生活,还有一些其他小的思考(没空单独的写文章,就一起挤到年终总结里来) 工作 GraphRAG 今年最核心的点了,整个人的工作重心从之前的存储引擎变成了GraphRAG,一个新的项目。 主要感谢老板的认可,给我投了很多的人力,并搞项目的时候给了很多帮助,让我也SFT了一把,学习到了很多新方法。 当然也要感谢GraphRAG小组的同学的支持,接业务,日常运维开发都比较辛苦。最后感觉结果还不错,虽然没有…

2026年2月15日 2条评论 200点热度 6人点赞 sheep 阅读全文
未分类

Demystifying NCCL notes

Overview API Communication management 通信需要通过communicator来进行。ncclCommInitAll来初始化communicator ncclCommDestroy用来销毁一个communicator,会等待pending operation ncclCommAbort立刻销毁communicator,取消pending operation,用来避免死锁 Collective communication ncclAllReduce, ncclBroadcast, n…

2026年2月10日 0条评论 153点热度 0人点赞 sheep 阅读全文
未分类

zero bubble PP

最上面的是zero bubble h1 第二张图是减少T_w之后的调度结果 第三/四张图是不考虑内存的调度结果 bubble的计算逻辑: 3是1F1B,不放置w的调度结果。可以看到执行时间是: M * (F + B) + (P-1) * F + (P-1) * B 考虑这里的关键我认为在于看最后一个stage,因为最后一个stage没有任何依赖,一直都是跑满的。 那么bubble size就是最后一个stage idle的时间,对应的就是图中的(P - 1) * (F + B…

2026年2月8日 0条评论 114点热度 0人点赞 sheep 阅读全文
未分类

MoE global load balance 和MegatronLM中的实现

MegatronLM中实现了这个global load balance,这里来整理一下 论文:Demons in the Detail On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models 给aux loss起名,叫load balancing loss。 其中fi是路由到第i个expert的token的比例,Pi是router分配给expert i的概率 提到目前MoE framework实现的L…

2026年2月3日 0条评论 139点热度 0人点赞 sheep 阅读全文
未分类

breadth first pipeline parallelism notes

在section 3 distributed training这一节给了很详细的背景介绍和分析,包括: - FSDP和pp的冲突点 - compute/communicate overlap的定义 - Critical batch size的分析,在appendix上还给了详细的推导过程,以及直观的理解 a (mini-)batch is used to approximate the true gradients of the weights with respect to the loss. Increasin…

2026年2月1日 0条评论 139点热度 0人点赞 sheep 阅读全文
分类
  • Agent/RAG
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • RL
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2026 年 3 月
  • 2026 年 2 月
  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 10 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS