More than code

未分类
未分类

Torch Dispatch 1 Basic

先看这篇博客理解一下dispatch的高层设计 https://blog.ezyang.com/2020/09/lets-talk-about-the-pytorch-dispatcher/ DispatchKey Dispatch key是64bit中的某一个bit。bit位越高优先级就越高。 这块很多的设计都可以从DispatchKey.h中看到设计 有一个关键的设计就是dispatch key被拆分成了两块,分别是 48位的functionality 16位(目前)的backend,包括CPU,CUDA,XL…

2026年6月7日 0条评论 11点热度 0人点赞 sheep 阅读全文
未分类

repo summary

https://github.com/ysj1173886760/repo_summary ai帮忙写了一个repo summary的工具 针对指定的仓库,周级别的拉PR,然后总结,用来看这个项目这一周的进展,看看有没有自己比较关注的PR 目前我这里默认关注了megatromlm, pytorch和torchtitan 用的ds v4的模型,差不多一个月几块钱 跑一段时间先看看

2026年6月7日 0条评论 11点热度 0人点赞 sheep 阅读全文
未分类

Torch Allocator 3 MemPool & GraphCapture

MemPool 每个MemPool都靠一个(u64, u64)的二元组来唯一定位。分别是uid和uuid。 在aten/src/Aten/cuda/MemPool.cpp中有详细的解释 uid每次用户申请一个新的mem pool会自增 CUDAGraph每次创建mem pool会增加uuid {0, 0}表示默认的pool 在CUDACachingAllocator中,通过PrivatePool来管理所有的内存池 有一个use_count/cudaMalloc_count,相当于引用计数。当变成0的…

2026年5月28日 0条评论 40点热度 0人点赞 sheep 阅读全文
未分类

Torch Allocator 2 profile

机制 数据类型 何时记录 何时启用 谁消费 Stat 统计 DeviceStats 每次 alloc/free/split/merge 永远开(O(1) 计数) memory_stats() / memory_allocated() 等 Python API \ Trace 历史 TraceEntry 同上 + 段级事件 默认关,需要 _record_memory_history() 打开 memory_snapshot() / _dump_snapshot() Profiler 上报 reportMemoryUs…

2026年5月28日 0条评论 32点热度 0人点赞 sheep 阅读全文
未分类

Torch Allocator 1 basic

torch allocator的阅读笔记 DataPtr 包含c10::detail::UniqueVoidPtr和device Device是一个type和一个index type就是比如CPU,GPU等 index就是表示第几个,比如cuda0, cuda1这种 UniqueVoidPtr 一个data表示用户使用的数据 一个unique ptr表示这个数据的owner 用户拿到的指针不一定代表这块内存 而且unique_ptr在null的时候不会调用deleter,这里也可以支持这种情况。data为空…

2026年5月24日 0条评论 39点热度 0人点赞 sheep 阅读全文
未分类

FP8 Formats For Deep Learning

整理几个核心的设计点 两种format: * E4M3,适合权重和activation * E5M2,适合梯度 The recommended use of FP8 encodings is E4M3 for weight and activation tensors, and E5M2 for gradient tensors. This is consistent with findings in [20, 16], where inference and forward pass of training use…

2026年4月6日 0条评论 244点热度 0人点赞 sheep 阅读全文
未分类

cook notes 08

没拍图片,简单记录一下。 牛排: * 简单放一点橄榄油揉一揉,中火煎。相对比较稳定 * 或者是放牛油,放多点然后大火煎。出来的效果也比较好,但是油多了很容易有很多明火,感觉还是有点危险 蒸地瓜: * 切两头 * 水开锅后蒸,大火一般20分钟+ * 关火后焖一会,可能总共30分钟就差不多了。蒸出来的比较软也好吃 青花鱼: * 解冻,吸水 * 烤箱25分钟不需要预热就好 * 出来了再放盐,以及放点柠檬汁去腥就可以 烤土豆: * 切小块,一定要小块,不然不好熟 * 放到盘子里,放黑胡椒海盐,橄榄油,揉一揉 * 放到锡纸+…

2026年3月8日 0条评论 245点热度 0人点赞 sheep 阅读全文
未分类

AI集群网络相关知识

文章:https://zhuanlan.zhihu.com/p/673903240 通信的实现方式分为两种类型:机器内通信与机器间通信。 机器内通信: * 共享内存(QPI/UPI),比如:CPU与CPU之间的通信可以通过共享内存。 * PCIe,通常是CPU与GPU之间的通信。 * NVLink,通常是GPU与GPU之间的通信,也可以用于CPU与GPU之间的通信。 机器间通信: * TCP/IP 网络协议。 * RDMA (Remote Direct Memory Access) 网络协议。 * InfiniBa…

2026年2月20日 0条评论 323点热度 0人点赞 sheep 阅读全文
未分类

2025年终总结

过年回家正好前两天有点萎靡不太想学东西,来整理整理写一写25年的年终总结。 今年事比较多,不过大体还是就两大块,工作,生活,还有一些其他小的思考(没空单独的写文章,就一起挤到年终总结里来) 工作 GraphRAG 今年最核心的点了,整个人的工作重心从之前的存储引擎变成了GraphRAG,一个新的项目。 主要感谢老板的认可,给我投了很多的人力,并搞项目的时候给了很多帮助,让我也SFT了一把,学习到了很多新方法。 当然也要感谢GraphRAG小组的同学的支持,接业务,日常运维开发都比较辛苦。最后感觉结果还不错,虽然没有…

2026年2月15日 2条评论 442点热度 6人点赞 sheep 阅读全文
未分类

Demystifying NCCL notes

Overview API Communication management 通信需要通过communicator来进行。ncclCommInitAll来初始化communicator ncclCommDestroy用来销毁一个communicator,会等待pending operation ncclCommAbort立刻销毁communicator,取消pending operation,用来避免死锁 Collective communication ncclAllReduce, ncclBroadcast, n…

2026年2月10日 0条评论 351点热度 0人点赞 sheep 阅读全文
12345…14
分类
  • Agent/RAG
  • ARTS
  • C++
  • CSAPP
  • daily
  • database
  • leetcode
  • linux
  • ml
  • nlp
  • paper
  • RL
  • rocksdb
  • rust
  • ScummVM
  • tech
  • 其他
  • 周报
  • 未分类
  • 笔记
  • 算法
  • 计算机图形学
归档
  • 2026 年 6 月
  • 2026 年 5 月
  • 2026 年 4 月
  • 2026 年 3 月
  • 2026 年 2 月
  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 10 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 12 月
  • 2023 年 11 月
  • 2023 年 9 月
  • 2023 年 7 月
  • 2023 年 6 月
  • 2023 年 5 月
  • 2023 年 4 月
  • 2023 年 2 月
  • 2023 年 1 月
  • 2022 年 9 月
  • 2022 年 7 月
  • 2022 年 6 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 3 月
  • 2022 年 2 月
  • 2022 年 1 月
  • 2021 年 12 月
  • 2021 年 11 月
  • 2021 年 10 月
  • 2021 年 9 月
  • 2021 年 8 月
  • 2021 年 7 月
  • 2021 年 6 月
  • 2021 年 5 月
  • 2021 年 4 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月

COPYRIGHT © 2021 heavensheep.xyz. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS