https://github.com/NVIDIA/nccl-tests/blob/master/doc/PERFORMANCE.md 基本概念 time: 小size的时候,用来衡量通信操作的overhead 大size的时候,带宽项主导,所以应该看算法的带宽来预估性能 Bandwidth: Algorithm bandwidth 代表的是纯数据的bandwidth,不看具体的算法。 就是输入的数据S 除以 花费的时间t Bus bandwidth P2P的通信,上面的algorithm bandwidth就是真…