Triton

安装

这里特别说明一下离线安装

git clone https://github.com/openai/triton.git
git clone https://github.com/google/googletest.git

做如下修改:

  • unittest 中的 GIT_REPOSITORY 改为 /local/path/to/googletest

  • python/setup.py 中分别下载 pybind11, conda-cuda-nvcc, llvm 相关文件, 注意conda-cuda-nvcc的标签可以在这里查看, 然后将相关的 url 改为: file:///path/to/pybind11-or-llvm-or-conda-cuda-nvcc

安装

cd triton/python
pip install cmake # build-time dependency
pip install -e .

但失败了, 环境是

  • python 3.8

  • system driver: 525.85.12 (support cuda 12.0)

  • system cuda: 11.4

  • conda cuda nvcc: 12.0.76

colab 上安装(似乎 triton.language.device_print 是新特性, 源码安装才有)

这个成功了, 环境是:

  • python 3.10

  • system driver: 525.85.12 (support cuda 12.0)

  • system cuda: 11.8

  • conda cuda nvcc: 12.0.76

语法

不带 autotune

autotune

示例: 矩阵乘

Last updated

Was this helpful?