-
由 Frederic Bastien 提交于
This allow all other optimization to work correctly. This allow the insertion of gemm into gpu code in the deep learning tutorial of the mlp to have a speed up of 3x.
f96de3b3
This allow all other optimization to work correctly. This allow the insertion of gemm into gpu code in the deep learning tutorial of the mlp to have a speed up of 3x.
| 名称 |
最后提交
|
最后更新 |
|---|---|---|
| .. | ||
| tests | 正在载入提交数据... | |
| __init__.py | 正在载入提交数据... | |
| basic_ops.py | 正在载入提交数据... | |
| blas.py | 正在载入提交数据... | |
| conv.cu | 正在载入提交数据... | |
| conv_full_kernel.cu | 正在载入提交数据... | |
| conv_kernel.cu | 正在载入提交数据... | |
| cuda_ndarray.cu | 正在载入提交数据... | |
| cuda_ndarray.cuh | 正在载入提交数据... | |
| elemwise.py | 正在载入提交数据... | |
| kernel_codegen.py | 正在载入提交数据... | |
| nnet.py | 正在载入提交数据... | |
| nvcc_compiler.py | 正在载入提交数据... | |
| opt.py | 正在载入提交数据... | |
| type.py | 正在载入提交数据... | |
| var.py | 正在载入提交数据... |