• xiaoqie's avatar
    cuda fix · fc36eefb
    xiaoqie 提交于
    All tests in test_nnet.py pass with CUDA.
    Only fp32 tests in test_nnet.py pass with OpenCL. GpuFromHost doesn't work with fp16 or fp64.
    Larger work item size doesn't improve performance.
    Add 2 local_barrier(), it's strange that AMD card doesn't need these local_barrier(), but they are necessary for NVIDIA cards.
    fc36eefb
名称
最后提交
最后更新
..
compat 正在载入提交数据...
compile 正在载入提交数据...
d3viz 正在载入提交数据...
gof 正在载入提交数据...
gpuarray 正在载入提交数据...
misc 正在载入提交数据...
sandbox 正在载入提交数据...
scalar 正在载入提交数据...
scan_module 正在载入提交数据...
sparse 正在载入提交数据...
tensor 正在载入提交数据...
tests 正在载入提交数据...
typed_list 正在载入提交数据...
__init__.py 正在载入提交数据...
configdefaults.py 正在载入提交数据...
configparser.py 正在载入提交数据...
gradient.py 正在载入提交数据...
ifelse.py 正在载入提交数据...
printing.py 正在载入提交数据...
raise_op.py 正在载入提交数据...
updates.py 正在载入提交数据...
version.py 正在载入提交数据...