- 27 6月, 2017 3 次提交
-
-
由 Seton Steven Bocco 提交于
No need of big input.
-
由 Seton Steven Bocco 提交于
-
由 notoraptor 提交于
-
- 26 6月, 2017 2 次提交
-
-
由 Frédéric Bastien 提交于
Allow fallback on GpuCorrMM if cuDNN is not there
-
由 Pascal Lamblin 提交于
-
- 23 6月, 2017 1 次提交
-
-
由 Frédéric Bastien 提交于
Use FAST_RUN for reference version.
-
- 21 6月, 2017 4 次提交
-
-
由 abergeron 提交于
Fix parameter types in ave_pool kernels, remove static_cast, add GLOBAL_MEM
-
由 Pascal Lamblin 提交于
This should speed up the FAST_COMPILE buildbot
-
由 Pascal Lamblin 提交于
Fail if output memory not allocated
-
由 Pascal Lamblin 提交于
Fix elemwise ValueError message (printf formatting)
-
- 20 6月, 2017 4 次提交
-
-
由 Pascal Lamblin 提交于
This fixes a compilation issue on Pascal GPUs.
-
由 Pascal Lamblin 提交于
instead of segfaulting like a barbarian.
-
由 Pascal Lamblin 提交于
Update documentation and config flags about supported cuDNN algorithms.
-
由 notoraptor 提交于
-
- 19 6月, 2017 1 次提交
-
-
由 Gijs van Tulder 提交于
-
- 16 6月, 2017 2 次提交
-
-
由 abergeron 提交于
Don't print float16 warning for ops that don't have c code
-
由 Frédéric Bastien 提交于
jenkins buildbot with docker
-
- 15 6月, 2017 2 次提交
-
-
由 Frederic Bastien 提交于
-
由 xiaoqie 提交于
-
- 14 6月, 2017 6 次提交
-
-
由 Frédéric Bastien 提交于
Add lifter for CrossentropyCategorical1Hot and grad
-
由 xiaoqie 提交于
-
由 Pascal Lamblin 提交于
Added mode 'half' to Images2Neibs. Tests pass.
-
由 Pascal Lamblin 提交于
[ENH] Speed up nanguardmode by not checking *int* dtype
-
由 Pascal Lamblin 提交于
-
由 Frédéric Bastien 提交于
(small fix) Add doc for `dnn.include_path` and `dnn.library_path`.
-
- 13 6月, 2017 13 次提交
-
-
由 Frederic Bastien 提交于
-
由 Frédéric Bastien 提交于
Split long-running test so that it helps travis not to give up
-
由 notoraptor 提交于
-
由 Frédéric Bastien 提交于
Fix offset problems in the new backend.
-
由 notoraptor 提交于
-
由 Frédéric Bastien 提交于
Fix issue in optimizations with bitwise operations
-
由 notoraptor 提交于
-
由 Arnaud Bergeron 提交于
-
由 abergeron 提交于
Port Softmax kernel to OpenCL
-
由 Arnaud Bergeron 提交于
-
由 Arnaud Bergeron 提交于
-
由 Frederic Bastien 提交于
-
由 Frederic Bastien 提交于
-
- 12 6月, 2017 1 次提交
-
-
由 xiaoqie 提交于
All tests in test_nnet.py pass with CUDA. Only fp32 tests in test_nnet.py pass with OpenCL. GpuFromHost doesn't work with fp16 or fp64. Larger work item size doesn't improve performance. Add 2 local_barrier(), it's strange that AMD card doesn't need these local_barrier(), but they are necessary for NVIDIA cards.
-
- 11 6月, 2017 1 次提交
-
-
由 botev 提交于
-