move optim in specialize device

eefa42ac · Nicolas Ballas · e980fdd0 · eefa42ac · eefa42ac
--- a/theano/sandbox/cuda/dnn.py
+++ b/theano/sandbox/cuda/dnn.py
@@ -2455,6 +2455,11 @@ def local_abstractconv_cudnn(node):
    inp1 = node.inputs[0]
    inp2 = node.inputs[1]
+    if ((not isinstance(node.op, AbstractConv2d) or
+         not isinstance(node.op, AbstractConv2d_gradWeights) or
+         not isinstance(node.op, AbstractConv2d_gradInputs))):
+        return None
    if not isinstance(inp1.type, CudaNdarrayType) or \
            not isinstance(inp2.type, CudaNdarrayType):
        return None

--- a/theano/sandbox/cuda/opt.py
+++ b/theano/sandbox/cuda/opt.py
@@ -2784,22 +2784,22 @@ def local_abstractconv_gradinputs_gemm(node):
 # which ones take precedence over others.
 abstractconv_groupopt = theano.gof.optdb.LocalGroupDB()
 abstractconv_groupopt.__name__ = "gpu_abstractconv_opts"
-register_opt()(abstractconv_groupopt)
+register_specialize_device()(abstractconv_groupopt)
 # cuDNN is first, but only registered if cuDNN is available.
 conv_groupopt.register('local_abstractconv_dnn', dnn.local_abstractconv_cudnn, 20,
                       'conv_dnn',
-                       'fast_compile', 'fast_run', 'cudnn')
+                       'gpu_opt', 'cudnn')
 # The GEMM-based convolution comes last to catch all remaining cases.
 # It can be disabled by excluding 'conv_gemm'.
 conv_groupopt.register('local_abstractconv_gemm', local_abstractconv_gemm, 30,
                       'conv_gemm',
-                       'fast_compile', 'fast_run')
+                       'gpu_opt')
 conv_groupopt.register('local_abstractconv_gradweight_gemm',
                       local_abstractconv_gradweight_gemm, 30,
-                       #'conv_gemm',
+                       'conv_gemm',
                       'fast_compile', 'fast_run')
 conv_groupopt.register('local_abstractconv_gradinputs_gemm',
                       local_abstractconv_gradinputs_gemm, 30,
-                       #'conv_gemm',
+                       'conv_gemm',
-                       'fast_compile', 'fast_run')
+                       'gpu_opt')