Merge pull request #4756 from Thrandis/ccw2

Theano variable arguments for pooling 2

Merge pull request #4756 from Thrandis/ccw2
123d9007 · Frédéric Bastien · GitHub · 0d478806 · 166cac0a · 123d9007
--- a/Theano.pyproj
+++ b/Theano.pyproj
@@ -187,7 +187,7 @@
    <Compile Include="theano\tensor\sharedvar.py" />
    <Compile Include="theano\tensor\shared_randomstreams.py" />
    <Compile Include="theano\tensor\signal\conv.py" />
-    <Compile Include="theano\tensor\signal\downsample.py" />
+    <Compile Include="theano\tensor\signal\pool.py" />
    <Compile Include="theano\tensor\signal\__init__.py" />
    <Compile Include="theano\tensor\tensor_grad.py" />
    <Compile Include="theano\tensor\xlogx.py" />

--- a/doc/library/tensor/signal/downsample.txt
+++ b/doc/library/tensor/signal/downsample.txt
@@ -9,9 +9,6 @@
   :synopsis: ops for performing various forms of downsampling
 .. moduleauthor:: LISA

-.. seealso:: :func:`theano.tensor.nnet.neighbours.images2neibs`
-
-.. function:: fft(*todo)
-
-    [James has some code for this, but hasn't gotten it into the source tree yet.]
+.. note:: 

+    This module is deprecated. Use the functions in :func:`theano.tensor.nnet.signal.pool`
--- a/doc/library/tensor/signal/index.txt
+++ b/doc/library/tensor/signal/index.txt
@@ -20,5 +20,5 @@ forms of signal processing.
    :maxdepth: 1

    conv
-    downsample
    pool
+    downsample
--- a/theano/gpuarray/dnn.py
+++ b/theano/gpuarray/dnn.py
@@ -1859,13 +1859,10 @@ def local_gpua_pool_dnn_alternative(op, ctx_name, inputs, outputs):
        raise_no_cudnn()
    if not op.ignore_border:
        return
-    img, = inputs
+    img, ws, stride, pad = inputs
    img = as_gpuarray_variable(img, ctx_name)
-    ds = op.ds
-    stride = op.st
-    pad = op.padding
    mode = op.mode
-    return dnn_pool(gpu_contiguous(img), ds, stride=stride, pad=pad, mode=mode)
+    return dnn_pool(gpu_contiguous(img), ws, stride=stride, pad=pad, mode=mode)


 @register_opt('cudnn', 'fast_compile')
@@ -1876,20 +1873,17 @@ def local_gpua_pool_dnn_grad_stride(op, ctx_name, inputs, outputs):
        raise_no_cudnn()
    if not op.ignore_border:
        return
-    inp, out, out_grad = inputs
+    inp, out, out_grad, ws, stride, pad = inputs
    inp = as_gpuarray_variable(inp, ctx_name)
    out = as_gpuarray_variable(out, ctx_name)
    out_grad = as_gpuarray_variable(out_grad, ctx_name)
-    ds = op.ds
-    st = op.st
-    pad = op.padding
    mode = op.mode

    return GpuDnnPoolGrad(mode=mode)(gpu_contiguous(inp),
                                     gpu_contiguous(out),
                                     gpu_contiguous(out_grad),
-                                     ds,
-                                     st,
+                                     ws,
+                                     stride,
                                     pad)


@@ -1901,12 +1895,9 @@ def local_gpua_avg_pool_dnn_grad_stride(op, ctx_name, inputs, outputs):
        raise_no_cudnn()
    if not op.ignore_border:
        return
-    inp, out_grad = inputs
+    inp, out_grad, ws, stride, pad = inputs
    inp = as_gpuarray_variable(inp, ctx_name)
    out_grad = as_gpuarray_variable(out_grad, ctx_name)
-    ds = op.ds
-    st = op.st
-    pad = op.padding
    mode = op.mode

    cg = gpu_contiguous(out_grad)
@@ -1914,7 +1905,7 @@ def local_gpua_avg_pool_dnn_grad_stride(op, ctx_name, inputs, outputs):
    # We reuse cg because cuDNN does not use the value of the `out`
    # argument but still checks its shape for average pooling. This
    # has been observed in v2 and v3 as far as I know.
-    return GpuDnnPoolGrad(mode=mode)(gpu_contiguous(inp), cg, cg, ds, st, pad)
+    return GpuDnnPoolGrad(mode=mode)(gpu_contiguous(inp), cg, cg, ws, stride, pad)


 @register_opt('cudnn', 'fast_compile')

--- a/theano/sandbox/cuda/dnn.py
+++ b/theano/sandbox/cuda/dnn.py
@@ -2962,14 +2962,11 @@ if True:
        if isinstance(node.op, Pool):
            if not node.op.ignore_border:
                return
-            img, = node.inputs
-            ds = node.op.ds
-            stride = node.op.st
-            pad = node.op.padding
+            img, ws, stride, pad = node.inputs
            mode = node.op.mode
            if (img.owner and isinstance(img.owner.op, HostFromGpu)):
                ret = dnn_pool(gpu_contiguous(img.owner.inputs[0]),
-                               ds, stride=stride, pad=pad, mode=mode)
+                               ws, stride=stride, pad=pad, mode=mode)
                return [host_from_gpu(ret)]

    @register_opt('cudnn')
@@ -2996,10 +2993,7 @@ if True:
        if isinstance(node.op, MaxPoolGrad):
            if not node.op.ignore_border:
                return
-            inp, out, inp_grad = node.inputs
-            ds = node.op.ds
-            st = node.op.st
-            pad = node.op.padding
+            inp, out, inp_grad, ws, stride, pad = node.inputs
            mode = node.op.mode

            if ((inp.owner and isinstance(inp.owner.op, HostFromGpu)) or
@@ -3010,7 +3004,7 @@ if True:
                ret = GpuDnnPoolGrad(mode=mode)(gpu_contiguous(inp),
                                                gpu_contiguous(out),
                                                gpu_contiguous(inp_grad),
-                                                ds, st, pad)
+                                                ws, stride, pad)
                return [host_from_gpu(ret)]

    @register_opt('cudnn')
@@ -3021,10 +3015,7 @@ if True:
        if isinstance(node.op, AveragePoolGrad):
            if not node.op.ignore_border:
                return
-            inp, inp_grad = node.inputs
-            ds = node.op.ds
-            st = node.op.st
-            pad = node.op.padding
+            inp, inp_grad, ws, stride, pad = node.inputs
            mode = node.op.mode

            if ((inp.owner and isinstance(inp.owner.op, HostFromGpu)) or
@@ -3034,7 +3025,7 @@ if True:
                ret = GpuDnnPoolGrad(mode=mode)(gpu_contiguous(inp),
                                                contiguous_inp_grad,
                                                contiguous_inp_grad,
-                                                ds, st, pad)
+                                                ws, stride, pad)
                return [host_from_gpu(ret)]

    @register_opt('cudnn')

--- a/theano/sandbox/cuda/opt.py
+++ b/theano/sandbox/cuda/opt.py
@@ -1891,37 +1891,61 @@ def local_convtransp3d_gemm(node):
 gpu_optimizer.register("convtransp3d_gemm", local_convtransp3d_gemm)


+def _check_constant_args_pool(ws, stride, pad, node):
+    """Check if the args of pool are constants. Warns if not."""
+    try:
+        ws_w = tensor.get_scalar_constant_value(ws[0])
+        ws_h = tensor.get_scalar_constant_value(ws[1])
+        stride_w = tensor.get_scalar_constant_value(stride[0])
+        stride_h = tensor.get_scalar_constant_value(stride[1])
+        pad_w = tensor.get_scalar_constant_value(pad[0])
+        pad_h = tensor.get_scalar_constant_value(pad[1])
+    except tensor.NotScalarConstantError:
+        msg = ("Pool with tensor variable for the window size, stride or "
+               "padding is only supported in the new GPU backend, so this op "
+               "will run on CPU. (op %s)" % node)
+        if config.assert_no_cpu_op == "warn":
+            _logger.warning(msg)
+        elif config.assert_no_cpu_op == "raise":
+            raise AssertionError(msg)
+        return None
+    ws = (ws_w, ws_h)
+    stride = (stride_w, stride_h)
+    pad = (pad_w, pad_h)
+    return ws, stride, pad
+
+
 @register_opt()
 @local_optimizer([pool.Pool])
 def local_gpu_downsample_factor_max(node):
-    if (isinstance(node.op, pool.Pool) and
-            node.op.ds == node.op.st):
-
-        assert node.op.__props__ == ('ds', 'ignore_border', 'st', 'padding',
-                                     'mode')
-        if node.op.padding != (0, 0) or node.op.mode != 'max':
+    if isinstance(node.op, pool.Pool):
+        assert node.op.__props__ == ('ignore_border', 'mode')
+        x, ws, stride, pad = node.inputs
+        ret = _check_constant_args_pool(ws, stride, pad, node)
+        if ret is None:
+            return
+        ws, stride, pad = ret
+        if (pad) != (0, 0) or node.op.mode != 'max' or stride != ws:
            return
-        x, = node.inputs
        if (x.owner and isinstance(x.owner.op, HostFromGpu)):
-            gpu_ds = GpuDownsampleFactorMax(node.op.ds, node.op.ignore_border)
+            gpu_ds = GpuDownsampleFactorMax(ws, node.op.ignore_border)
            return [host_from_gpu(gpu_ds(x.owner.inputs[0]))]


 @register_opt()
 @local_optimizer([pool.MaxPoolGrad])
 def local_gpu_downsample_factor_max_grad(node):
-    if (isinstance(node.op, pool.MaxPoolGrad) and node.op.ds == node.op.st):
-        assert node.op.__props__ == ('ds', 'ignore_border', 'st', 'padding',
-                                     'mode')
-        if (node.op.padding != (0, 0) or
-                node.op.mode != 'max' or
-                node.op.st != node.op.ds):
-
+    if isinstance(node.op, pool.MaxPoolGrad):
+        assert node.op.__props__ == ('ignore_border', 'mode')
+        x, z, gz, ws, stride, pad = node.inputs
+        ret = _check_constant_args_pool(ws, stride, pad, node)
+        if ret is None:
+            return
+        ws, stride, pad = ret
+        if pad != (0, 0) or node.op.mode != 'max' or stride != ws:
            return
-        x, z, gz = node.inputs
        if (x.owner and isinstance(x.owner.op, HostFromGpu)):
-            gpu_ds_grad = GpuDownsampleFactorMaxGrad(node.op.ds,
-                                                     node.op.ignore_border)
+            gpu_ds_grad = GpuDownsampleFactorMaxGrad(ws, node.op.ignore_border)
            return [host_from_gpu(gpu_ds_grad(x.owner.inputs[0],
                                              as_cuda_ndarray_variable(z),
                                              as_cuda_ndarray_variable(gz)))]
@@ -1931,16 +1955,16 @@ def local_gpu_downsample_factor_max_grad(node):
 @local_optimizer([pool.DownsampleFactorMaxGradGrad])
 def local_gpu_downsample_factor_max_grad_grad(node):
    if isinstance(node.op, pool.DownsampleFactorMaxGradGrad):
-        assert node.op.__props__ == ('ds', 'ignore_border', 'st',
-                                     'padding', 'mode')
-        if (node.op.padding != (0, 0) or
-                node.op.mode != 'max' or
-                node.op.st != node.op.ds):
+        assert node.op.__props__ == ('ignore_border', 'mode')
+        x, z, gx, ws, stride, pad = node.inputs
+        ret = _check_constant_args_pool(ws, stride, pad, node)
+        if ret is None:
+            return
+        ws, stride, pad = ret
+        if pad != (0, 0) or node.op.mode != 'max' or stride != ws:
            return
-        x, z, gx = node.inputs
        if (x.owner and isinstance(x.owner.op, HostFromGpu)):
-            op = GpuDownsampleFactorMaxGradGrad(node.op.ds,
-                                                node.op.ignore_border)
+            op = GpuDownsampleFactorMaxGradGrad(ws, node.op.ignore_border)
            return [host_from_gpu(op(x.owner.inputs[0],
                                     as_cuda_ndarray_variable(z),
                                     as_cuda_ndarray_variable(gx)))]

--- a/theano/sandbox/cuda/tests/test_blas.py
+++ b/theano/sandbox/cuda/tests/test_blas.py
@@ -369,12 +369,12 @@ def test_downsample():
                continue
            for ignore_border in (True, False):
                # print 'test_downsample', shp, ds, ignore_border
-                ds_op = Pool(ds, ignore_border=ignore_border)
+                ds_op = Pool(ignore_border=ignore_border)

                a = tcn.shared_constructor(my_rand(*shp), 'a')
-                f = pfunc([], ds_op(tensor.as_tensor_variable(a)),
+                f = pfunc([], ds_op(tensor.as_tensor_variable(a), ds),
                          mode=mode_with_gpu.excluding('cudnn'))
-                f2 = pfunc([], ds_op(tensor.as_tensor_variable(a)),
+                f2 = pfunc([], ds_op(tensor.as_tensor_variable(a), ds),
                           mode=mode_without_gpu)
                assert any([isinstance(node.op,
                                       tcn.blas.GpuDownsampleFactorMax)
@@ -393,12 +393,12 @@ def test_downsample():

                g = pfunc(
                    [],
-                    tensor.grad(ds_op(tensor.as_tensor_variable(a)).sum(),
+                    tensor.grad(ds_op(tensor.as_tensor_variable(a), ds).sum(),
                                a),
                    mode=mode_with_gpu.excluding('cudnn'))
                g2 = pfunc(
                    [],
-                    tensor.grad(ds_op(tensor.as_tensor_variable(a)).sum(),
+                    tensor.grad(ds_op(tensor.as_tensor_variable(a), ds).sum(),
                                a),
                    mode=mode_without_gpu)
                assert any([isinstance(node.op,
@@ -409,7 +409,7 @@ def test_downsample():
                assert numpy.allclose(g(), g2()), shp

                ggf = gradient.Lop(tensor.grad((ds_op(
-                    tensor.as_tensor_variable(a))**2).sum(), a), a, a)
+                    tensor.as_tensor_variable(a), ds)**2).sum(), a), a, a)

                ref_mode = copy.copy(mode_without_gpu)
                ref_mode.check_py_code = False

--- a/theano/sandbox/cuda/tests/test_mlp.py
+++ b/theano/sandbox/cuda/tests/test_mlp.py
@@ -381,9 +381,10 @@ def build_conv_nnet2_classif(use_gpu, isize, ksize, n_batch,
        (n_kern, logical_hid_shape[0] // 2, logical_hid_shape[1] // 2),
        shape_kern1[2:], n_kern1, n_batch, 1, 1, verbose=verbose, version=version)

-    ds_op = pool.Pool((2, 2), ignore_border=False)
+    ds_op = pool.Pool(ignore_border=False)
    if downsample_ops:
-        hid = tensor.tanh(ds_op(conv_op(x, w0) + b0.dimshuffle((0, 'x', 'x'))))
+        hid = tensor.tanh(ds_op(conv_op(x, w0) + b0.dimshuffle((0, 'x', 'x')),
+                                (2, 2)))
    else:
        hid = tensor.tanh(
            (conv_op(x, w0) + b0.dimshuffle(

--- a/theano/tensor/signal/downsample.py
+++ b/theano/tensor/signal/downsample.py
-from __future__ import absolute_import, print_function, division
-from . import pool
-import warnings
-
-warnings.warn(
-    "downsample module has been moved to the theano.tensor.signal.pool module.")
-max_pool_2d_same_size = pool.max_pool_2d_same_size
-max_pool_2d = pool.pool_2d
-DownsampleFactorMax = pool.Pool
-PoolGrad = pool.PoolGrad
-MaxPoolGrad = pool.MaxPoolGrad
-AveragePoolGrad = pool.AveragePoolGrad
-
-
-# This is for compatibility with pickled things.  It should go away at
-# some point.
-class DownsampleFactorMaxGrad(object):
-    def __new__(self, ds, ignore_border, st=None, padding=(0, 0), mode='max'):
-        if mode == 'max':
-                return MaxPoolGrad(ds=ds, ignore_border=ignore_border, st=st,
-                                   padding=padding)
-        else:
-            return AveragePoolGrad(ds=ds, ignore_border=ignore_border, st=st,
-                                   padding=padding, mode=mode)
-
-DownsampleFactorMaxGradGrad = pool.DownsampleFactorMaxGradGrad
--- a/theano/tensor/signal/pool.py
+++ b/theano/tensor/signal/pool.py
--- a/theano/tensor/signal/tests/old_pool_interface.pkl
+++ b/theano/tensor/signal/tests/old_pool_interface.pkl
--- a/theano/tensor/signal/tests/test_pool.py
+++ b/theano/tensor/signal/tests/test_pool.py