Fixed some arrays of length 0 in generated CUDA code

Arrays of length 0 are forbidden by C standard and treated as errors by the Visual C++ compiler.

Fixed some arrays of length 0 in generated CUDA code
af691e3c · Sebastian Urban · Olivier Delalleau · 10f5a853 · af691e3c · af691e3c
--- a/theano/sandbox/cuda/basic_ops.py
+++ b/theano/sandbox/cuda/basic_ops.py
@@ -471,7 +471,10 @@ class GpuSum(Op):
           )
        {
            """ %locals()
+        if nd_out > 0:
            print >> sio, "int new_dims[%(nd_out)s]; " % locals()
+        else:
+            print >> sio, "int *new_dims=NULL; "
        j = 0
        for i in xrange(nd_in):

--- a/theano/sandbox/cuda/elemwise.py
+++ b/theano/sandbox/cuda/elemwise.py
@@ -534,10 +534,21 @@ class NaiveAlgo(object):
    # collapse dimension that are broadcast in all inputs.
    # need to be done before contiguous collapse as it will break it.
    # do the dimensions and the strides
+        if nd > 0:
+            print >> sio, "int local_dims[%(nd)s];" % locals()
+        else:
+            print >> sio, "int *local_dims=NULL;"
+        if nb_inputs > 0 and nd > 0:
            print >> sio, """
-        int local_dims[%(nd)s];
            int local_str[%(nb_inputs)s][%(nd)s];
            int local_ostr[%(nb_inputs)s][%(nd)s];
+            """ % locals()
+        else:
+            print >> sio, """
+            int local_str[1][1];
+            int local_ostr[1][1];
+            """
+        print >> sio, """
        int nd_collapse = %(nd)s;
        for(int i=0;i<%(nd)s;i++){//init new dim
          local_dims[i]=dims[i];
@@ -611,11 +622,18 @@ class NaiveAlgo(object):
    # collapse contiguous dimensions (ignoring scalars, generic version(collapse any dimensions, right, left, middle))
    # this is a good idea because we make less index calculation in the gpu.
+        if nd > 0:
            print >> sio, "int nd_collapse_[%(nd)s] = {"%locals() +','.join(['1' for x in xrange(nd)]) +"};"
+        else:
+            print >> sio, "int *nd_collapse_ = NULL;"
        for ipos in xrange(len(node.inputs)):
            if not _logical_scalar(node.inputs[ipos]):
+                if nd > 0:
                    print >> sio, """
                        int nd_collapse_%(ipos)s[%(nd)s] = {"""%locals() +','.join(['1' for x in xrange(nd)]) +"};"
+                else:
+                    print >> sio, """
+                        int *nd_collapse_%(ipos)s = NULL;"""%locals()
                print >> sio, """
 can_collapse_%(nodename)s(nd_collapse, local_dims, local_str[%(ipos)s], nd_collapse_%(ipos)s);
 for(int i=0;i<nd_collapse;i++){
@@ -839,9 +857,10 @@ nd_collapse_[i]=0;
        //std::cerr << "C_CODE %(opname)s START\\n";
        //standard elemwise size checks
            """ %locals()
-        print >> sio, """
+        if nd > 0:
-        int dims[%(nd)s] = {%(initial_dims)s};
+            print >> sio, """int dims[%(nd)s] = {%(initial_dims)s};""" %locals()
-        """ %locals()
+        else:
+            print >> sio, """int *dims = NULL;""" 
        #check that all inputs have valid dimensions
        emitted_inames = {}
@@ -851,9 +870,10 @@ nd_collapse_[i]=0;
                continue
            broadcasts = ', '.join(map(str,map(int,node.inputs[id].broadcastable)))
            nd = node.inputs[id].ndim
-            print >> sio, """
+            if nd > 0:
-        int broadcasts_%(iname)s[%(nd)s] = {%(broadcasts)s};
+                print >> sio, """int broadcasts_%(iname)s[%(nd)s] = {%(broadcasts)s};""" %locals()
-""" %locals()
+            else:
+                print >> sio, """int *broadcasts_%(iname)s = NULL;""" %locals()
            emitted_inames[iname] = node.inputs[id]
        #check that all inputs have valid dimensions
        emitted_inames = {}