Fixed stack trace copying for several local optimizations according to Pascal's advice.

66b29241 · Iulian Vlad Serban · 21d70281 · 66b29241
--- a/theano/tensor/opt.py
+++ b/theano/tensor/opt.py
@@ -62,6 +62,7 @@ theano.configparser.AddConfigVar('on_shape_error',
 # Utilities
 def copy_stack_trace(from_var, to_var):
    """
    Copies the stack trace from one or more tensor variables to
@@ -547,6 +548,7 @@ def local_dimshuffle_lift(node):
            copy_stack_trace(node.outputs[0], ret)
            return [ret]
 @register_canonicalize
 @gof.local_optimizer([T.DimShuffle])
 def local_lift_transpose_through_dot(node):
@@ -572,12 +574,11 @@ def local_lift_transpose_through_dot(node):
        # Output is dot product of transposed inputs in reverse order
        ret = [T.dot(y.T, x.T)]
-        # Copy over stack trace to output from x and y to output
+        # Copy over stack trace to output from result of dot-product
-        copy_stack_trace([x, y], ret)
+        copy_stack_trace(node.inputs[0], ret)
        return ret
 @gof.local_optimizer([DimShuffle])
 def dimshuffle_as_view(node):
    op = node.op
@@ -1422,11 +1423,10 @@ def local_shape_to_shape_i(node):
        ret = shape_feature.make_vector_shape(node.inputs[0])
        # We need to copy over stack trace from input to output
-        copy_stack_trace(node.inputs[0], ret)
+        copy_stack_trace(node.outputs[0], ret)
        return [ret]
 # TODO: Not sure what type of node we are expecting here
 @register_specialize
 @register_canonicalize
@@ -1500,9 +1500,8 @@ def local_subtensor_make_vector(node):
            values = list(map(int, list(idx.value)))
            ret = [make_vector(*[x.owner.inputs[v] for v in values])]
-            # Copy over stack traces from each index to every element of new list?
+            # Copy over stack trace from previous output to new output
-            # If yes, then same should be done for const_slice just below...
+            copy_stack_trace(node.outputs[0], ret)
-            copy_stack_trace([x.owner.inputs[v] for v in values], ret)
            return ret
        else:
            raise TypeError('case not expected')
@@ -1544,7 +1543,7 @@ def local_useless_elemwise(node):
                                         dtype=node.outputs[0].type.dtype))]
                # Copy stack trace from input to constant output
-                copy_stack_trace(node.inputs[0], ret)
+                copy_stack_trace(node.outputs[0], ret)
                return ret
        elif node.op.scalar_op == theano.scalar.neq and len(node.inputs) == 2:
            if node.inputs[0] == node.inputs[1]:
@@ -1554,7 +1553,7 @@ def local_useless_elemwise(node):
                                         dtype=node.outputs[0].type.dtype))]
                # Copy stack trace from input to constant output
-                copy_stack_trace(node.inputs[0], ret)
+                copy_stack_trace(node.outputs[0], ret)
                return ret
        elif node.op.scalar_op == theano.scalar.mul and len(node.inputs) == 1:
@@ -1580,6 +1579,7 @@ def local_alloc_unary(node):
            x = a.owner.inputs[0]
            shp = a.owner.inputs[1:]
            v = node.op(x)
+            copy_stack_trace(node.outputs[0], v)
            ret = T.alloc(T.cast(v, node.outputs[0].dtype), *shp)
            # Is it really necessary to copy over stack trace here?
@@ -1770,8 +1770,11 @@ def local_remove_useless_assert(node):
            # We don't need to copy over any stack traces here
            return [node.inputs[0]]
        if len(cond) != len(node.inputs) - 1:
-            # We don't need to copy over any stack traces here
+            ret = assert_(node.inputs[0], *cond)
-            return [assert_(node.inputs[0], *cond)]
+            # We copy over stack trace from the output of the original assert
+            copy_stack_trace(node.outputs[0], ret)
+            return [ret]
 @gof.local_optimizer([Assert])
@@ -1920,17 +1923,19 @@ def local_elemwise_alloc_op(ElemwiseOP, AllocOP, DimShuffleOP):
                # We need to keep the dimshuffle. It could swap axes or
                # add dimensions anywhere.
-                # Do we need to copy stack trace from alloc_input to new element here?
+                r_i = i.owner.op(alloc_input)
-                new_i.append(i.owner.op(alloc_input))
+                # Copy stack trace from i to new_i
+                copy_stack_trace(i, r_i)
+                new_i.append(r_i)
            else:
                new_i.append(i)
        new_i[assert_op_idx] = assert_op
        ret = node.op(*new_i, return_list=True)
-        # Copy over stack trace from inputs to outputs.
-        # Maybe we want to do this elementwise to keep the trace cleaner,
+        # Copy over stack trace from previous outputs to new outputs.
-        # but that's not really clear.
+        copy_stack_trace(node.outputs, ret)
-        copy_stack_trace(new_i, ret)
        return ret
    return local_elemwise_alloc