reverted the tabs, which were changed to spaces by accident, back

71a47454 · Ludwig Schmidt-Hackenberg · d799afca · 71a47454
--- a/theano/sandbox/cuda/basic_ops.py
+++ b/theano/sandbox/cuda/basic_ops.py
@@ -2667,35 +2667,35 @@ class GpuAdvancedIncSubtensor1_dev20(GpuAdvancedIncSubtensor1):
             return;
        }      
-    void CudaNdarray_vector_add_fast(CudaNdarray* py_self, CudaNdarray* py_other, PyArrayObject *indices_arr)
+	void CudaNdarray_vector_add_fast(CudaNdarray* py_self, CudaNdarray* py_other, PyArrayObject *indices_arr)
-    {
+	{
-            const int *shapeX = CudaNdarray_HOST_DIMS(py_self);
+     		const int *shapeX = CudaNdarray_HOST_DIMS(py_self);
-            const int *shapeY = CudaNdarray_HOST_DIMS(py_other);
+     		const int *shapeY = CudaNdarray_HOST_DIMS(py_other);
-            const int *strX   = CudaNdarray_HOST_STRIDES(py_self);
+     		const int *strX   = CudaNdarray_HOST_STRIDES(py_self);
-            const int *strY   = CudaNdarray_HOST_STRIDES(py_other);
+     		const int *strY   = CudaNdarray_HOST_STRIDES(py_other);
-            unsigned int size = (unsigned int)PyArray_SIZE(indices_arr);
+     		unsigned int size = (unsigned int)PyArray_SIZE(indices_arr);
-            unsigned int numcolsX = shapeX[1];
+     		unsigned int numcolsX = shapeX[1];
-            unsigned int num_threads_per_block = std::min(numcolsX, (unsigned int)NUM_VECTOR_OP_THREADS_PER_BLOCK);
+     		unsigned int num_threads_per_block = std::min(numcolsX, (unsigned int)NUM_VECTOR_OP_THREADS_PER_BLOCK);
-            unsigned int num_blocks = std::min(size ,(unsigned int)NUM_VECTOR_OP_BLOCKS);
+     		unsigned int num_blocks = std::min(size ,(unsigned int)NUM_VECTOR_OP_BLOCKS);
-            dim3 n_blocks(num_blocks);
+     		dim3 n_blocks(num_blocks);
-            dim3 n_threads(num_threads_per_block);
+     		dim3 n_threads(num_threads_per_block);
-            long *d_indices_arr = NULL;
+     		long *d_indices_arr = NULL;
-            PyArrayObject *cpu_indices_arr = PyArray_GETCONTIGUOUS(indices_arr);
+     		PyArrayObject *cpu_indices_arr = PyArray_GETCONTIGUOUS(indices_arr);
-            d_indices_arr = (long*)device_malloc(PyArray_NBYTES(cpu_indices_arr));
+     		d_indices_arr = (long*)device_malloc(PyArray_NBYTES(cpu_indices_arr));
-            assert(d_indices_arr);
+     		assert(d_indices_arr);
-            cudaError_t err = cudaMemcpy(d_indices_arr,
+     		cudaError_t err = cudaMemcpy(d_indices_arr,
                                             PyArray_DATA(cpu_indices_arr),
                                             PyArray_NBYTES(cpu_indices_arr),
                                             cudaMemcpyHostToDevice);
-            assert(err == cudaSuccess);
+     		assert(err == cudaSuccess);
-            k_vector_add_fast<<<n_blocks, n_threads>>>(shapeX[0],
+     		k_vector_add_fast<<<n_blocks, n_threads>>>(shapeX[0],
                                                           shapeX[1],
                                                           strX[0],
                                                           strX[1],
@@ -2708,11 +2708,10 @@ class GpuAdvancedIncSubtensor1_dev20(GpuAdvancedIncSubtensor1):
                                                           d_indices_arr,
                                                           PyArray_SIZE(indices_arr)
                                                          );
-            device_free(d_indices_arr);
+     		device_free(d_indices_arr);
-            Py_XDECREF(cpu_indices_arr);
+     		Py_XDECREF(cpu_indices_arr);
-            return;
+     		return;
-    }
+	}
        """ %locals()