提交 1e8c3a25 authored 作者: Frederic Bastien's avatar Frederic Bastien

cache compiled version of gpu code for faster compilation.

上级 61bf8215
...@@ -22,7 +22,7 @@ class GpuDot22(Op): ...@@ -22,7 +22,7 @@ class GpuDot22(Op):
return Apply(self, [x,y], [x.type()]) return Apply(self, [x,y], [x.type()])
def c_code_cache_version(self): def c_code_cache_version(self):
return () return (1,0)
def c_code(self, node, nodename, inputs, outputs, sub): def c_code(self, node, nodename, inputs, outputs, sub):
x, y = inputs x, y = inputs
...@@ -86,7 +86,7 @@ class GpuGemm(Op): ...@@ -86,7 +86,7 @@ class GpuGemm(Op):
return Apply(self, [z, a, x, y, b], [z.type()]) return Apply(self, [z, a, x, y, b], [z.type()])
def c_code_cache_version(self): def c_code_cache_version(self):
return () return (1,0)
def c_code(self, node, name, inputs, outputs, sub): def c_code(self, node, name, inputs, outputs, sub):
z_in, a, x, y, b = inputs z_in, a, x, y, b = inputs
...@@ -346,3 +346,5 @@ class GpuCrossentropySoftmaxArgmax1HotWithBias(Op): ...@@ -346,3 +346,5 @@ class GpuCrossentropySoftmaxArgmax1HotWithBias(Op):
""" % locals() """ % locals()
return sio.getvalue() return sio.getvalue()
def c_code_cache_version(self):
return (1,0)
...@@ -234,7 +234,7 @@ class CudaNdarrayType(Type): ...@@ -234,7 +234,7 @@ class CudaNdarrayType(Type):
return "" return ""
def c_code_cache_version(self): def c_code_cache_version(self):
return () #do not cache this stuff until it matures return (1,0)
def c_compiler(self): def c_compiler(self):
return nvcc_module_compile_str return nvcc_module_compile_str
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论