| ホーム | 目次に戻る |
extern "C" __global__
void simpleKernel(float **input, int xsize, int ysize, float *output) {
const unsigned int x = blockDim.x * blockIdx.x + threadIdx.x;
if (x &kt; xsize) {
for (int y = 0; y < ysize; ++y) {
output[y] += input[x][y];
}
}
__syncthreads();
}
カーネルを呼び出した側で、カーネルの実行を待機するには cuCtxSyncronize() を呼び出します。