[t:/]$ 지식_

cudaMalloc vs. cudaMallocManaged

2018/09/20

cudaMalloc은 디바이스 메모리를 할당 받고,
cudaMallocManaged은 unified 메모리를 할당 받는다.

후자는 주소가 어디에 있는지 대충 쓰면 대충 빠르게 동작한다고 한다.

용처가 확실한 경우에 실험을 해보니 cudaMalloc이 빠르다. 당연한가 -_-?

특히, cudaMallocManaged에서 다음 코드를 썼더니 허벌나게 느려진다.

cudaMemAdvise(cudap, filesize, cudaMemAdviseSetReadMostly, 0);









[t:/] is not "technology - root". dawnsea, rss