• 북마크
  • 추가메뉴
어디로 앱에서 쉽고 간편하게!
애플 중고 거래 전문 플랫폼
오늘 하루 보지 않기
KMUG 케이머그

소프트웨어

[App 개발] Introductory Tutorial to OpenCL

본문

Introductory Tutorial to OpenCL
Skip Navigation LinksHome > GPU Tools > ATI Stream SDK > Introductory Tutorial to OpenCL

Benedict R. Gaster, AMD Architect, OpenCL

AMD 는 CPU 에서 동작하는 OpenCL 의 퍼블릭 베타를 발표했습니다. 조만간 AMD 최신 GPU 에서도 구현될 것입니다. OpenCL 은 최신 기술입니다. 기술 규격에 대해서는 홈페이지(www.khronos.org/registry/cl/)에서 소개하고 있습니다만, 예제를 곁들인 기본 설명을 담고 있는 문서는 아직 얼마 되지 않습니다. 이 글은 OpenCL 에 대한 이해와 응용을 돕기 위해 만들어졌습니다.

먼저:

* 저는 AMD 에서 일하고 있으며, 제가 소개하는 예제들은 윈도우와 리눅스 환경에서 테스트할 것입니다. 하지만 저는 기종에 관계없이 OpenGL 의 활용에 중점을 둘 것입니다. 모든 예제들은 순전히 OpenGL 로 구현되며 따라서 기종에 관계없이 동작될 것입니다.
* 제가 제공하는 모든 예제들은 AMD 의 구현이 아니어도 동작될 수 있게끔 하였습니다만, AMD 에서 구현하지 않은 환경에서 테스트하지는 않았습니다. 따라서 해당 시스템에서 정상 동작되지 않을 수 있습니다. 그럴 경우 Stream Computing 포럼에 알려주시면 제가 코드를 다시 정리하여 업데이트 하도록 하겠습니다.

다음의 “Hello World” 예제는 OpenGL 을 간단히 소개하는 프로그램입니다. 이번 예제를 비롯해서 몇 가지 예제를 통해서 다음과 같은 내용을 다룰 것입니다:

* OpenCL 을 위한 플랫폼과 디바이스 레이어
* 프로그램 컴파일과 커널 객체
* 버퍼 관리
* 커널 실행
* 커널 프로그래밍 – 기초
* 커널 프로그래밍 – 동기화
* 행렬 곱셈 – 예제
* 커널 프로그래밍 – 빌트인

= The “Hello World” program in OpenCL

OpenCL 예제 작성시 고려했던 내용입니다:

* OpenCL 이 지정한 호스트 API 는 C89 호환이며 C++ 혹은 여타 다른 언어와의 연동은 언급하지 않고 있습니다. 현재 다른 언어와의 연동을 연구중이며 (이 글 마지막에 소개된 링크를 보세요) 특별히 C++ 과의 연동을 활발히 연구중입니다. 본 예제에서는 C++ 에서 OpenCL 활용법을 보여드리겠습니다. OpenCL 1.0 규격에서 해당되는 C API 를 참조하세요. 소스에서 어떻게 OpenCL 함수를 호출하고 있으며 C++ 에서 인수 전달 방법 등을 볼 수 있습니다.
* OpenCL 은 계산 장치 프로그램을 작성하기 위하여 C 형태의 언어를 사용합니다. 이 프로그램은 OpenCL 런타임에 char * 인수를 받는 API 호출로 전달됩니다. 보통 이 프로그램은 다른 소스 파일에 저장하는 것이 편리합니다. 다음의 예제들에서 디바이스 프로그램은 name_kernels.cl 과 같은 이름을 가진 파일에 저장합니다. name 은 예제 내용에 따라 바뀌지만 _kernels.cl 은 동일합니다. 해당되는 디바이스 프로그램은 실행시 읽어서 OpenCL API 로 전달됩니다. 그 외에도 다른 방법들이 있습니다만 이 방법이 이해하기 쉽기 때문에 선택했습니다.

첫 번째 OpenGL 프로그램 작성을 위하여 먼저 호스트 프로그램 소스부터 시작해 보겠습니다.

= Header files

다른 C++ 외부 API 처럼 OpenCL API 를 사용하려면 헤더를 include 해야 합니다. 보통 기본 include 디렉토리의 CL 디렉토리에 저장되어 있습니다. C++ 에서 사용을 위해서 (C API 인 cl.h 를 대신한)

#include
#define __NO_STD_VECTOR // Use cl::vector and cl::string and
#define __NO_STD_STRING // not STL versions, more on this later
#include

예제에서 사용하기 위한 C++ 헤더를 몇 개 추가합니다.

#include
#include
#include
#include
#include
#include

OpenCL 장치로부터 동적으로 “Hello World
” 문자열을 리턴할 것이므로 상수로 선언을 하겠습니다.

const std::string hw("Hello World
");

= Errors

OpenCL API 대부분 공통적으로 오류가 발생했을 때 함수의 리턴값으로 (cl_int 형) 에러 코드를 돌려주거나, 발생한 에러를 저장하여 유저에게 인수로 전달합니다. 에러 코드는 API 에서 오류가 발생했을 때 상황을 알아낼 수 있으므로 중요합니다. 하지만 지금은 문제를 간단히 하기 위해서 checkEr() 함수를 선언하여 어떤 작업이 무사히 끝났는지만 검사하고 넘어갑니다. 에러가 없으면 OpenCL 은 CL_SUCCESS 를 리턴합니다. 에러가 발생했을 경우 메세지를 발생하고 종료하거나 리턴하게 됩니다.

inline void
checkErr(cl_int err, const char * name)
{
if (err != CL_SUCCESS) {
std::cerr << "ERROR: " << name
<< " (" << err << ")" << std::endl;
exit(EXIT_FAILURE);
}

C++ 에서 에러를 처리하는 기본 방식은 exception 을 이용하는 것입니다. OpenCL C++ 바인딩에서는 유사한 인터페이스를 제공합니다. 뒷부분에 가서 exception 과 C++ 특성에 맞는 몇 가지 옵션 기능을 다루도록 하겠습니다. 여기서는 마지막으로 우리 첫 번째 OpenCL 프로그램에 필요한 main 함수를 보겠습니다.

= OpenCL Contexts

OpenCL 을 초기화하여 사용하는 첫 번째 단계는 컨텍스트를 만드는 것입니다. 나머지 작업들 (디바이스와 메모리를 만들고 컴파일 하고 실행하는 것) 은 컨텍스트 내에서 이루어집니다. 컨텍스트에는 사용 가능한 디바이스의 갯수 (예를 들어 CPU 와 GPU), 그리고 컨텍스트 내에는 장치 간 메모리를 유지합니다. 자세한 사항은 뒤에 다루겠습니다. 지금은 CPU 장치를 위한 CL_DEVICE_TYPE_CPU 디바이스 하나만 사용합니다. 만약 OpenCL 에서 지원한다면 CL_DEVICE_TYPE_GPU 등을 쓸 수도 있겠지요. 생성자 cl::Context 는 반드시 성공할 것이므로 변수 err 에는 CL_SUCCESS 가 들어있을 것입니다.

int
main(void)
{
cl_int err;

cl::Context context(
CL_DEVICE_TYPE_CPU,
NULL,
NULL,
NULL,
&err);
checkErr(err, "Conext::Context()");

실제 작업이 이루어지는 계산 장치를 파고들기 전에 먼저 장치 내에서 작업을 수행하는 커널의 결과값을 저장할 OpenCL 버퍼를 할당합니다. 여기서는 “Hello World
” 문자열이겠지요. 지금은 간단히 호스트에서 메모리를 할당하여 OpenCL 이 직접 메모리를 사용하도록, 버퍼를 생성할 때 CL_MEM_USE_HOST_PTR 플래그를 같이 전달합니다.

char * outH = new char[hw.length()+1];
cl::Buffer outCL(
context,
CL_MEM_WRITE_ONLY | CL_MEM_USE_HOST_PTR,
hw.length()+1,
outH,
&err);
checkErr(err, "Buffer::Buffer()");

= OpenCL Devices

OpenCL 의 대부분 작업은 주어진 컨텍스트 내에서 수행됩니다. 예를 들어, 버퍼 (1D 메모리 공간) 와 이미지 (2D 혹은 3D 메모리 공간) 할당은 모두 컨텍스트 작업입니다. 하지만 특정 장치 작업도 있습니다. 예를 들어 프로그램 컴파일과 커널 실행은 장치 기준이고, 이를 위해서는 특정 장치 핸들이 필요합니다. 특정 장치의 핸들은 어떻게 얻어낼까요? 장치 컨텍스트를 요구하면 됩니다. OpenCL 은 특정 장치의 정보를 얻어내는 방법을 제공합니다. C++ API 에서는 object.getInfo() 와 같은 형식이 됩니다. 컨텍스트로부터 장치 정보를 얻어오는 경우는:

cl::vector devices;
devices = context.getInfo();
checkErr(
devices.size() > 0 ? CL_SUCCESS : -1, "devices.size() > 0");

이제 컨텍스트에 속해있는 장치 리스트를 얻었습니다. 지금 경우는 CPU 장치겠지요, 이제 계산 프로그램 (장치 내에서 작동되는 프로그램) 을 읽어서 빌드하는 작업이 필요합니다. 다음 코드는 OpenCL 디바이스 프로그램을 디스크로부터 읽어서 문자열로 치환한 뒤 helper constructor 를 이용하여 cl::Program::Sources 를 생성하겠습니다. 이 객체는 컨텍스트 내에서 특정한 디바이스를 위해 만들어진 것입니다.

std::ifstream file("lesson1_kernels.cl");
checkErr(file.is_open() ? CL_SUCCESS:-1, "lesson1_kernel.cl");

std::string prog(
std::istreambuf_iterator(file),
(std::istreambuf_iterator()));

cl::Program::Sources source(

1,
std::make_pair(prog.c_str(), prog.length()+1));

cl::Program program(context, source);
err = program.build(devices,"");
checkErr(file.is_open() ? CL_SUCCESS : -1, "Program::build()");

프로그램에는 커널이라고 하는 많은 엔트리 포인트가 있고, 커널 객체로 빌드해야 합니다. 커널은 문자열 형식의 커널 이름으로 일대일 대응되어 있고, 계산 프로그램 내에서는 __kernel 형식으로 정의된 함수입니다. 여기서는 cl::kernel 형의 객체 kernel 을 빌드합니다. 커널 인수는, 특정 인수를 인덱스와 값으로 받아들이는 kernel.setArg() 라는 C++ API 를 이용하여 전달합니다.

cl::Kernel kernel(program, "hello", &err);
checkErr(err, "Kernel::Kernel()");

err = kernel.setArg(0, outCL);
checkErr(err, "Kernel::setArg()");

이제 코드가 준비되었고, 결과를 계산합니다 (여기서는 “Hello World
” 문자열을 버퍼에 넣습니다). 모든 디바이스 계산은 커맨드 큐를 이용하는데, 사용하려는 장치의 가상 인터페이스입니다. 각 커맨드 큐는 특정 장치와 일대일 대응되며, 해당 컨텍스트에서 클래스의 생성자 cl::CommandQueue 를 호출함으로써 생성됩니다. 커널은 queue.enqueuNDRangeKernel 을 이용하여 해당 장치로부터 커널을 실행합니다. 커널은 주어진 자원 내에서 1, 2, 3 차원 도메인 인덱스를 병렬로 수행합니다. 실행된 도메인 내 인덱스의 총 갯수를 글로벌 워크 사이즈 라고 하며, 워크 아이템이라고 하는 것의 갯수입니다. 워크 아이템끼리 정보 교환이 필요할 경우 워크 아이템을 워크 그룹으로 묶습니다. 워크 그룹은 서브 인덱스 함수(로컬 워크 사이즈) 로 정의되며, 글로벌 실행 도메인에서 지정한 차원에 대한 각 차원의 크기를 지정합니다. 그 외에도 커널 실행에 대한 여러 가지 고려할 점이 있으며, 향후 다른 튜토리얼에서 다루겠습니다. 지금은 Hello World 에서 각각의 워크 아이템은 결과 문자열의 글자를 계산하며, , 프로그램 앞에서 const std::string 으로 선언했던 hw 의 길이hw.length()+1 만 실행해도 충분합니다. 나머지 워크 아이템은 NULL 을 넣습니다.

cl::CommandQueue queue(context, devices[0], 0, &err);
checkErr(err, "CommandQueue::CommandQueue()");


cl::Event event;
err = queue.enqueueNDRangeKernel(
kernel,
cl::NullRange,
cl::NDRange(hw.length()+1),
cl::NDRange(1, 1),
NULL,
&event);
checkErr(err, "ComamndQueue::enqueueNDRangeKernel()");

위의 마지막 enqueueNDRangeKernel 의 마지막 인수는 cl::Event 객체였는데, 해당 커맨드의 상태를 저장할 때 쓰입니다. (예를 들어 작업 종료 같은) 커맨드가 종료될 때까지 대기하는 wait() 를 지원합니다. 이 함수는 queue.enqueueReadBuffer() 를 이용해여 결과물을 호스트 메모리로 읽어들이기 전에 커널 작업이 종료되었는지를 확실히 할 때 유용합니다. 결과가 호스트 메모리로 돌아온 다음에는 stdout 으로 결과물을 출력하고 프로그램을 종료합니다.

event.wait();
err = queue.enqueueReadBuffer(
outCL,
CL_TRUE,
0,
hw.length()+1,
outH);
checkErr(err, "ComamndQueue::enqueueReadBuffer()");
std::cout << outH;
return EXIT_SUCCESS;
}

마지막으로 디바이스 프로그램 lesson1_kernels.cl 을 완성하기 위해서 가외의 엔트리 포인트 hello 가 필요합니다. 이 커널 프로그램은 간단합니다. get_global_id() 를 이용하여 실행 도메인의 인덱스를 얻어냅니다. 이것을 문자열 hw 의 인덱스로 삼아서 그 값을 출력 배열 out 에 넣습니다.

__constant char hw[] = "Hello World
";
__kernel void hello(__global char * out)
{
size_t tid = get_global_id(0);
out[tid] = hw[tid];
}

안정성을 위해서 쓰레드 ID (tid) 가 hw 의 범위를 벗어나지 않는지 검사하는 것이 좋습니다만, 여기서는 queue.enqueueNDRangeKernel() 호출이 정확하다고 가정하겠습니다.

= Building and running

리눅스에서는 OpenCL 프로그램을 빌드하려면 명령 한 줄이면 됩니다. 예를 들어
gcc –o hello_world –Ipath-opencl-incude –Lpath-opencl-libdir lesson1.cpp –lOpenCL

실행할 때에는:
LD_LIBRARY_PATH=path-opencl-libdir ./hello_world

윈도우 비쥬얼 스튜디오 커맨드 윈도우에서의 예는:
cl /Fehello_world.exe /Ipath-opencl-include lesson.cpp path-opencl-libdir/OpenCL.lib

OepnCL.dll 이 path 에 들어있다고 가정하면 실행할 때는:
.hello_world

다음과 같은 문자열을 출력합니다 pm stdout:
Hello World

OpenCL 입문 튜토리얼이 끝났습니다. 궁금한 점이나 덧붙이고 싶은 점이 있으시면 Stream 포럼을 방문해 주세요.

= Useful Links

다음 목록에는 OpenCL 을 C 이외 언어에서 사용하는 방법에 대한 내용입니다. 모든 내용을 다 테스트해본 것은 아닙니다만, 유용한 정보이길 바랍니다:

* OpenCL specification and headers:
http://www.khronos.org/registry/cl/
* OpenCL technical forum:
http://www.khronos.org/message_boards/viewforum.php?f=28
* The C++ bindings used in this tutorial can be found on the OpenCL web page at Khronos, along with complete documentation:
http://www.khronos.org/registry/cl/
* Python bindings can be found here:
http://pyopencl.next-touch.com/
* C# bindings can be found here:
http://www.khronos.org/message_boards/viewtopic.php?f=28&t=1932
* An Introduction to OpenCL:
http://ati.amd.com/technology/streamcomputing/intro_opencl.html
0 0
로그인 후 추천 또는 비추천하실 수 있습니다.
포인트 228,692
가입일 :
2003-02-18 14:12:30
서명 :
미입력
자기소개 :
미입력

최신글이 없습니다.

최신글이 없습니다.

댓글목록 1

hongjuny님의 댓글

갑자기 방향을 약간 틀어서 OpenCL 을 찾아 보았습니다. 스노 레오파드가 나오면 정식으로 OpenCL 을 지원하게 될 것이라 하는데, CUDA 와 유사한 부분이 많다고는 하지만, 아무래도 ATI 와 NVIDIA 를 모두 사용할 수 있는 개방된 라이브러리가 좋겠지요. 아무튼 많이 기대하고 있습니다.

전체 121 건 - 1 페이지
2007.01
27

[App 개발] OpenCV 1.0.0 Frameworks

wlee 님 뿐만 아니라 Mac 에서 이미지 프로세싱 관련 연구를 하시는 분들에게 유용한 툴이 될 듯 싶습니다. 좋은 라이브러리를 알게 되어 wlee 님께 감사말씀 드립니다. ^^ 물론 1.0.0 을 그대로 command-line 으로 컴파일해도…

2006.08
22

[App 개발] 마유라 는 한글이 잘 되는군요. ^^

InputStreamReader 의 속성을 SJIS 에서 EUC-KR 로 바꾸는 방법으로 미와 고스트는 안되는데 마유라 고스트는 잘 되는군요. 인텔 맥에서도 문제없이 돌아가고 있습니다. 영환님도 이미 컴파일 해보셨겠지만, 안되었으면 한 번 …

2005.12
19

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (3)

이번에는 본격적으로 Quartz 의 Core Graphics 를 이용해서 그림을 그려 보겠습니다. 참고 자료로는 애플 홈페이지에서 다운로드 받으실 수 있는 Quartz 2D Programming Guide 입니다. 프로그램의 기본 구조는 이…

2005.12
17

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (2)

윈도우 프로그래밍을 처음 공부한ㄴ 사람들이 한결같이 내놓는 불만은 "왜 이렇게 어렵냐" 라는 것입니다. 막말로, C 에서는 printf("Hello World\\n") ; 요거 하나만 하면 글을 볼 수 있는데, 윈도우에서는 글자 하나를 보…

2005.12
16

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (1)

Xcode 새 버젼의 카본 어플리케이션 템플릿이 좀 더 친절해졌더군요. 한편, 지금까지 자기 고유의 이벤트 핸들러를 갖고 계시던 분들에게는 더 힘들어 졌더군요. ㅠㅠ 자 해 봅시다. 일단. Xcode 를 실행하고, File-&gt;N…

2009.10
22

[App 개발] GCD 예제

MacTech 10 월호에 게재된 GCD 예제를 번역하였습니다. 허락 없는 번역이므로 다른 곳에 퍼 가지 마세요. -_-; *** Grand Central Dispatch Grand Central Dispatch (GCD) 는 개발자들…

2009.09
24

[App 개발] OpenCL 프로그래밍 예제

개인 블로그에 차곡차곡 올리는 도중, 그래도 혹시나 쓸모가 있을 법한 아이를 하나 이곳에 분양하려 합니다. 아직 제 지식과 기술이 일천하여 완전히 최고 속도를 내지는 못하지만, 그래도 공부에는 도움이 될만한 소스가 아닐까 싶습니다. Bili…

2009.09
10

[App 개발] OpenCL 프로그래밍 도중 문제가 생기면...

2차원 Wavelet decomposition 루틴을 작성하기 위해 열심히 노력중에 있습니다. 아직 손에 익지 않은 기술이고, 예제가 많지 않은 기술이라, 매뉴얼 한 권에 의지하여 더듬더듬 나아가고 있습니다. 그런데 정말 신기한 현상을 보게 되었…

2009.08
27

[App 개발] CUDA, Supercomputing for the Masses (8)

- CUDA 와 라이브러리 사용 지난 회에서는 차세대 CUDA 하드웨어를 살펴보았습니다. 이번에는 하드웨어에서 소프트웨어로 주제를 약간 바꾸어서 CUDA 에서 라이브러리를 사용하는 것을 살펴보겠습니다. 최적화된 라이브러리는 응용프로그램의 성…

2009.08
26

[App 개발] CUDA, Supercomputing for the Masses (7)

- 차세대 CUDA 하드웨어 활용하기 6 장에서 CUDA 프로파일러를 이용하여 글로벌 메모리를 확인해 보았습니다. 이번에는 차세대 CUDA 하드웨어에 대해 살펴보려 합니다. CUDA 와 CUDA 지원 장치는 세대를 거듭할수록 더 향상된 성능…

2007.01
27

[App 개발] OpenCV 1.0.0 Frameworks

wlee 님 뿐만 아니라 Mac 에서 이미지 프로세싱 관련 연구를 하시는 분들에게 유용한 툴이 될 듯 싶습니다. 좋은 라이브러리를 알게 되어 wlee 님께 감사말씀 드립니다. ^^ 물론 1.0.0 을 그대로 command-line 으로 컴파일해도…

2006.08
22

[App 개발] 마유라 는 한글이 잘 되는군요. ^^

InputStreamReader 의 속성을 SJIS 에서 EUC-KR 로 바꾸는 방법으로 미와 고스트는 안되는데 마유라 고스트는 잘 되는군요. 인텔 맥에서도 문제없이 돌아가고 있습니다. 영환님도 이미 컴파일 해보셨겠지만, 안되었으면 한 번 …

2005.12
19

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (3)

이번에는 본격적으로 Quartz 의 Core Graphics 를 이용해서 그림을 그려 보겠습니다. 참고 자료로는 애플 홈페이지에서 다운로드 받으실 수 있는 Quartz 2D Programming Guide 입니다. 프로그램의 기본 구조는 이…

2005.12
17

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (2)

윈도우 프로그래밍을 처음 공부한ㄴ 사람들이 한결같이 내놓는 불만은 "왜 이렇게 어렵냐" 라는 것입니다. 막말로, C 에서는 printf("Hello World\\n") ; 요거 하나만 하면 글을 볼 수 있는데, 윈도우에서는 글자 하나를 보…

2005.12
16

[App 개발] Xcode 2.2 에서 카본 프로그램 만들자 (1)

Xcode 새 버젼의 카본 어플리케이션 템플릿이 좀 더 친절해졌더군요. 한편, 지금까지 자기 고유의 이벤트 핸들러를 갖고 계시던 분들에게는 더 힘들어 졌더군요. ㅠㅠ 자 해 봅시다. 일단. Xcode 를 실행하고, File-&gt;N…

2009.08
25

[App 개발] OpenCL: democracy for GPU computing?

OpenCL: GPU 프로그램의 민주주의인가 by Damien Triolet March 19, 2009 OpenCL 개발 실무진이 꾸려진 지 6 개월 후 Khronos 라는 이름으로 출범하게 되었습니다. 아시는 것처럼 OpenCL (Open …

2009.08
22

열람중 [App 개발] Introductory Tutorial to OpenCL

Introductory Tutorial to OpenCL Skip Navigation LinksHome > GPU Tools > ATI Stream SDK > Introductory Tutorial to OpenCL Benedict R. Gas…

2009.08
21

[App 개발] CUDA, Supercomputing for the Masses (6)

- 광역 메모리와 CUDA 프로파일러 이번 6회에서는 메모리 성능과 reverseArray_multiblock_fast.cu 에서 공유 메모리를 사용하는 것을 살펴보겠습니다. 이번에는 CUDA 프로파일러를 이용하여 광역 메모리를 점검할 것입니다.…

2009.08
20

[App 개발] CUDA, Supercomputing for the Masses (5)

- 공유 메모리의 이해 (2) 지난 4회에서 실행 모델과 커널 실행 환경 설정이 레지스터의 갯수와 공유 메모리같은 지역 멀티프로세서 자원에 영향을 미치는지 살펴보았습니다. 이번에는 메모리 성능과 reverseArray_multiblock_fast…

2009.08
19

[App 개발] CUDA, Supercomputing for the Masses (4)

- 공유 메모리 사용법 CUDA 개발자에게 성능 향상의 관건은 공유 메모리, 상수 메모리, 레지스터 등의 프로세서 지역 메모리를 효율적으로 사용하는 것입니다. 앞 장에서 살펴본 것처럼, 전역 메모리 밴드폭이 60GB/s 라고 하지만, 실제 부동소…

2009.08
18

[App 개발] CUDA, Supercomputing for the Masses (3)

- 오류처리와 전역 메모리 성능 한계 축하합니다! CUDA 시리즈의 1편과 2편을 마치신 여러분은 CUDA 프로그래머가 되어서 이제 여러분은 CUDA 장치가 지원하는 수백 개의 병렬 쓰레드를 이용한 프로그램을 개발할 능력을 갖추셨습니다. 2편에 …

2009.08
17

[App 개발] CUDA, Supercomputing for the Masses (2)

지난 1편에서는 첫 번째 CUDA 예제 moveArray.cu 를 소개하면서 CUDA 툴을 이용하여 프로그램을 만들고 실행하는 것을 연습하였습니다. C 프로그래머에게 그 프로그램은 단순히 CUDA API 를 호출하여 메모리를 할당하여 CUDA 장비와 …

2009.08
16

[App 개발] CUDA, Supercomputing for the Masses (1)

CUDA, Supercomputing for the Masses Rob Farber April 15, 2008 CUDA 는 GPU 상에서 동작하는 소프트웨어를 쉽게 개발하는 기법을 제공합니다. C 와 같은 고급언어를 사용하면서도 멀티코어…

2009.08
15

[App 개발] Mac OS X 커널의 내부 (3)

- 인텔 프로세서 관련 XNU 가 i386 을 지원하기 시작한 것은 90 년대 중반 OpenStep 으로 판매되기 시작할 때부터이지만, Mac OS X 에 적용된 것은 애플이 인텔 프로세서를 채택한 2005/2006 년도부터입니다. 그리고 64 …

2009.08
14

[App 개발] Mac OS X 커널의 내부 (2)

- 아키텍쳐 "XNU" (X is Not Unix) 라는 이름의 Mac OS X 의 커널은 세 가지 요소 (Mach, BSD, I/O-Kit) 로 구성되어 있습니다. - Mach (GNU/HURD 를 제외하고) 아직까지 Mach 코드를…

2009.08
13

[App 개발] Mac OS X 커널의 내부 (1)

Mac OS X 커널의 내부 Mac OS X 에는 마하 커널, 마이크로 커널, FreeBSD 커널, C++, 64 비트, 유닉스,... 그리고 이 모든 것이 포함된 "XNU" 등 여러 전문용어가 담겨있습니다. Mac OS X 커널은 마하 커널도,…

2009.08
12

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (7)

플랫폼 엑스퍼트는 IODTNVRAM 인스턴스를 new 구문으로 직접 생성하고 있으므로 둘은 강하게 연결되어 있습니다. /options 노드는 연결 과정에 참여하고 있지 않고 있으며, 따라서 IODTNVRAM 을 대체할 드라이버를 제공하는 쉬운 방법이 …

2009.08
11

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (6)

- 프로퍼티 조정: 약간의 거짓말이 필요할 때 멤버 변수 외에도 Mac OS X 드라이버에는 IOService (모든 Mac OS X 드라이버의 수퍼클래스) 로부터 상속받은 프로퍼티 테이블을 가지고 있습니다. 프로퍼티를 억세스하는 멤버는 퍼블릭이…

2009.08
09

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (5)

- Mac OS X 업데이트 문제: 오묘한 커널의 세계 기존 드라이버에서 서브클래스를 만들어 우회하는 기법의 가장 큰 장점은 애플이 Mac OS X 를 업데이트 하더라도 커널 익스텐션을 계속 사용할 수 있다는 점입니다. 애플이 제공하는 드라이버를…

2009.08
08

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (4)

- 애플 드라이버 서브클래싱: CD-ROM 충돌이 일어난 경우 Mac OS X 정품을 미 지원 시스템에 설치하는 또 다른 어려운 과제가 바로 스커지 CD-ROM 장치에 CD 를 넣을 경우 시스템 패닉이 일어난다는 점입니다. 이것은 좀 어려운 문제…

2009.08
07

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (3)

- 부팅 과정 따라가기: 정품 인스톨 CD 부팅 PatchedNVRAM.kext 뿐만 아니라 여러 개의 드라이버들을 고치거나 새로 만들어야 합니다. 대략 45,000 줄의 코드 분량의, 모두 30개의 커널 익스텐션을 손보아야 합니다. 미 지…

2009.08
06

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (2)

... 수정된 코드를 PatchedAppleNVRAM 으로 컴파일하는 것은 어렵지 않았습니다. AppleNVRAM 클래스는 짧고 간결했기 때문에, 코드를 복사한 다음 수정해야 할 두 줄만 고쳐 주었습니다. 이제 어떻게 커널이 내 드라이버를 선택하…

2009.08
05

[App 개발] OS X 를 지원하지 않는 기종을 위한 커널 해킹 (1)

OS X 를 지원하지 않는 기종을 위한 커널 해킹 Ryan Rempel (Other World Computing) - 요약 OS X 가 더 이상 지원하지 않는 기종에서 OS X 를 사용하기 위해서는 커널과 몇 가지 IOKit 익스텐션을 변경해…

2009.02
16

[App 개발] SSE 최적화 (0) 서

맥이 인텔 프로세서를 사용한 지 어언 수 년이 흐르고, 이제 자연스럽게 인텔 프로세서의 장점을 십분 활용하는 방법을 강구하여야 하겠습니다. 예전에 제가 본 게시판에 게재했던 '코드 최적화' 글들을 같이 참조하시면 도움이 되실 것입니다. 대장…

2008.10
14

[App 개발] NSImage 를 비트맵으로 처리하는 방법

제가 아까 잠결에 본 질문글이 있었는데, 다시 자고나서 일어나보니 지우셨나봐요. 질문 내용을 정확히 이해하지 못하고 그냥 얼핏 보았는데, 대략 "NSImage" 객체에서 raw 비트맵 정보를 끄집어내서 작업하고 싶어하시는 것 같던데, 맞나요 …

2007.08
18

[App 개발] 오목 게임 (소스포함)

어떤 분의 요청에 의해 오목게임에 착수한 지 일주일만에 이런 엄청난 게임 -_-;;; 을 만들 수 있다니... 저의 재능에 스스로 놀라면서 (우웩~ -0-;) 카본과 쿼츠 2D 로 만든 초간단 오목 게임입니다. 상당히 멍청한 알고리듬을 탑재하고 …

2007.01
27

[App 개발] OpenCV 1.0.0 Frameworks

wlee 님 뿐만 아니라 Mac 에서 이미지 프로세싱 관련 연구를 하시는 분들에게 유용한 툴이 될 듯 싶습니다. 좋은 라이브러리를 알게 되어 wlee 님께 감사말씀 드립니다. ^^ 물론 1.0.0 을 그대로 command-line 으로 컴파일해도…

2006.11
05

[App 개발] iCal 에 음력 날짜를 출력하자

"한국 달력" 위젯으로 음력 날짜를 확인하셔도 되긴 합니다만, 이왕이면 iCal 에 음력 날짜를 표시해 두면 일정 관리 및 어르신, 친지, 친구 생일 등을 한 프로그램에서 할 수 있으니 편하겠지요 지난번에 iCal 의 파일 포맷을 읽어들이는 루틴…

2006.08
26

[App 개발] iCal 의 데이터를 읽어들이는 초간단 Java 소스

최종 목표는 가짜사과 입니다만 -_-; 혹시나 이런 허접한 소스라도 필요하신 분이 있지 않을까 싶어서 이렇게 올립니다. 눈여겨 보실 클래스는 iCalReader 이고요, iCal 의 데이터를 읽어들이는 루틴을 짧게 구현한 것입니다. O'Re…

2006.08
25

[App 개발] 가짜사과에 내장된 카와리 7 모듈

오늘도 일하다가 몰래 소스를 좀 봤습니다. -_-; 이러다 짤리는걸까 SHIORI Kernels 디렉토리에 있는 SCKawari*.java 가 바로 문제의 "카와리 7" 의 Java 클론이라는데 대충 이렇게 저렇게 살펴보니 대략 세 가지 모…

2006.08
24

[App 개발] 혹시 shioribox 에 관한 정보가 있으면

JNI 에서 시오리 커널을 호출하는 기능 (어떤 설명에서는 커맨드 라인에서도 구동이 가능하다고 하더군요) 을 담당하는 shioribox 모듈에 관한 정보가 좀 더 필요한데, 혹시 찾으신 것 있으면 알려주세요. 이제 Kawari 8 모듈은 거의 다…

2006.08
22

[App 개발] 마유라 는 한글이 잘 되는군요. ^^

InputStreamReader 의 속성을 SJIS 에서 EUC-KR 로 바꾸는 방법으로 미와 고스트는 안되는데 마유라 고스트는 잘 되는군요. 인텔 맥에서도 문제없이 돌아가고 있습니다. 영환님도 이미 컴파일 해보셨겠지만, 안되었으면 한 번 …

2006.08
22

[App 개발] 니세링고 한글 입력

자바의 BufferedReader 메쏘드를 이용해서 딕셔너리를 읽어들이는 것으로 생각이 되는데 그래서 BufferedReader 를 생성할 때 만드는 InputStreamReader 에 코드를 SJIS 에서 EUC-KR 이나 MS949 로 변경해…

2006.08
21

[App 개발] 나니카 실행 성공

설명에 나온 그대로였어요. 영환님. ㅎㅎ 그런데, 되는 고스트가 있고 안 되는 고스트가 있네... -_-;

2006.08
11

[App 개발] MallocDebug

Xcode 와 CHUD 를 설치하면 여러 가지 Performance Tools 를 보게 됩니다. 그 중에서 Shark 툴을 가장 빈번히 사용하게 되는데요, 이것은 일종의 profiling tool 입니다. 어떤 프로그램이 어떤 경로로 어떤 루틴을 수행…

2006.05
24

[App 개발] OpenGL 을 이용한 게임 만들기 (2) - 3D 모델

드디어 3D 의 세계로 입성하게 되었습니다. 게임 프로그래밍을 생각하시는 많은 분들이 일단 OpenGL 책부터 끄적끄적 하다가 그냥 덮게 되는것은, 어디서부터 손을 대어야 할지 모르기 때문이 아닐까 생각합니다. 일단 OpenGL 을 사용하기 위해서 습…

2006.05
18

[App 개발] OpenGL 을 이용한 게임 만들기 (1) - 2D 맵

앞으로 얼마나 진도를 나갈 수 있을지 저도 장담할 수 없는 시리즈의 첫 번째 편을 쓰게 됩니다. ㅡㅡ; Mac OS X 뿐만 아니라 여러 다양한 플랫폼에서 산업 표준으로 이용되고 있는 OpenGL 을 이용한 게임 제작이 한창입니다. MS 의 Di…

2006.03
23

[App 개발] GNU Scientific Library 를 Xcode 에서 컴파일하다

과학, 공학 전공하시는 분들이시라면, 선호하는 계산 라이브러리가 있으실 줄 압니다. 가장 간편하고 인기있는 라이브러리는 역시 Numerical Recipes 라이브러리가 되겠지만, 요즘은 GNU Scientific Library (GSL) 이 대세죠 …

2006.03
11

[App 개발] 인텔맥에 대처하는 우리의 자세 ㅡㅡ;

이미 작년 6월 이후부터 꾸준하게 유니버설 바이너리 관련 개발자 정보들이 나왔기 때문에 지금은 그 충격이 거의 상쇄되어 버린 기분입니다. 그리고 새로 출시된 인텔 아이맥과 맥북 프로의 성능이 기존 제품을 훨씬 능가한다는 사실을 보면서 많은 개발자들이 …