메뉴 www.fafan.kr
파판 >> 특집기사
  • 로그인
  • PS3의 GPU는 1개는 아니다.전부1+7개 있다
    작성자 : 기렌자비 | 조회수 : 9214 (2005-05-21 오후 4:08:45)
    - 첨부파일
      ps3_r03.gif


    3 D게임 팬을 위한 플레이 스테이션 3 GPU 강좌
    ~ 「PS3의 GPU는 1개는 아니다.전부1+7개 있다」

    5월 18일~20일(현지시간) 개최

    회장:Los Angels Convention Center

     플레이 스테이션 3의 그래픽 하부조직에는 수수께끼가 있었다.그것은

     

     (1) UMA를 채용하지 않고, CPU(CELL 프로세서)에 접속되는 메인 메모리를 XDR DRAM를 256 MB, 그래픽 칩(GPU:RSX, 이하 RSX-GPU)에 GDDR3 SDRAM를 256MB……라고 하는 구성으로 한 것.

     (2) NVIDIA 사장 Jen-Hsun씨의 프리젠테이션으로 RSX가, 자신의 비데오메모리 용량 256 MB를 넘는 512 MB의 렌더링을 할 수 있다고 하는 기술이 있었다고  .

     이 2점이다.

    GDDR3 256 MB에서는, 512 MB-UMA의 Xbox 360보다 쓰기에 뒤떨어지는 것처럼 생각되지만? 실은…… 「최대로 512 MB메모리에의 렌더링이 가능」이라고 하는 기술.다만, RSX에는 256 MB의 비디오 메모리 밖에 없을 것.이 의미하는 곳은?


    NVIDIA 치프 사이언티스트, David Kirk씨.별명은 NVIDIA의 Kirk 캡틴 이다
     이것의 수수께끼에 대해서, RSX의 설계원인 NVIDIA에의 취재를 행해 보았다.

     상대는, NVIDIA의 모든 GPU 개발에 종사하는 「GeForce의 아버지」의 이명을 취하는 치프·사이언티스트의 David Kirk씨다.


    ■ PS3의 RSX-GPU는 메인 메모리에도 렌더링이 가능

    PS3의 아키텍쳐 블럭도.이 그림을 보는 한 RSX-GPU는 256 MB의 GDDR3 비데오메모리 밖에 이용할 수 없는 것처럼 보이지만 실은 다르다
     (1)의 메인 메모리와 비데오메모리를 분리할 수 있어 탑재되는 것의 디메리트는, 1개에, 「그래픽스에 256 MB인가 사용할 수 없다」라고 하는 용량 제한이 가능하게 되는 것이다.렌다타겟트가 되는 frame buffer는 PC로 말할 곳의 XGA나 UXGA에 상당하는 픽셀수의 하이비젼 해상도.

     한층 더 대량의 디칼 texture 외에, 법선 맵까지 페어에 활용되는 차세대기의 3 D그래픽스에서는 비데오메모리를 꽤 소비한다.

     메인 메모리와 비데오메모리가 통합된 형태로 512 MB 있는 Xbox 360에서는, 씬이나 상황에 따라 512 MB의 범위에서 자재로 그래픽 용도와 그 외의 용도로 배분된다.그런데 PS3에서는 256 MB의 경계가 있기 위해서 자유도의 면에서 Xbox 360에 뒤떨어지는 것은 아닌가……라고 하는 의문이 부상한다.

     이것에 대해 Kirk씨는 아래와 가이 설명을 했다.

     「RSX는 CELL측의 메인 메모리인 XDR DRAM측을 렌다타겟트로서 이용할 수 있다.그러니까 그러한 제약은 거의 없다고 생각해 있어」즉, RSX는, GDDR3 256MB+XDR 256 MB=512 MB의, 토탈 512 MB의 영역을 비데오메모리로서 활용하는 것이 이론상은 가능하다.이것이 스스로(2)의 수수께끼를 밝혀내게 된다.

     그래, PC를 잘 아는 독자이면 PC로 말하는 무렵의 AGP 메모리……GART(Graphics Aperture Remapping Table)라고 하는 기구를 이용하고, GPU가 메인 메모리를 로카르비데오메모리 감각으로 직접 액세스 할 수 있는 기능……에 가까운 것……이라고 생각하면 이 개념이 이미지 하기 쉬울 것이다.

     그러면, 현실적으로, 메인 메모리를 GPU에 직결되는 GDDR3 비데오메모리와 동등의 활용을 할 수 있을지라고 하는 이야기를 하면, 그것은 어렵다고 하지 않을 수 없다.

    CELL 프로세서의 아키텍쳐.RSX-GPU는 FlexIO 버스에 접속된다
     이 블럭도를 보면 좋겠다( 오른쪽 화상).

     RSX-GPU는 CELL와 Flex I/O로 접속되어 CPU→GPU의 하행 방향이 20 GB/s, CPU←GPU의 오름 방향이 15 GB/sec의 대역에 제한된다.CPU로부터 XDR 메인 메모리에의 대역은 25.6 GB/sec 있지만, 결국, GPU로부터 메인 메모리에의 렌더링은 올라 버스 대역의 15 GB/sec에 제한되어 여기가 보틀 넥이 되어 버린다.

     한층 더 말하면, 블럭중 「BUS」라고 기재된 부분은 PPE와 8기의 SPE를 물통 릴레이식에 묶은 「Element Interconnect Bus」링 버스 구조를 하고 있어 여기를 지날 때의 지연시간은 제로는 아니다.

     결국, 완전하게 비데오메모리와 같이 취급하는 것은 어렵다고 하는 것이다.구체적으로 말하면, 씬을 texture에 렌더링 해 이것을 한층 더 그 씬의 렌더링에 적용하는 멀티 패스 렌더링의 시나리오에 대하고, 그 렌다타겟트로서 XDR 메인 메모리만을 활용하면 꽤 퍼포먼스가 저하해 버리는 것이다.


    ■ PS3에는 SPE라고 하는 서브 GPU가 있잖아∼RSX-GPU와 7기의 SPE가 SLI를 실현해?

     그러면, 결국, 이 PS3의 아키텍쳐에 어드밴티지는 없는 것일까.

     「그렇지 않다.CELL 프로세서내의 7기의 SPE(Synergistic Processor Element)와 RSX-GPU는 공동 작업을 할 수 있다.메인 메모리상의 그래픽스 관련 데이터에 SPE가 사전 처리를 베풀거나 혹은 RSX-GPU로부터의 렌더링 결과를 포스트처리적인 영상 가공을 하는 것도 할 수 있다(Kirk씨)」.

     RSX-GPU가 CELL 프로세서의 메인 메모리에 액세스 할 수 있다고 하는 것은, 반복하면, 메인 메모리는 말하자면, CELL 프로세서와 RSX-GPU의 공유 메모리라고 하는 견해도 할 수 있다.PS3에서는 이 아키텍쳐가 어드밴티지가 된다.

      CELL 프로세서에는 SPE로 불리는, 4 요소의 32비트 부동 소수점 실수 벡터 연산에 특화한 128비트 SIMD형 RISC 프로세서가 7기탑재되고 있다.

     이 SPE 자신의 포텐셜은, SCE의 성능 지표를 믿어도 좋은 것이라면, 예를 들어 SPE1 기본으로 정점 처리를 행하게 하면 3.2 GHz 동작시에 8억 정점 매초가 되어, 이것은 일반적인 GPU의 복수개 분의 프로그라마브르시다에 상당한다.한층 더 프로그라마비리티에 관해서는 풀 스펙의 C++가 동작하는 레벨이며, 프로그라마브르시다를 아득하게 능가하고 있다.

     이미, SCE에서는 복수개의 SPE를 GPU적으로 활용하는 소프트웨어 그래픽스 엔진도 실험적으로 완성시키고 있어 요전날 개최된 프레스 컨퍼런스에서도, SPE만으로 렌더링 한 그래픽스를 공개했다.

    SPE만으로 렌더링 한 프라이트 시뮬레이터 라이프 라이바이·데모.법선 맵까지도 적용
    런던의 피카딜리 서커스의 풍경을 리얼타임 렌더링으로 표현한 데모.이것도 CELL 프로세서의 SPE만을 사용해 렌더링 한 것이라고 한다
    Electronic Arts가 나타내 보인 PS3 시험 제작기로 동작하는 복싱 게임의 인터액티브·컨셉·데모.이쪽은 SPE와 RSX의 콤비네이션에 의해서 실현된 것이라고 한다


    NVIDIA 제공
     예를 들어, 어느A 씬을 복수의 렌다타겟트를 이용해 멀티 패스로 렌더링 할 때를 생각해 본다.

     예를 들어, 그림과 같은 수면에 주위의 정경이 비치는 씬.

     이러한 씬의 경우, 씬 전체의 렌더링의 전에, 수면을 경계로 반전한 수면 아래의 위치로부터의 씬을 texture로서 렌더링 한다(반사 맵의 생성).

    반사 맵.이것을 SPE로 렌더링 시키면?
     그리고 최종 렌더링시에는, 이 texture를 사용하고 수면에의 비쳐 포함을 표현해 나가는 것이지만, 1개의 GPU의 시스템에서는, 이것들을 모두 자신 혼자서 행한다.만일 반사 맵의 생성에 시간이 걸려지면 렌더링 전체가 지연 해 프레임 빠짐으로 결합된다.

     이 반사 맵도 해, CELL 프로세서측의 SPE로 RSX-GPU의 동작과 병행해 렌더링 할 수 있으면, RSX-GPU 혼자서 모두를 하는 것보다도 처리 시간의 단축이 된다.즉 퍼포먼스가 향상한다.

     RSX-GPU가 최종적인 렌더링을 행할 때 , XDR 메인 메모리로부터 이 반사 맵을 꺼내게 되어, 이것은 FlexIO의 GPU에의 내리막 대역인 20 GB/sec에 제한된다.그러나, 토탈로 보면 충분한 성능 돈벌이가 될 것이다.

     이 경우, 메인 메모리 측에도 비데오메모리 측에도 지오메트리셋트나 texture 세트를 로드해 둘 필요가 있지만, 반사 맵과 같은 용도의 경우, 원래 비뚤어지게 해 표시하거나 하므로, 모델 정도가 엉성하거나 texture 해상도가 낮아도 이렇다할 문제는 되지 않는다.뭐, 여기서 나타내 보인 것은 설명을 위한 예에 지나지 않지만, 이와 같이 렌더링을 RSX-GPU와 SPE의 공동 작업으로 실시한다고 하는 아이디어는 꽤 독특한 feature라고 말할 수 있다.

     NVIDIA는 복수의 GPU로 렌더링을 행하는 기술 「SLI」를 갖고 있지만, 이 PS3의 구조는, 어느 의미, 세미판 SLI라고 할 수 있을지도 모른다.


    ■ SPE로 렌더링 한 영상의 화상 처리를 행할 수도 있는

    GDC2004 「Practical Implementation of High Dynamic Range Rendering」카와세 마사키씨의 슬라이드 에서.HDR 렌더링 한 프레임중의 고휘도 부분이 흘러넘쳐 내는 효과를 실현하기 위해서는, 이러한 저해상도로 생성한 개화 효과 프레임을 다수매합성할 필요가 있다.Kirk씨는 「이러한 포스트처리를 SPE에 맡길 수도 있을 것이다」라고 한다
     「모션 브라-나 피사계 심도의 시뮬레이션, HDR 렌더링시의 개화 효과등의 포스트처리……즉 RSX-GPU가 렌더링 한 결과를 CELL의 SPE로 화상 처리 한다……라고 하는 활용도 생각할 수 있을 것이다(Kirk씨)」.

     고속으로 움직이고 있도록(듯이) 흔들려 보이는 모션 브라-, 핀트가 맞지 않은 듯한 희미해진 영상으로 하는 피사계 심도의 시뮬레이션, 너무 강하게 빛나고 있기 위해서 빛이 넘쳐 나와 해 보이는 개화 효과등의 처리에 대해서는, RSX-GPU가 XDR 메인 메모리 측에 씬을 렌더링 해, 이 프레임에 대해서, 복수의 SPE가 따르고 있었던 사 화상 가공 처리한다……라고 하는 흐름이 될까.

     혹은, 방금전의 반사 맵의 생각과 같게, 해상도가 낮은 브라-용, 질투용, 개화용의 프레임을 SPE로 작성해, 이것을 최종 단계에서 RSX-GPU에서 렌더링 한 표시 프레임과 합성한다……라고 하는 흐름도 생각이 떠오른다.어느 쪽이 효과적인가, 성능이 높은지, 는 케이스 바이 케이스다.


    ■ SPE로 렌더링 한 영상의 화상 처리를  할 수도 있다

    차세대 Windows, longhorn에는 텟세레이타의 구조가 도입될 예정이었지만 제반의 사정에 의해서 캔슬되었다
     「SPE들에게 정점 처리를 시켜, 이것을 RSX-GPU로 렌더링 할 수도 있다(Kirk씨)」.

     RSX-GPU에는 이미 프로그래머블 정점 시다가 있기 위해, SPE로 정점 처리를 하는 의미가 없다고 생각될지도 모른다.그러나, SPE의 높은 프로그라마비리티를 가지고 하면, RSX-GPU측의 프로그래머블 정점 시다에는 할 수 없는 고도의 처리계를 실장할 수 있다.

     예를 들어, 차세대 Windows의 그래픽 하부조직에서도 표준 실장이 보류되어 버린 텟세레이타를 SPE상의 소프트웨어로 실장하는 아이디어를 생각해 낼 것이다.덧붙여서 텟세레이타와는 특정의 메소드로 다각형을 자동 분할하는 구조.

     텟세레이타의 응용은 몇개인가 있고, 가장 기본적인 활용은, 적은 정점에서 주어진 3 D모델을 베지에곡선 함수 등에 따라서 텟세레이타를 적용해 다다각형 모델에 승화시키는 경우다.

     좀 더 고도의의는, 요철을 표현한 높이 맵·texture에 따라서 3 D모델을 점토 세공과 같이 변형시키는 활용법도 있다.이것은 특히 디스프레이스먼트맙핑(변이 매핑)이라고 한다.

    디스프레이스먼트 매핑의 예.이 예에서는 소수 다각형으로 구성된 기본 모델에 대해, 디테일을 나타내는 요철 texture를 적용해 다 폴리곤 모델을 만들어내고 있다.그림 제공 :MATROX


     이러한 텟세레이타의 처리계가 GPU에 인플리맨트 되지 않는 이유는 몇개인가 있지만, 이유의 필두로서 줄 수 있고 있는 것은, GPU측에서 텟세레이타를 실장해 버리면, 게임 처리계와는 분리되어 버려, 비주얼과 게임 처리의 정합성이 잘 되지 않게 되기 위해.

     예를 들어 디스프레이스먼트맙핑으로 모퉁이를 캐릭터에 기를 수 있었을 경우.게임의 당 판정은 CPU의 소프트웨어 처리로 실천하는 것이 일반적이다.GPU측의 처리계로 외형적으로 뿔을 길렀다고 해도, CPU측에서 관리하는 캐릭터 모델에게는 모퉁이가 나지 않기 때문에, 모퉁이에는 사실상 당 판정을 행할 수 없다.그런데 , SPE는 CPU의 일부이며, SPE로 뿔을 기르면, 이 뿔을 기른 모델에 대해서도 당 판정의 처리를 행할 수 있다.

     이 외, 시점으로부터의 거리에 따라 묘화 다각형수를 증감시키는 동적인 LOD의 실장도 SPE를 활용해 행할 수 있을지도 모른다.

    Level of Detail의 개념.시점에 가까운 위치만큼 많은 폴리곤수를 사용해, 멀지는 소수의 다각형으로 조잡하게 그려 묘화 퍼포먼스를 번다.이 구조를 SPE로 실장할 수 있을까? 그림 제공 :MATROX



    ■ SPE로 물리 시뮬레이션을 시켜 결과를 그래픽스에 반영시킨다

     「SPE와 GPU의 공동 작업을 활용하면, 그래픽스와 상호작용 하는 물리 시뮬레이션도 가능하게 될까」라고 하는 질문에 대해 Kirk씨는 「충분히 가능할 것이다」라고 대답한다.

     수면의“잔물결”표현은 현재, 법선 맵의 애니메이션으로 표현되는 것이 많다.이 잔물결의 파동 시뮬레이션은, 잔물결의 높이를 texture화한 하이트 맵(높이 맵)의 차원에서 파동 물리 시뮬레이션을 행해, 그 결과로부터 법선 맵을 생성하고, 이것을 최종적인 렌더링에 사용한다.

     지금까지는 이러한 texture 베이스의 파동 시뮬레이션을 GPU로 행하고 있었지만, 이것을 CELL의 SPE로 RSX-GPU와 병행 작업으로 행할 수 있으면 퍼포먼스 업에 결합된다.이것도 하고 있는 내용 자체는 다르지만, 생각으로서는, 최초의 반사 맵의 예와 다르지 않다.

    Kirk씨는 「PS3의 구조는 소니와 NVIDIA의 기술의 결정체다.어쨌든 훌륭한 것이 되었다고 자부하고 있다」라고 하는 지금까지 모두 GPU로 하고 있던 것 같은 일을, CELL 프로세서의 SPE에 담당 당한다.예를 들면 이 그림을 보면, PS3의 아키텍쳐이면 「시뮬레이션」과「texture」의 블록을 SPE에 맡길 수 있는 것을 알수 있다


     아키텍쳐·블럭도상은 메인 메모리와 비데오메모리로 분단 되어 버린 형태의 PS3이지만, CELL의 SPE들이 그래픽스 처리에 참가할 수 있을 가능성이 시사된 것은, 「PS3로 완성되는 것」의 가능성을 크게 넓힌 것처럼 생각된다.

     물론, CELL의 SPE, 7기전부가 그래픽스 처리에 동원해지는 케이스는 적다고 생각되지만, SPE의 그래픽스 처리에의 활용이, RSX-GPU의 포텐셜을 넘은 영상을 만들어 내는 것에 결합되는 것은 틀림없다.

    SPE로 지오메트리 처리계의 파이프라인을 구축한 기분이 든다.이 그림에서는 4기의 SPE를 그래픽스 처리에 활용해 본 예


    □소니·컴퓨터 엔터테인먼트의 홈 페이지
    http://www.scei.co.jp/

    [게임워치]






    글쓰기 | 수정 | 삭제 | 목록   

    Lv.2 mgs1209 (2005-05-21 19:31:53)
    무슨 소리하는지 전혀 컴맹이라 ㅠㅠ
    Lv.2 해원~ (2005-05-21 21:20:15)
    복잡해라~~~
    Lv.2 mlbmania (2005-05-22 11:00:48)
    ..
    Lv.3 sepyros (2005-05-22 20:12:38)
    도통 뭔소린지?
    Lv.4 자랑쟁이콩쥐 (2005-05-23 08:17:01)
    어렵다...ㅋ
    Lv.2 캐로짱 (2005-05-23 15:44:37)
    난 그림만 봤음...
    Lv.2 스타스킨 (2005-05-23 23:55:07)
    당최 가격이 얼마나 될라고...
    Lv.2 yuki (2005-05-24 05:57:41)
    음....ㅡㅡa
    Lv.2 dahlia (2005-05-24 12:49:36)
    무슨소린지 -_-;;;
    Lv.2 캐츠아이 (2005-05-24 14:03:42)
    좋은자료감사합니다.
    Lv.4 노바쏘닉 (2005-05-27 19:08:14)
    어 .. 어렵다.. ㅡㅡ;;
    Lv.2 상콤한양파 (2005-05-28 05:06:32)
    결국 얼마에 파는건지... 값올리기 위한 작업인가
    Lv.2 아흐흐 (2005-05-28 17:07:38)
    허걱..... 일본사이트 에서 번역 으로 퍼온듯하네요;;
    우리나라말로 좀 매끄럽게 해석되었으면 이해가 쉬울듯한데;;(왜놈들 전문용어는 이상한게 많아서)
    봐도 ㅡ,.ㅡ; 내용이해 어려움 ㅠㅠ
    Lv.2 ACOC (2005-05-28 17:54:37)
    뭐가 256MB 했다가..-_-;
    Lv.2 작대기 (2005-05-30 13:43:55)
    병열로 7+1개란 말인가...
    진짜스샷이나 빨리 봤으면 하네요...
    Lv.2 AIPUE (2005-05-31 10:56:50)
    50만원이상이면 패스...
    Lv.2 하범용 (2005-05-31 13:42:33)
    비데오..
    Lv.2 mojo (2005-06-01 16:55:24)
    윗글보면 성능 참 좋은데 실제 나와봐야 아는거지...
    Lv.2 원선생 (2005-06-02 11:43:48)
    나와봤자 돈이낭패
    Lv.3 astra (2005-06-04 18:00:26)
    나와도 좋은게임 나올때까지 참아야죠. ^^
    그리고 플스1,2 때처럼 서민의 방법이 나온다면 ㅡㅡ+
    ㅋㅋ
    Lv.3 액플러 (2005-06-05 09:40:29)
    나와봐야 알수 있는게 아닐까요..
    Lv.2 제다이 (2005-06-08 14:38:52)
    아무튼 좋은거란 소리인듯 한데-_-;
    Lv.2 윗어 (2005-06-08 19:45:55)
    비싸겠네
    Lv.2 SpeedStars (2005-06-09 01:26:20)
    50만원 이상올라간다는건가..
    Lv.2 AIPUE (2005-06-09 10:49:26)
    엑박1회전이 35만원돈인데..스펙이 뛰어나고 네임밸류가 있다하더라도 50만원이상으로 책정되면 대략 난감. 시장조성실패의 계기가 될 것이다. PS2가 그나마 그 가격에서 팔릴 수가 있었던건 하드자체의 성능보다는 당시의 소프트라인업이 다른 기종보다 훌륭했기 때문이다.
    Lv.2 쭈운 (2005-06-10 04:30:11)
    제발 40만원이하로 나오길..
    Lv.2 네오짱 (2005-06-13 17:10:41)
    넘 비싸다.. -_-+
    Lv.3 흣핫이너붐 (2005-06-15 09:48:44)
    그냥 보는거다
    Lv.2 빅보이 (2005-07-02 15:09:19)
    흠..플스랑 액박 둘다사면 얼마나 들려나..ㅠㅠ
    Lv.2 참진이슬로 (2005-07-04 14:44:55)
    에궁 나오고 반년은 기다렸다 사야겠다...
    Lv.2 アスカ♡LOVER (2005-07-07 03:34:56)
    음.. 인텔의 하이퍼스레딩과 비슷한 원리인가?.. 기계값이 좀 비싸질지도...
    Lv.2 zhee (2005-07-13 19:42:34)
    PS3 사놓고서 PS2게임만 돌려대는 사태가 벌어질지도.
    Lv.2 희귀한돌 (2005-07-14 15:09:49)
    좋은자료 감사합니다~
    Lv.3 러브파워 (2005-07-16 14:21:59)
    왠지 어려운듯 싸고 좋기만 하다면야
    Lv.2 즐거움이가득 (2005-07-18 12:46:15)
    비싸겠네요...
    Lv.2 ashine (2005-07-25 16:59:56)
    먼애기긴지.
    Lv.4 ass0707 (2005-09-03 02:03:03)
    좋다는 얘기긴 하네요~ ^^
    Lv.2 원선생 (2006-01-06 17:15:31)
    플스2 지금 뽕뽑는 그래픽을 생각하면서 플스3 말년을 생각하면... 오금이 저리네요 -_-;;;
    Lv.2 원선생 (2006-01-06 17:20:21)
    이것도 지금의 플스1 처럼 원칩화(!)되는 날이 오겠죠?
    Lv.4 OVA (2006-04-12 19:13:39)
    쉽게말해.. 저것땜시 너무 비싸진다!!! 라는걸지도;



    도배방지 : 0

    글쓰기 | 수정 | 삭제 | 목록   

     

    <<678910

    Copyright ⓒ FINALFANTASIA.COM All rights reserved.