상세 컨텐츠

본문 제목

차세대 업스케일링 그래픽 옵션 기능 비교 엔비디아 DLSS vs AMD FSR

게임 정보

by 뱀선생게임 2021. 10. 25. 08:03

본문

반응형

차세대 업스케일링 그래픽 옵션 기능 비교 엔비디아 DLSS vs AMD FSR

 

Nvidia DLSS(Deep Learning Super Sampling) 및 AMD FSR(FidelityFX Super Resolution)은 누가 최고의 그래픽 카드를 만드는지 논쟁의 일부인 두 가지 유사해 보이는 기술입니다. 몇 개월 동안 게임에 FSR을 통합하고 3년 넘게 게임 및 게임 엔진에서 DLSS 사용을 늘림으로써 이제 두 기술을 비교하는 방법에 대해 좀 더 자세히 설명할 준비가 되었습니다.


두 기술을 각각 지원하는 4개의 게임을 선택하여 두 기술을 직접 비교할 수 있습니다. 또한 각 게임에 대해 하나의 AMD와 하나의 Nvidia GPU에서 테스트했습니다. 이를 통해 서로 다른 렌더링 모드 간의 성능 스케일링을 비교하고 이미지 품질을 비교할 수 있습니다.


GPU 벤치마크에서 추적하지만 순수한 성능보다 더 중요한 것이 있습니다. 이미지 품질, 그리고 아마도 더 중요한 것은 높은 프레임 속도에 도달하면서 이미지 품질이 우리가 진정 원하는 것입니다. DLSS와 FSR은 매우 다른 방식으로 이 문제를 해결합니다. 비교 결과를 보기 전에 여기에서 간단히 다룰 것입니다.


엔비디아 DLSS 개요

Nvidia는 이미지 품질을 크게 저하시키지 않으면서 성능을 향상시키기 위해 DLSS를 만들었습니다. 그러나 Nvidia는 최신 게임을 저해상도에서 렌더링한 다음 업스케일할 수 있는 좋은 방법을 원했기 때문에 실시간 레이 트레이싱과 같은 것이 메인스트림급 하드웨어에서 더 실행 가능하기를 원했습니다. 이를 위해 Nvidia는 RTX 20 시리즈 GPU에 텐서 코어 하드웨어를 추가했으며 기본적으로 RTX 30 시리즈로 텐서 코어 성능을 두 배로 늘렸습니다.


Tensor 연산은 Nvidia가 발명한 것이 아닙니다. 머신 러닝 분야에서 얼마 동안 사용 및 논의되었기 때문입니다. 기본 아이디어는 인공 지능과 관련된 훈련 및 추론 프로세스를 더 잘 실행하기 위해 수많은 컴퓨팅과 결합된 충분한 정밀도를 가진 특수 목적 하드웨어를 만드는 것입니다.


RTX GPU는 FP16(16-bit 부동 소수점) 연산을 사용하며 RTX 20 시리즈의 각 텐서 코어는 64개의 개별 데이터 조각으로 작동할 수 있는 반면 RTX 30 시리즈 GPU는 128개의 데이터 청크에서 작동할 수 있습니다. RTX 30 시리즈는 또한 희소성을 지원합니다. 이는 기본적으로 하드웨어가 0으로 곱셈을 건너뛰고 성능을 효과적으로 두 배로 늘릴 수 있음을 의미합니다. 최종 결과는 RTX 2070은 FP16 컴퓨팅의 잠재적인 59.7 TFLOPS가 있는 반면 RTX 3070은 FP16 컴퓨팅의 잠재적인 163 TFLOPS입니다.


그 모든 계산 능력은 이전 프레임, 저해상도 현재 프레임, 저해상도 이미지를 더 높은 해상도에서 렌더링된 것처럼 보이게 하는 방법에 대해 훈련된 AI 네트워크의 입력을 사용하여 프레임을 확장하고 향상시키는 데 사용됩니다.


Nvidia는 4가지 DLSS 모드를 제공합니다. 품질 모드는 목표 해상도의 절반으로 렌더링하고, 균형은 목표 해상도의 1/3에서 렌더링하고, 성능은 해상도의 1/4을 사용하고, 울트라 성능은 최종 해상도의 1/9을 사용합니다. 또는 적어도 그것은 이론입니다. 실제로 게임은 렌더링된 해상도에 약간의 여유가 있는 것 같습니다.

 

https://youtu.be/I0OFB20yPC0

프레임이 올라가는 마법! 레데리2 DLSS 업데이트 Red Dead Redemption 2 NVIDIA DLSS 4K Launch Trailer




AMD FSR 개요

AMD의 FidelityFX Super Resolution은 훨씬 적은 계산 작업을 수반합니다. 프레임을 업스케일링하고 향상시키도록 설계된 후처리 알고리즘이지만 모든 딥 러닝 요소, 텐서 코어 및 방대한 양의 컴퓨팅이 없습니다. 기본적으로 공간 알고리즘(현재 프레임만 보기)을 사용하여 이미지를 업스케일한 다음 전체 모양을 개선하기 위해 일부 가장자리 감지 및 선명하게 하는 필터가 있습니다. 또는 세부 사항을 원하는 경우 가장자리 감지를 사용한 Lanczos 업스케일링입니다.


DLSS만큼 인상적이지는 않지만 FSR에는 몇 가지 중요한 이점이 있습니다. 가장 큰 것은 FSR이 비교적 최신 GPU에서 실행될 수 있다는 것입니다. Intel의 UHD 630, RX 500 시리즈까지 거슬러 올라가는 AMD GPU, GTX 900 시리즈의 Nvidia GPU에서 테스트했으며 모두에서 작동했습니다. 또한 FSR은 오픈 소스이므로 다른 사람들이 자유롭게 채택, 수정 등을 할 수 있습니다.


FSR 알고리즘은 기본적으로 모든 최신 GPU의 일부인 셰이더를 사용하여 무거운 작업을 수행합니다. DLSS와 마찬가지로 일반적으로 사용할 수 있는 4가지 모드가 있습니다: 초고화질, 품질, 균형 및 성능. AMD는 울트라 품질의 경우 1.3배, 품질의 경우 1.5배, 균형의 경우 1.7배, 성능의 경우 2.0의 다양한 배율을 사용합니다. 이러한 스케일링 요소는 수평 및 수직 차원 모두에 적용되므로 성능 모드는 결국 4배 업스케일링됩니다(Nvidia의 성능 모드와 동일).

 

테스트를 위해 Core i9-9900K CPU, 32GB RAM 및 2TB M.2 SSD와 함께 표준 GPU 테스트베드를 사용하고 있습니다. 우리는 Back 4 Blood에서 GeForce RTX 2060 및 Radeon RX 5600 XT를 사용했습니다. 4개의 게임 중 가장 요구사항이 적은 게임이고 해당 게임에서 약간 오래되고 성능이 떨어지는 GPU에서 성능 확장을 보고 싶었기 때문입니다. GeForce RTX 3060 및 Radeon RX 6700 XT로 테스트한 다른 게임입니다. 둘 다 12GB의 VRAM을 가지고 있어 일반적으로 VRAM 제한에 부딪히지 않도록 했습니다. 다른 세 게임도 레이 트레이싱을 지원하며 모든 테스트에서 활성화했습니다.


RX 6700 XT는 일반적으로 RTX 3060보다 성능이 우수하므로(GPU 벤치마크 계층에서 34%) AMD와 Nvidia 성능을 실제로 비교하는 것이 아니라 DLSS와 FSR이 성능에 미치는 영향을 살펴봅니다. 그러나 Nvidia의 GPU가 일반적으로 더 나은 RT 성능을 제공하기 때문에 레이 트레이싱을 사용하면 격차가 일부 좁혀집니다. 그리고 그건 제쳐두고 4경기의 결과를 봅시다.

Nvidia GPU만 DLSS를 지원하기 때문에 AMD 및 Nvidia 차트가 분리되어 있습니다. RTX 2060부터 초고성능 모드에서도 DLSS는 50% 미만의 성능 향상에 그쳤지만, 성능 모드의 FSR은 프레임 속도를 90% 이상 향상시켰습니다. DLSS의 업스케일링 계수가 높을수록 성능이 약 10% 향상되었으며 성능에서 초고성능 모드로 약간 더 크게 이동했습니다.


FSR의 경우 업스케일링할 때마다 RTX 2060에서 성능이 20% 가까이 향상되었습니다. 이전 세대 하드웨어를 사용하는 것이 성능이 얼마나 향상되었는지에 대한 요인일 수 있지만 일반적으로 Back 4 Blood는 매우 까다로운 게임이 아니었고 따라서 CPU 병목 현상이 요인이 될 수 있습니다.


다소 놀랍게도 RX 5600 XT는 RTX 2060에 비해 전체 스케일링이 약간 낮았습니다. 프레임 속도는 성능 모드를 사용하여 최대 87%까지 개선되었으며 RTX 2060에서 측정한 91%보다 약간 낮습니다. 대부분의 다른 수준 또한 두 GPU가 동일한 18% 개선된 초고화질 모드를 제외하고는 1-2% 개선이 적습니다.

https://youtu.be/SOe9hQRwxpw

소니 X 엔비디아 4K DLSS PC판 갓오브워 출시 확정~!! God of War – PC Announce Trailer

 

 

DLSS vs FSR, 결론

확실한 승자를 보고 싶다면 너무 많은 요인이 작용하고 있습니다. DLSS는 특히 더 높은 업스케일링 요소에서 기본에 가까운 품질의 이미지를 더 많이 생성할 수 있는 것으로 보이지만 훨씬 더 많은 계산 능력이 필요하고 때때로 성능이 원하는 만큼 향상되지 않습니다. 더 중요한 것은 RTX 전용 기술이 아니라 Nvidia 전용 기술이라는 것입니다. GTX 카드를 사용하는 모든 Nvidia 사용자는 운이 좋지 않으며 AMD 카드 소유자와 Intel GPU 사용자도 마찬가지입니다.


FSR은 특히 더 높은 업스케일링 모드에서 이미지 품질 매치업에서 승리하지 못하지만 4K에서 실행 중이고 울트라 품질 또는 품질 모드를 사용하면 성능이 향상되고 몇 가지 세부 사항을 놓치지 않을 것입니다. 셔플에서 길을 잃은 것입니다. 그러나 FSR 성능 모드는 꽤 나빠 보일 수 있습니다. 사실, 나는 FSR 성능 모드를 사용하는 것보다 1080p에서 게임을 실행하고 내 모니터가 4K로 확장하도록 하는 것을 선호합니다. 마찬가지로 균형 모드는 성능 향상이 절실히 필요한 경우에만 사용해야 합니다.


이 토론에서 와일드카드는 Intel의 곧 출시될 XeSS입니다. DLSS와 매우 흡사하며 DLSS를 설계하는 데 도움을 준 사람 중 한 명이 Nvidia를 떠나 Intel에서 일하게 되었습니다. Intel, AMD 또는 Nvidia와 같은 대부분의 최신 GPU에서 작동할 것으로 예상되지만 얼마나 잘 작동하는지 알 수 없습니다. Arc용으로 Intel 버전의 텐서 코어를 사용하고 다른 GPU용으로 DP4a 계산으로 대체합니다. 또한 좋은 업스케일링 알고리즘을 만드는 것은 게임 개발자가 이를 채택하는 것과 같지 않습니다.


우리는 또한 몇 년 동안 꽤 많은 게임들이 사용해온 전통적인 형태의 업스케일링을 하지 않았습니다. 성능을 몇 퍼센트 떨어뜨리는 시간적 또는 공간적 업스케일링 기술이 존재하며 많은 게임에는 모니터 재생 빈도를 목표로 하는 동적 스케일링도 있고 게임이 즉석에서 해상도를 조정합니다. 완전히 똑같아 보이지는 않지만 눈치채지 못하거나 신경 쓰지 않는 경우가 많습니다.


채택률 면에서 Nvidia DLSS는 오랜 시간 선두를 달리고 있기 때문에 여전히 AMD FSR을 앞서고 있습니다. AMD FSR은 현재 최소 27개 게임에서 발표되거나 출시되었으며 Nvidia DLSS는 현재 최소 119개 게임에서 사용할 수 있습니다(Nvidia의 DLSS 목록에 있는 많은 게임이 덜 알려진 인디 게임이지만). Unreal Engine과 Unity가 모두 현재 DLSS와 FSR을 지원하므로 앞으로 두 기술을 통합하는 더 많은 게임을 볼 수 있을 것으로 예상합니다. 어쩌면 XeSS도 마찬가지일 것입니다.


궁극적으로 게임과 게임 개발자는 이제 여러 가지 선택을 할 수 있으며 이는 좋은 일입니다. 여기에서 볼 수 있듯이 기술 중 하나를 채택한다고 해서 다른 기술을 지원할 수 있는 것은 아닙니다. 시간이 지남에 따라 두 알고리즘 모두에서 지속적으로 개선되기를 희망하며 앞으로 계속 모니터링할 것입니다.

 

출처 : https://www.tomshardware.com/features/amd-fsr-vs-nvidia-dlss

반응형

관련글 더보기

댓글 영역