Ét problem i denne arkitektur kan være en forhøjet latency, men ATI mener selv at have løst dette. Hver station rundt i ringen har sin egen cache og den cache er (som ATI kalder det) "fully associative", hvilket betyder at data kan skrives vilkårligt til og fra cache'en. Tidligere var cache'ens data-struktur "direct mapped", hvilket betød at data 1 skulle tages fra cache 1, data 2 fra cache 2, osv. Med den nye arkitektur kan data 1 hentes hvor i cache'en den nu ligger placeret, hvilket kraftigt forbedrer cache-ydelsen. ATI siger selv at man skal regne med 5 - 30% forbedret cache-ydelse i X1800 set i forhold til X850.
ATI har valgt nogenlunde samme arkitektur i de tre nye chips. Først og fremmest har man ladet hver shader-enhed få betegnelsen Shader Processor. Selve data-strømmen er også ændret således at man udnytter VPU'en maksimalt.
Data kommer først til én af de otte (for R520 VPU'en) Vertex Shader processorer. Herfra sendes den til ATI's nyudviklede "Ultra-Threading Dispatch Processor", der opdeler data i 512 "threads". Dette sker netop for fuldt at udnytte den nye 512-bit Ring Bus.
Herfra sendes data til én af de fire (igen for R520 VPU'en) Pixel Shader cores. ATI kalder disse for Quad Pixel Shader cores, men teknisk set er det ikke meget anderledes end på R4xx VPU'erne. Man samler blot fire Pixel Shader processorer og har som noget nyt givet hver Pixel Shader processor en Branch Execution Unit, der vil hjælpe til at aflaste resten af VPU'en ALU'er.
Generelt har ATI's mål med den nye arkitektur været at sørge for at alt i VPU'en har instruktioner at arbejde med. Det har været vigtigt at minimere idle-tiden internt og få maksimal ydelse hele tiden.
Indtil videre ser idéen bag ganske fornuftig ud og det er en god grundidé. Ydermere er selve arkitekturen i høj grad modul-baseret, hvilket gør designet nemmere at arbejde med. Både med hensyn til afarter af eksisterende produkter, men også med hensyn til fremtidige løsninger, hvor ATI kan optimere hvert modul for sig.
Når man ser opbygningen af X1800, X1600 og X1300, ser man tydeligt den omtalte modulare struktur.
Et kig i tabellen over de tre nye produkter viser også fordelene ved denne opbygning - man benytter samme arkitektur, hvilket gør det nemmere for software-udviklere at skrive kode, der kan afvikles på samme måde i alle tre VPU'er. Ikke med samme hastighed, naturligvis, men der behøves ikke specifik hensyntagen til hver enkelt VPU-design.