معماري R600 در برابر G80
نكته كليدي كه در مقايسه دو معماري كه از نظر ساختار با يكديگر متفاوت هستند بايد در نظر گرفت اين است كه بايد ابتدا تعداد كارهايي كه هر يك از از آنها در يك سيكل كلاك انجام ميدهند را با همديگر مقايسه كرده و سپس با در نظر گرفتن اختلاف فركانس كلاك در دو معماري تعداد كارهايي كه در يك زمان واحد به سرانجام ميرسانند را ملاك ارزشيابي قرار داد.
G80 ميتواند Thread هاي بيشتري را در حالت ايدهآل به صورت موازي هم پردازش كند، 128 در مقايسه با 64 عدد Thread در هركلاك R600 با اين وجود در هر يك از اين 64 عدد Threadحدود 5 برابر كار بيشتري ميتواند صورت گيرد چرا كه R600 با بهرهگيري از دستورالعملهاي VLIW ميتواند حداكثر 5 عمليات را در هر Thread انجام دهد در حالي كه g80 به يك عمليات در هر Thread محدود شده است، اما با توجه به به معماري بسيار موازيسازي سازي شده و بهره گيري از دستورالعملهاي VLIW در R600 به سختي ميتوان فرض كردن كه Ultra-Threaded Dispatch Processor بتواند بلاكها را همواره در حداكثر كارايي نگه داشته و هيچ يك از SPهاي آن بيكار نباشند.

دیاگرام UDTP
در بهترين حالت R600 ميتواند 2.5 برابر بيشتر از G80 عمليات ساده محاسباتي انجام دهد ( 320 عمليات در مقايسه با 128 عمليات) اما در بدترين حالت زماني كه وابستگي ميان دادهها و عملياتها در كد برنامه سايه زن زياد باشد G80 حدود دو برابر قويتر از R600 در هر كلاك ظاهر ميشود ( 64 عمليات در R600 و 128 عمليات در G80).
تفاوت اصلي ساختار اين دو معماري در مكاني است كه قابليتهاي موازيسازي از كد برنامهسايه زن استخراج ميشود. هر دو معماري به بهرهگيري از چندين واحد SIMD نيازمند Threadهاي مستقل از هم هستند، NVIDIA در G80 به سختافزار روي آورده و به قابليتهاي موازيسازي كدبرنامه را با پيچيده كردن سختافزار و اعمال محدوديت به آرايههاي SIMD استخراج ميكند و AMD به نرمافزار روي آورده و با دستورالعملهاي سطح بالاي VLIW كه ذاتا شامل عملياتهاي مستقل از هم ميباشد، اين وظيفه را بر عهده كامپايلر قرار داده است. بنابر اين عملكرد معماري AMD بيشتر به نوع كد در حال اجرا وابستگي دارد.
حتي اگر ما حداكثر بهرهبرداري از معماري AMD را در بهترين حالت بپذيريم بازهم فركانس كلاك بالاي G80 مانع از برتري يافتن آن ميشود، همانطور كه شاره شد ، فركانس هسته سايهزنهاي متحد G80 دو برابر فركانس كاري آن يعني حدود 1.35 گيگاهرتز است
اين بررسي هنوز ناقص است و بخشهاي ديگري از اين دو معماري هنوز در نظر گرفته نشدهاند، چرا كه تنها هسته سايهزنهاي متحد در كارايي يك پردازنده گرافيكي نقش ندارد و عوامل كليدي ديگر نيز در معماري يك GPU وجود دارد كه ميتواند عملكرد خوب ساير واحدها را زير سوال برده يا موجب برتري آن نسبت به معماريهاي ديگر شود. بنابر اين در ادامه به ديگر واحدهاي R600 سرميزنيم.