بررسي معماري R600
اگر بخواهيم جزئيات و پيچيدگيهاي معماري را كنار گذاشته و به صورت كلي به پردازنده گرافيكي R600 نگاه كنيم، قابليتهاي مشابه با آنچه در G80 وجود دارد يافت ميكنيم. چرا كه بخشهاي اصلي خطلوله گرافيكي در هر دو GPU بر روي يك نوع سختافزار متحد اجرا شده و فرايند مشابهي جهت توليد تصوير نهايي وجود دارد : ابتدا دادههاي خام وارد GPU ميشوند، تنظيمات لازم جهت پردازش آنها در واحد Setup انجام ميشود سپس برنامههاي سايهزن بر روي آنها اجرا شده و نتيجه براي مرحله بعدي پردازش در Texture Memory ذخيره شده يا در Frame Buffer رندر ميشود.
ملزومات DirectX 10 بسيار پايه و واحد هستند به همينخاطر در پشتيباني از DirectX 10 و فراهم كردن ملزومات آن ميان R600 و G80 تشابهات زيادي وجود دارد، بنابراين رقابت AMD و NVIDIA در ارائه ويژگيهايي فراتر از ملزومات DirectX 10 ميباشد. در تصوير شماره 3 چينش كلي (Layout) واحدهاي اصلي داخل R600 را مشاهده ميكنيد:

تصوير شماره 3 چينش داخلي R600
در نگاه اول تعداد بسيار زياد پردازندههاي جرياني (Stream Processor) قابل توجه است، 320 پردازنده جرياني )كه در ادامه به آنها SP ميگوييم) اين پردازندهها اندكي با SPهايي كه NVIDIA در G80 به كاربرده متفاوت هستند كه در اين مقاله اين تفاوتها را كاملا روشن خواهيم كرد، برخلاف G80كه در آن تعداد كمتري SP در گروههاي هشتتايي دسته بندي شدهاند همانطور كه در تصوير شماره 3 ميبينيد، R600 تعداد بسيار بيشتري SP دارد كه در گروههاي پنجتايي دستهبندي شدهاند هر يك از اين گروهها به واحد بافتگذاري (Texture Unit) اختصاصي خود متصل است و به صورت اشتراكي با واحد استخراج سايهزن (Shader Export) و حافظه كاشه خواندن و نوشتن محلي در ارتباط است.
R600 با فنآوري ساخت 80 نانومتري توسط كارخانجات TSMC ساخته ميشود و حدود 720 ميليون ترانزيستور دارد در حالي كه G80 با فنآوري ساخت 90 نانومتري حدود 680 ميليون ترانزيستور دارد. ساير مدلهاي R6xx نيز با فنآوري ساخت 65 نانومتر طراحي و ساخته ميشوند
فركانس هسته R600 حدود 740 مگاهرتز است و حافظه آن با فركانس 825 مگاهرتز كار ميكند، دليل بهره گيري از حافظه كند در كارت گرافيك Radeon HD 2900XT اين است كه R600 با اينترفيس حافظه 512 بيتي عرضه ميشود كه پهناي باند لازم را بدون نياز به حافظههاي پرسرعت تامين ميكند، پيش از اين در مقاله «كارتگرافيكهاي عقيم شده» به تفصيل در رابطه با اينترفيس حافظه و نحوه محاسبه پهناي باند حافظه كارت گرافيكها بحث كردهايم.
ديگر ويژگيهاي متمايز كننده R600 در كنار به كارگيري واحد Tessellation بهرهگيري از يك پردازندهصوتي در داخل سختافزار خود است، اين پردازنده جريانهاي صوتي را پذيرفته و آنها را به پورت DVI كارتگرافيك ميفرستد تا توسط يك مبدل ويژه به همراه تصوير، خروجي HDMI كامل را ارائه كند، (تصوير شماره 4).

تصوير شماره 4 نمايي از كارت گرافيك Radeon HD 2900XT با مبدل خروجي HDMI
R600 همچنين داراي يك موتور DMA مستقل است كه ميتواند تبادل دادهها ميان GPU و حافظه اصلي كامپيوتر را بر روي گذرگاه PCI Express و كانالهاي حافظه محلي مديريت كند. پيش از اين توسعهدهندگان برنامههاي GPGPU كه از GPU به عنوان يك كمك پردازنده محاسباتي استفاده ميكردند از تاخير بازخواني دادهها از حافظه كارتگرافيك گلايهمند بودند چرا كه DMA طرحي شده داخل مادربرد تنها در ارسال دادهها از حافظه اصلي به كارتگرافيك كاربرد داشت و در مسير بازگشت هيچ راهكاري براي دور زدن FSB و CPU وجود نداشت.
توضيحات مختصر و كلي ارائه شده در اين صفحه براي جذب علاقه شما به جزئيات معماري R600 بودند اما براي تجزيه تحليل بيشتر معماري آن نياز داريم تا يك سري مفاهيم پايه در رابطه با SPها، SIMD و VLIW مطرح كنيم، بنابر در چند صفحه بعدي كمي از R600 فاصله گرفته و وارد مباني معماري كامپيوتر خواهيم شد تا با ديد روشنتري به ساختار معماري R600 بپردازيم.