گیمرها زیرآفتاب انویدیا بازی را نیمهکاره رها کرد
گیمرها زیرآفتاب
انریکو فرمی اگر میدانست روزی قرار است نامش را روی محصول جدید انویدیا بگذارند شاید هیچ وقت سراغ فیزیک نمیرفت که کارش به تولید راکتور اتمی برسد. مقدمه دردناکی برای انویدیا است و حرف من هم نیست. انویدیا این مدلها را که اصلیترین ویژگی آنها پشتیبانی از رابط دایرکت ایکس نسخه یازدهم است خیلی دیر منتشر کرد. محصولاتی که پرمصرف، به شدت داغ، گران ولی حرفهای هستند. اما باید این حرکت را جهشی رو به جلو برای انویدیا دانست که سرانجام با تغییر مهندسی تراشههای گرافیکی وارد عصر جدید نمایش سه بعدی شد. در واقع این شرکت بعد از سری 8000 که در سال 2006 تولید شد از یک معماری برای مدلهای مختلف استفاده میکرد و در سریهای بعدی مثل نسل GT200 این معماری تنها اصلاح میشد و ارتقا پیدا میکرد اما با ورود فرمی (Fermi) این معماری به کلی تغییر داده شد. نسل جدیدی که انویدیا تراشههای خود را بر اساس آن تولید میکند GF100 نام دارد.
قبل از پرداختن به معایب مدل جدید انویدیا که اتفاقا تعدادشان کم هم نیستند فقط یک نکته را در نظر داشته باشید و اینکه این کارتها در حال حاضر سریعترین کارتهای گرافیکی جهان هستند و توانستهاند در رقابت با HD5870 آن را مغلوب کنند. حالا میتوانیم بگوییم این کارایی در قبال چه هزینهای به دست آمده است.
eVGA GTX 480 v.s. ZOTAC GTX 480
کارتهای رده حرفهای همه مثل هم هستند. تفاوتی میان آنها نیست و تنها برچسب روی کارت و بستهبندی آنها با یکدیگر متفاوت است. این روش علاوه بر اینکه در این مدلها استفاده شده قبلا نیز در مورد کارتهای HD5870 و HD5970 و یا مدلهای GTX285 به کار رفته بود. بنابراین بین برندها نمیتوان اختلافی گذاشت و با توجه به اینکه اعتبار یک برند چقدر است یا چه شرکتی از آن پشتیبانی میکند میتوان بین قیمتها اختلاف قائل شد. پس تا اینجا از نظر فنی تفاوت قابل توجهی بین مدلهای مختلف نیست و کاراییها نیز همانطور که در جدولها آمده مشابه یکدیگر است.
با این حال این بررسی را میتوانید برای مشاهده تفاوت بین HD5870 به عنوان مدل مطرح تک هستهای از ATI و GTX480 به عنوان جدیدترین مدل از انویدیا بخوانید.
زوتاک یکی دو سال پیش کمی در بازار ایران حرکت کرد و بعد از آن هم کمتر در بازار دیده شد. اما این بار زوتاک با آواژنگ شروع کرده تا در کنار گیگابایت و لیدتک در بازار رقابت کند.
با نگاهی به شبکه فروش آواژنگ و خدمات آن میتوان پیشبینی کرد که سیستمهای زیادی از این پس میزبان این برند خواهند بود. این کارت گرافیکی مشخصاتی مشابه با سیستم مرجع دارد و در تصویر مشخصات نیز میتوانید آن را ببینید. فرکانس هسته 700 مگاهرتز، فرکانس واحد سایه زنی 1401 مگاهرتز و ظرفیت رم نیز 1536 مگابایت است.
کارت دیگری که در این شماره بررسی شد مدل GTX 480 از برند eVGA بود. این برند مقام اول فروش را در آمریکا برعهده دارد و تمام اعتبار خود را از بخش کارتهای گرافیکی به دست آورده هرچند که مادربوردهای حرفهای نیز در میان محصولات این برند دیده میشوند. eVGA هم در بازار ایران نوسان زیادی را پشت سر گذاشته مخصوصا تا یکی دو سال پیش که فروش آن بسیار پايین بود و محدود به چند فروشگاه خاص میشد. در یکی دو سال گذشته شرکت فارِس (FARESS) پشتیبانی از این برند را برعهده گرفته است. این کارت نیز بر اساس مدل مرجع تولید شده با این حال eVGA نمونههای دیگری نیز از همین تراشه دارد که مدلهای اورکلاک شده هستند و فرکانس آنها اندکی نسبت به مدل مرجع بالاتر است.
GeForce GTX 480
جیفورس 480 یکی از دو مدل نهایی انویدیا برای پشتیبانی از رابط دایرکت ایکس 11 در رده حرفهای است که به تازگی وارد بازار شده است. این تراشه گرافیکی دارای 480 پردازنده استریم یا همان پردازنده کودا است و از رابط 384 بیت برای حافظه استفاده میکند. در بخش معرفی تراشههای مبتنی بر معماری GF100 اشاره کردم که در طراحی این تراشهها امکان استفاده از 512 پردازنده استریم فراهم شده است که در 16 خوشه(کلاستر) طبقهبندی میشوند و هر یک از آنها دارای 32 پردازنده هستند.
اما در این کارت میبینیم که از 480 پردازنده استفاده شده و این به معنی غیرفعال شدن یکی از کلاسترها است. انویدیا در تراشههای مدل GTX480 یکی از کلاسترها را غیرفعال کرده و در مدلهای GTX470 دو کلاستر با 64پردازنده غیرفعال شدهاند که در نتیجه در این مدلها تعداد پردازندههای استریم به 448 عدد میرسد.
به نظر میرسد این حرکت انویدیا به دلیل اهداف بازاریابی باشد و همان اتفاقی که قبلا در مورد GTX260 افتاد این بار هم تکرار شود. انویدیا زمانی که نسل دوم این تراشهها را وارد بازار کرد تعداد پردازندههای استریم آنها را تا 216 عدد افزایش داد.
تراشههای GTX 480 روی کارتهای گرافیکی با مدار چاپی هشت لایه نصب میشوند و در کنار آنها حافظههای GDDR5 قرار دارد. انویدیا تمام کارتهایی که با تراشههای نسل GT200 تولید میشدند را به همراه حافظههای GDDR3 ارایه کرد اما در این سری سرانجام ناگزیر از نسل پنجم حافظههای گرافیکی بود. درGTX 480 شش کنترلر وظیفه ارتباط با رم گرافیکی را برعهده دارند و هر یک میتوانند 256مگابایت حافظه را کنترل کنند بنابراین ظرفیت رم گرافیکی در این کارتها 1536 مگابایت است. در مدلهای GTX 470 از پنج کنترلر حافظه استفاده شده که ظرفیت کارت را به 1280 مگابایت میرساند ضمن اینکه بهرغم استفاده از رابط 384 بیتی در مدل 480، انویدیا ترجیح داده یک رابط 320 بیتی را برای مدل 470 انتخاب کند. هرکدام از این کنترلرها یک رابط 64 بیتی را برای حافظه فراهم میکنند و فرکانس حافظه نیز 924 مگاهرتز است. البته به دلیل استفاده از حافظههای GDDR5 و نرخ انتقال اطلاعات آنها این مقدار چهار برابر شده و به فرکانس موثر 3696 مگاهرتز میرسد.
تراشههای GTX480 در فرکانس 700 مگاهرتز اجرا میشوند و فرکانس واحد سایهزنی آنها نیز 1400 مگاهرتز است. در مورد واحدهای پردازش بافتی و پیکسلی هم میتوان گفت GTX480 دارای 48 واحد ROP است که روی عملیاتهایی مثل ترکیب پیکسلها و تصحیح سطوح و لبهها موثر هستند. در بخش پردازش بافتی 60 واحدپردازشی وجود دارنـد کـه حـاصل چهار بخش بافتی در هر یک از SMها است.
فناوری ساخت 40 نانومتری اولین بار در کارتهای ارزان قیمت GT220 مورد امتحان قرار گرفت و بعدها نیز در مدلهای باقی مانده از رده GT200 استفاده شد. این فناوری ساخت، امکان فشردگی بیشتر در سطح پردازنده را فراهم میکند که نتیجه آن برای این تراشه حضور سه میلیارد ترانزیستور در یک سطح است. به طور معمول با کاهش فناوری ساخت میزان مصرف انرژی کم می شود و گرمای پایینتری هم تولید میشود اما در این تراشه کاملا موضوع برعکس شده است. این کارت 250 وات انرژی مصرف میکند که برای یک کارت گرافیکی واقعا رقم بالایی است و به همان اندازه نیز دمای کارت بالا است. حرارت کارت به حدی بالا است که روی جعبه نوشته شده هنگام خروج کارت پس از اجرا حداقل دو دقیقه برای خنک شدن کارت زمان لازم است. این اخطار برای جلوگیری از خطراتی مثل سوختگی اعلام شده و به اندازه کافی گویا است.
NVIDIA 3D Surround
انویدیا سرانجام فناوری نمایش تصویر در چند مانیتور را همزمان با ورود سری GTX400 ارايه کرد. در این فناوری میتوان سه مانیتور را در کنار یکدیگر قرار داد و از خروجی کارت گرافیکی برای مدیریت هر سه مانیتور استفاده کرد. به هر حال آنچه مسلم است این فناوری در رقابت با Eyefinity در کارتهای جدید ATI تولید شده ولی همین امکان پخش تصاویر روی سه مانیتور میتواند چالش انویدیا در مقابله با ATI را کاهش دهد. در این روش باید از دو کارت گرافیکی استفاده کرد و نکته مهم اینکه برای کارتهای حرفهای سری GT200 نیز قابل اجرا است. تنها باید درایور کارتهای گرافیکی قبلی را ارتقا داد. 3D Surround علاوه بر اجرای بازیها روی 3 مانیتور در محیطهای دو بعدی نیز کاربرد دارد.
GF100
در ساختار تراشههای جدید انویدیا نکات جالبی دیده میشود. این تراشهها دارای 512 پردازنده جریانی (stream processors) هستند. البته انویدیا نام این پردازندهها را هسته کودا (CUDA) گذاشته است. هستههای کودا در بلوکهایی 32تایی جای میگیرند که به آنها SM گفته میشود و چهار گروه از این SMها در یک خوشه پردازشی (کلاستر) ردیف میشوند. به این خوشه GPC گفته میشود. در نهایت چهار GPC یک تراشه با معماری GF100 را تشکیل میدهند. در طراحی این پردازنده گرافیکی میتوانید این چهار واحد را ببینید که دو واحد در بالا و دو واحد نیز در پایین تراشه قرار گرفتهاند و بین آنها را حافظه L2 پر کرده است. این حافظه به صورت 48 واحد در میان تراشه قرار گرفته و ردهبندی آنها به صورت شش بخش است که در هر کدام از آنها هشت حافظه استفاده شده است. در اطراف تراشه نیز شش واحد کنترل حافظه دیده میشوند. 16 واحد SM در میان چهار واحد GPC مشخص هستند. این SMها میتوانند در هر چرخه فرکانس 512 دستورالعمل را اجرا کنند. در انتهای ساختار SM چهار واحد پردازش بافتی نیز قرار داده شده و علاوه بر آن در هر SM یک واحد پردازش هندسی نیز وجود دارد که مجموع آنها به 16 واحد میرسد. انویدیا نام این قسمت را موتور پلیمورف یا موتور چندشکلی گذاشته است. موتورPolyMorph و موتور پیکسلی Raster دو بخش مهم اجرایی در ساختار فرمی هستند که در واقع یکی از تفاوتهای مهم این کارتها با نسلهای پیشین ناشی از این دو قسمت است. موتور Raster ترکیبی از تمام روشهای پیشین برای پردازش تصویر است که شامل تنظیم لبهها و سهضلعیها، تبدیل تصاویر به بیتمپ یا نقشههای بیتی و تبدیل نقشههای دوبعدی به تصاویر سه بعدی است. این واحد در تراشههایی که دارای معماری GF100 هستند میتواند در هر چرخه فرکانس تا 32 پیکسل را پردازش کند. موتور پلیمورف که انویدیا آن را برای پردازشهای هندسی اختصاص داده است، چندین فعالیت اصلی را در کارتهای گرافیکی انجام میدهد که موارد زیر از نمونههای این وظایف است:
Vertex Fetch: در تصاویری مثل سطح آب یا آتش با وجود اینکه با یک بافت سطحی روبهرو هستیم اما این بافت ثابت نیست و حرکت دارد. به عنوان مثال امواج بسیار کوچک سطح آب یا زبانههای شعله آتش اگر به صورت بافت پردازش شوند نتیجه یک تصویر صاف و بدون جزيیات خواهد بود. موتور پلیمورف پردازش این سطوح را انجام میدهد که تاثیر زیادی در کیفیت تصویر دارد.
Tessellation: تصاویر سه بعدی از چندضلعیها تشکیل شدهاند و با کمک Tessellation یا موزايیککاری، این چندضلعیها در یک ساختار مناسب کنار هم قرار میگیرند و آماده پردازش میشوند. دلیل این امر هم پیچیدگیهایی است که برای پردازش مستقیم تصویر وجود دارد و کارتهای گرافیکی با تقسیم یک سطح به چندضلعیها کار پردازش را آسانتر میکنند. با این حال جزيیات ظریفی که در برخی اجسام مانند صورت انسان وجود دارد نیاز به توان قابلتوجهی از سوی کارت گرافیکی دارد.
Viewport Transform: تصاویر در بازیها و نمایشهای سهبعدی همیشه تولید نمیشوند و اغلب از تصاویر از پیش طراحی شده برای نمای سهبعدی استفاده میشود که این شبهعکسها با قرار گرفتن در کنار یکدیگر تصویر نهایی را خلق میکنند. در پردازشهای گرافیکی موضوع جایگیری و چیدمان این تصاویر مهم است و این بخش توسط Viewport مدیریت میشود.
موتورهای Raster در یک تراشه با مهندسی GF100 چهار عدد هستند یعنی برای هر GPC یک موتور Raster در نظر گرفته شده در حالیکه موتورهای پلیمورف در هر GPC چهار عدد هستند و مجموع آنها در یک تراشه به 16 عدد میرسد. ضمنا باید توجه داشت که بسیاری از این امکانات برای این تراشه یا این کارتهای گرافیکی انحصاری نیست بلکه مجموعهای از تواناییهای فراهم شده توسط نسخه یازدهم دایرکتایکس است که کارتهای مختلف توان متفاوتی در اجرای آنها دارند. قبلا در تراشههای نسل GT200 از یک موتور Raster بزرگ استفاده میشد. به کارگیری 16 موتور پلیمورف به این معنی است که امکان پردازش موازی در این حالت بیشتر است و البته باید توجه داشت مدیریت این دادهها به صورت موازی که در کانال اطلاعات قرار دارند کار آسانی نیست. GF100 علاوه براین موارد تکههای مختلف و اجزای کوچک تصویر را نیز بررسی میکند و در صورت لزوم آنها را به تکههای کوچکتر تبدیل خواهد کرد تا توسط چند SM به صورت همزمان پردازش شوند. در این حالت اطلاعات مرتبط با داده در حال پردازش درون هستهباقی میماند و از طریق حافظه سطح L1 در میان SMها جابهجا میشون