نقد و بررسی تخصصی انویدیا GeForce GTX 480
کارت گرافیک GTX 480 حدود سه ماه پیش توسط شرکت Nvidia معرفی شده و مدت زیادی از ورود آن به بازار نمی گذرد. این شرکت برای رقابت با چیپ 5970 شرکت ATI، این کارت گرافیک را عرضه کرده است. اینجا داریم در مورد کارت گرافیک قدرتمندی صحبت میکنیم که سه میلیارد ترانزیستور دارد پس نباید چیزی از قلم بیافتد. بنابراین تمام کوشش خود را به کار گرفتیم تا بتوانیم این کارت را مو به مو بررسی کنیم. اگر دنبال بررسی تخصصی آن هستید، این مطلب برای شما است.
در چند ماه گذشته خبر های مختلفی در مورد این کارت به بیرون درز کرد که بعضی از آنها خوب و امیدوار کننده و برخی دیگر نا امید کننده بودند. همانطور که گفته شد انویدیا کاملا دیر تولید چیپ های مبتنی بر DirectX 11 را آغاز کرد و در همین فرصت رقیب Nvidia یعنی ATI توانست گزینه های زیادی از قدرت و قیمت را در اختیار کاربران بگذارد که از 100 دلار تا 700 دلار متغیر بود. شاید انویدیا در عرضه کارت های کلاس DX11 دیر کرده باشد، اما شروع این کار با به نمایش گذاشتن محصولاتی قدرتمند و سریع برای رقابت همراه بوده است. مدتی زیادی نیست که Nvidia رسما اقدام به پرده برداری از محصول جدیدش کرده، بنابراین ما فرصت را غنیمت شمردیم تا به تست این کارت به همراه نسل های دیگر GeForce و سری 5800 و 5900 بپردازیم.
در جدول بالا می توانید مشخصات هر دو چیپ GTX470 و GTX480 را مشاهده نمایید. هر دو چیپ دارای 4 کلاستر (گروه) پردازش گرافیکی است و تعداد پردازنده های جریانی چندگانه این کارت به ترتیب به 14 و 15 عدد می رسد. تعداد هسته های CUDA نیز به ترتیب به 448 و 480 عدد می رسد (CUDA نام واحد های پردازشی ای هستند که چندی پیش توسط Nvidia ابداع شدند و توانستند که جای پردازنده های جریانی را تا حد زیادی پر کنند) در این کارت ها به ترتیب 56 و 60 واحد پردازش متریال و تکسچر نیز قرار دارند. با توجه به این اعداد و ارقام، کارت GTX 480 از نظر عملکرد پردازشی نسبتا قوی تر از GTX470 می باشد. اما در مورد سرعت پردازش، فرکانس کل بخش پردازش گرافیکی چیپ GTX 480 برابر با 700 مگاهرتز می باشد و فرکانس هسته های CUDA برابر با 1401 مگاهرتز است. فرکانس واقعی حافظه برابر با 924 مگاهرتز است و فرکانس موثر آن به 3696 مگاهرتز می رسد.
حجم حافظه نیز برابر با 1536 مگا بایت و اینترفیس آن برابر با 384 بیت است که البته چیپ های قبلی از 448 بیت اینترفیس بهره می بردند. پهنای باند حافظه نیز به 177.4 گیگابایت در ثانیه می رسد این چیپ از طراحی 40 نانو متری بهره می برد.
پورت های خروجی پشتیبانی شده توسط این چیپ عبارتند از 2 پورت Dual-link DVI-I و یک پورت mini HDMI با این تفاسیر این کارت در بخش حافظه و پورت های خروجی ضعیف تر از کارت های رقیب شرکت ATI (سری 5800 و سری 5900) میباشد. کانکتور های این کارت کمی عجیب به نظر می رسند. اگر چه GTX 470 از دو کانکتور شش پین استفاده می کند اما GTX 480 از ترکیب نامتداول 1 کانکتور 8 پین و 1 کانکتور 6 پین بهره میبرد! آستانه دمای چیپ هم به 105 درجه سانتی گراد می رسد.
اما شرکت Nvidia از یک جهت توانسته اعداد و ارقام فرکانس حافظه را به ATI نزدیک تر کند و آن استفاده از حافظه های GDDR5 می باشد که پس از مدت زیادی انتظار، سرانجام از سوی Nvidia نیز به کار گرفته شد. اما اکنون وقت آن رسیده که به چند عکس از ظاهر این کارت (اولین کارت GTX 480 از سوی Nvidia) نگاهی بیاندازیم.
سیستم خنک سازی کارت به خوبی طراحی شده است و از Heat-pipeهای بزرگی برای دفع گرما بهره می برد.
مشخصات معماری
این چیپ از معماری Fermi استفاده میکند. (Enrico Fermi نام یک فیزیک دان برجسته است که برای اولین بار موفق به کشف سلسله مراتبی هسته ای شد. او برنده جایزه نوبل فیزیک در سال 1938 می باشد) شاید Nvidia به این دلیل از نام Fermi استفاده کرده که چیپ هایش برای پردازش از سلسله مراتب خاصی استفاده می کنند به هر حال Nvidia معمولا نام های جالبی را برای فناوری های خود انتخاب می کند.
چیپ GTX 480 از بیش از 3 میلیارد ترانزیستور در قالب معماری 40 نانومتری سود میبرد. در حالی که رقیب اصلی این چیپ یعنی Radeon HD 5870 از حدود دو میلیارد و پانزده میلیون ترانزیستور استفاده میکند. معماری 40 نانومتری فِرمی توانسته این چیپ را به 480 CUDA Cores مجهز نماید. یعنی بیش از دوبرابر تعدادی که در سری GT200 استفاده می شد. این تعداد به GTX 480 کمک می کنند که با قدرت گرافیکی بسیار بیشتر خود در راس قوی ترین ها قرار گیرد!
همچنین، فِرمی اولین GPU با قابلیت پشتیبانی از ECC خواهد بود. ECC به GPU این امکان را میدهد که نرخ خطا های نرم افزاری (SER: Soft Error Rate) را با تصحیح کردن آنها کاهش دهد. این خطا ها باعث می شوند که قسمت مخصوص ثبت اطلاعات حاشیه ای مدار های مجتمع (IC) نسبتا بزرگ و با اهمیت، مشکلاتی به وجود آید که میتواند سرعت پردازش را کاهش دهد. پس استفاده از ECC باعث عملکرد و پایداری بهتر نیز می شود. همچنین این GPU کد های C++ را به طور مستقیم اجرا خواهد کرد.
به نظر میرسد Nvidia قصد دارد معماری Fermi GF100 را جایگزین نسل های قبلی معماری خود نماید. همانطور که در تصویر Diagram معماری GTX 480 مشاهده میکنید، در این چیپ 4 عدد GPC(Graphic processing Cluster) (گروه پردازش گرافیکی) قرار دارند و در این طراحی جدید هر GPC از چهار موتور پردازش اَشکال بهره می برد.
وجود این تعداد موتور در هر یک از بخش های این چیپ به GPC ها اجازه می دهد که هر یک به عنوان یک GPU (Graphic Processing Unit) کامل فعالیت کنند.
یعنی GTX 480 را می توان یک GPU چهار هسته ای نامید این طراحی همچنین باعث شده که GTX 480 بتواند هندسه اجسام را راحت تر از قبل پردازش کند و مقیاس پذیری آن در سرتاسر انجام عمل پردازش هندسه اجسام بیشتر شود.
بنابر ادعای Nvidia آخرین نتایج به دست آمده ، حکایت از این موضوع دارد که پردازش هندسه اجسام، در معماری Fermi GF100 ، نسبت به معماری GT200 ، 8 برابر بهبود یافته است . پردازش سگمنت ها نیز در این GPU نیز بهتر شده و مقیاس پذیری بالاتری دارد.
در هر GPU Fermi GF100 ظرفیت گنجاندن 512 CUDA Cores ، 16 واحد پردازش هندسه اجسام، 4 موتور موقعیت دهی تصویر (raster Engine) و پشتیبانی حافظه GDDR5 با اینترفیس 384 بیت نیز صورت می گیرد. با این حال در GTX 480 فقط 480 CUDA Cores وجود دارد ولی بقیه مشخصات دقیقا همان چیزی است که در بالا ذکر شده.
سوالی که در ذهن بعضی پیش می آید این است که چرا GTX 480 از اینترفیس حافظه 384 بیتی استفاده میکند، درحالی که سری GT200 از اینترفیس 448 بیتی بهره مند بودند؟ در پاسخ باید گفت که با توجه به حافظه GDDR 5 این کارت، مقدار موثر (Effective) فرکانس حافظه و پهنای باند بسیار بیشتر شده است و عملا نیازی به استفاده از اینترفیس 448 بیتی احساس نمی شود.
هر موتور SM(Streaming Multiprocessor) از بخش هایی که در تصویر می بینید تشکیل شده است:
در هر SM ، 32 عدد CUDA Core وجود دارد که از این قسمت ها تشکیل شده است:
اطلاعات وارد حافظه نهان دستورالعمل ها می شوند و سپس در بخش Warp Scheduler، زمان بندی مشخصی برای هر یک از اجزای پردازشی صورت می گیرد. در ادامه اطلاعات وارد Dispatch Unit می شوند و عملکرد هر یک از اجزا تعیین می شود و سپس یک فایل اطلاعات مورد نیاز برای پردازش را در خود نگه می دارد و آنها را به CUDA Coreها اعمال می کند. اطلاعات در CUDA Coreها، ابتدا وارد Dispatch Port می شود و بدین وسیله عملی که از CUDA Core می خواهیم مشخص می شود سپس عملوندها (تعیین کننده های روش عملکرد CUDA Core) جمع آوری می شوند و پس از پردازش اطلاعات، هر هسته CUDA نتیجه عملکرد خود و همچنین اعمالی که برای ادامه ی فرایند پردازش باید اجرا شوند را به CUDA Core بعدی اطلاع می دهد و این فرایند تا پردازش کامل ادامه می یابد.
همزمان با این عملیات موتور پردازش اشکال (Polymorph Engine)، اطلاعات مربوط به شکل و هندسه جسم را پردازش می کند. برای این کار ابتدا راس ها را مشخص می کند سپس توسط Tessellator فواصل بین راس ها را پر می کند. در قسمت Viewport Transform اندازه اجسام و جای آنها روی صفحه تعیین می شود. در Attribute Setup، ویژگی های خاص اجسام پردازش شده، تنظیم می شوند و سپس در قسمت Stream Output، اطلاعات اجسام پردازش شده خارج می شوند.
اطلاعات پردازش شده در CUDA Coreها و Polymorph Engine در قسمت Interconnect Network (شبکه اتصالات داخلی) با یکدیگر ادغام می شوند.
در جدول زیر مقدار Cache های به کار رفته در سری GT 200 و سری GF 100 با یکدیگر مقایسه شده اند:
میزان Cache L2 در این چیپ بسیار بیشتر از سری GT200 میباشد و این مزیت امکان پوشش دادن سطح وسیع تری از تکسچرها و پردازش راحت تر و قوی تر را به GTX480 می دهد.
در تصویر زیر می توانید مراحل کار Raster Engine و Poly Morph Engine را مشاهده کنید:
وظیفه Raster Engine تنظیم اندازه و کیفیت اجسام پردازش شده و همچنین جایگاه آنها بر روی مونیتور است. بدین منظور ابتدا لبه های اجسام تنظیم می شوند، سپس Rasterizer مسئولیت اسکن خطی تصاویر را بر عهده می گیرد.
نحوه کار Polymorph Engine هم در بالا شرح داده شده است اما برای این که عمل Tessellation (در لغت به معنای موزاییک کاری است اما در این مورد وظیفه پر کردن فواصل بین راس ها را بر عهده دارد) را بهتر درک کنید، به عکس های زیر توجه نمایید:
در این تصاویر سطوح مختلف Tessellation دیده می شوند و تفاوت بسیار زیادی بین آنها وجود دارد. البته طبعا با بیشتر شدن جزئیات بار پردازش گرافیکی افزایش زیادی می یابد.
NVIDIA چند دموی جالب از فعالیت های مختلف گرافیکی تهیه کرده که در زیر می توانید تصاویری از آنها مشاهده نمایید:
تصاویر بالا بهبود عملکرد معماری Fermi GF100 را نسبت به معماری های پیشین نشان می دهد. همچنین سیستم Anti-Aliasing در این معماری بهبود قابل توجهی داشته است. در مورد تصاویری که از دریا میبینید باید گفت که این کارت در تصویر با جزئیات کمتر 300 فریم و در تصویر با جزئیات بالا 150 فریم در ثانیه ارائه داده است.
ستمی که از سوی Nvidia برای رقابت با Eyefinity در نظر گرفته شده Multi-Panel Gaming Across نام دارد که از سه مانیتور به صورت همزمان پشتیبانی می کند و در نمایشگاه CES 2010 در Las Vegas از آن رونمایی شد. به هر حال فعلا Eyefinity قدرتمند تر است چون از 6 مانیتور هم پشتیبانی می کند!
تست ها و بنچ مارک ها:
مشخصات سخت افزارهای مورد استفاده برای تست به این شرح است:
CPU: Core i7-965 (3.2 GHz)
Main Board: Gigabyte EX58-UD5
VGA: HD 5850 – HD 5870 – HD 5970 – GTX 285 – GTX 295 – GTX 480
RAM: 6GB OCZ (DDR3 1333)
H.D.D: WD 150 GB
(DX11): Unigine Heaven تست با
با این که از نظر اعداد و ارقام HD5970 دارای وضعیت بهتری است، اما در این تست GTX 480 بهترین عملکرد را نشان داد. (البته نتایج این دو به یکدیگر نزدیک بود) در حالت Crossfire و SLI نیز نتایج تغییر چندانی نکرد و طبق همان روال باقی ماند. در این تست تاکید زیادی بر قدرت Tessellation شده است و این نشان می دهد که عملکرد معماری GF100 واقعا بهبود یافته است.
تست با 3D Mark Vantage :(DX 10)
حتی خود من هم نمی دانم که علت این همه نتایج ضد و نقیض چیست، اما به هر حال نتیجه این تست به این صورت بود.
نرم افزار 3D Mark Vantage از نرم افزار های متداول تست سخت افزار می باشد. البته این نرم افزار بر پایه ی DirectX 10 طراحی شده است.
در این تست کارت 5970 در همه ی حالت ها قدرت خودش را به رخ رقیبانش کشید و بدون کمترین زحمتی از آن ها جلو زد، GTX 480 هم در برابر نسل قبلی خود یعنی GTX 295 حسابی خجالت زده شد.
با توجه به این که GTX 295 حدود 490 دلار قیمت دارد اما عملکردی مشابه چیپ 5870 ارائه داد که باعث تعجب ما شد و ما را به این سوال مشغول کرد که آیا Nvidia حتی با ایجاد تغییر در معماری کارت های خود نیز نتوانسته عملکرد خود را بهبود ببخشد؟
اما هنوز برای نتیجه گیری بسیار زود است و تا زمانی که Crysis هست ، نباید به این دو تست اکتفا کرد!
تست با Crysis Warhead
این بازی از آغاز ورودش همواره به عنوان ابزاری برای تست بازی ها استفاده شده است. موتور گرافیکی قدرتمند این بازی توانایی اجرای افکت های خارق العاده را به آن میدهد. این بازی محصول شرکت Crytek می باشد و این تست در رزولوشن 1920x1200 و بدون فیلتر های AA اجرا شد.
در این تست، باز هم 5970 ، قدرت برتر خود را به رخ حریفان کشید و GTX 295 توانست از GTX 480 هم جلو بزند و در مقام دوم بایستد. نتایج GTX 480 و 5870 نیز بسیار به یک دیگر شبیه بود. با این وجود این سوال مطرح می شود که آیا تمام این تعریف ها از Nvidia بی نتیجه بوده؟
در پاسخ باید گفت که GTX 295 و GTX 480 هر دو از 480 عدد CUDA بهره می برند. اما با توجه به این که در پارامتر های دیگر GTX 480 قوی تر میباشد و نیز ادعا هایی که Nvidia روی معماری Fermi GF100 خود کرده ، عملکرد بالا تری از این کارت انتظار می رفت. اما این کارت در صورت SLI شدن عملکرد بالا تری از GTX 295 در حالت SLI دارد. که البته تصور آن چندان هم دور از ذهن نیست.
تست با Far Cry 2
این بازی نیز مانند Crysis از گرافیکی بسیار بالایی برخوردار است و برای به چالش کشیدن قطعات پردازشی سیستم به کار می رود. اما از نظر سطح جزئیات، این بازی در حد Crysis دقیق نیست.
در این بازی نتایج کمی متفاوت بود اما در مقام و رتبه شرکت کننده ها تغییری مشاهده نشد، در این تست GTX 480 مجال بیشتری برای قدرت نمایی داشت و توانست خود را به HD 5970 نزدیک تر کند اما باز هم به آن نرسید.
نتیجه ای که می توان از مجموعه این تست ها گرفت این است که GTX 480 عملکرد خوبی را در پردازش محیط های کوچک با جزئیات بسیار بالا به نمایش می گزارد اما هر چه محیط بزرگتر می شود ، عملکرد آن هم کمتر نمود پیدا می کند. به هر حال این مشکل از هر جا که هست و هر علتی که دارد، باید حل شود تا بتوان به این چیپ اعتماد کرد.
سخن آخر:
در اینجا سعی کردیم که با رعایت اعتدال کامل به بررسی این چیپ بپردازیم و تمامی جزئیات مربوط به آن را بررسی کنیم. اما در پایان به رغم همه ی تغییر و تحولاتی که این چیپ با خود به میان آورده، از آن عملکرد بسیار خوبی مشاهده نشد و همانطور که گفته شد، به نظر می رسد که این کارت در محیط کوچک با جزئیات بالا، بسیار خوب عمل می کند. اما در محیط های بزرگتر، دچار نقص می شود. در مجموع با توجه به این که قیمت این کارت چیزی در حدود 450 دلار است، از آن عملکرد بهتری انتظار می رفت و کارکرد کنونی این کارت قیمت آن را توجیه نمی کند.
از طرف دیگر از نقاط مثبت این چیپ میتوان پشتیبانی از DX 11 , PhysX و CUDA Cores را مثال زد. همچنین راندمان کاری این چیپ در SLI بهبود یافته است. اما این کارت دیر وارد بازار شد و با توجه به قیمت خود، عملکرد مناسبی را ارائه نمیدهد.
البته باید این نکته را ذکر کرد که این چیپ از تمامی ظرفیت های معماری Fermi GF100 استفاده نکرده است و این معماری پتانسیل بالایی برای رشد دارد. احتمالا در چیپ های بعدی Nvidia عملکرد بهتری را شاهد خواهیم بود و به همین دلیل به شما کاربران گرامی توصیه می کنیم تا به بازار آمدن چیپ های بعدی صبر کنید مگر این که قیمت این کارت افت کند. در مجموع ارزش واقعی این کارت از نظر عملکرد، حداکثر چیزی حدود 350 دلار است، نه بیشتر (برای قیمت 350 دلار، محصول بسیار خوبی است)
منابع :
منبع مشخصات: سایت رسمی شرکت Nvidia
منبع تست ها و بنچ مارک ها: سایت HotHardware.com
نوشته شده توسط : کیوان مساجدی در www.narenji.ir
علاقه مندی ها (بوک مارک ها)