mehraboOon
01-04-2012, 03:43 PM
بررسي عملکرد پهناي باند و مقدار حافظه در عملکرد کارت گرافيک
http://computernews.ir/Files/Articles/Items/2010/7/1001638_b.jpg
اشاره :
محبوبيت بازيهاي کامپيوتري در بين نوجوانان و جوانان در کشورهاي توسعه يافته و همينطور در حال توسعه روز به روز در حال افزايش است.
مقدمه
در بين کنسولهاي مختلف بازي، شمار زيادي از افراد، از کامپيوترهاي شخصي براي اين منظور استفاده ميکنند. چنين کامپيوترهايي براي اجراي بازيهاي کامپيوتري مدرن در بهترين حالت، بايد داراي پردازندههاي قدرتمند،حافظه اصلي با سرعت و حجم مناسب و از همه مهم تر کارت گرافيک به روز و سريع باشند.
آمار و تجربه در بين فروشندگان قطعات سخت افزاري کامپيوترهاي شخصي، نشان ميدهد بيشتر افرادي که از کامپيوترهاي شخصي خود براي اجراي بازيهاي کامپيوتري نيز استفاده ميکنند، هزینه ای بين 90 الي 150 هزار تومان را براي خريد کارت گرافيک کنار ميگذارند.
حال جالب است بدانيد، بيشترين تنوع در بين کارتهاي گرافيک با مدلهاي يکسان از نظر سرعت و حجم حافظه و ... در اين محدوده قيمت وجود دارد. لذا همواره در بين خريداران نوعي دو دلي وجود دارد که انتخاب نهايي را مشکل ميسازد.
در اين مقاله قصد داريم با اتکا به تستهاي استاندارد و مختلف انتخاب را براي شما آسانتر سازيم.
معرفي
قبل از شروع هر گونه توضيح ابتدا لازم است، بخشهاي مختلف و عواملي که در افزايش توانايي و سرعت کارتهاي گرافيک نقش مهميايفا ميکنند را نام ببريم.
GPU :
پردازنده گرافيکي که به اصطلاح لاتين Graphic Processing Unit ناميده ميشود نوعي پردازنده است که بر اساس پردازش موازي کار ميکنند و بر خلاف CPU که از دستورالعملهاي(Single Instruction Multiple Data)SIMD براي پرداش بردار استفاده ميکنند، از دستورالعملهاي (Single Instruction Multiple Thread)SIMTبراي اين منظور استفاده ميکنند.
عوامل زيادي در افزايش تواناييGPU موثرند، از اين موارد ميتوان به تعداد پردازندههاي جرياني(Stream Processors) به کار رفته در آن، فرکانس هسته و فرکانس پردازندههاي سایه زن (Shader Clock)و در نهايت کيفيت و بازدهي معماري به کار رفته در GPU اشاره کرد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey01_s.jpg
شکل 1: نمايي از چيپ کارت گرافيک
Video Memory
اين حافظه که به اصطلاح Local Video Memory ناميده ميشود و بر روي بورد کارت گرافيک مستقر است به طور مستقيم با پردازنده گرافيکي (GPU) و به واسطه MCH يا چيپ کنترلر حافظه مادربورد، با پردازنده مرکزي (CPU) و در نهايت حافظه اصلي سيستم(RAM) در ارتباط است.
Interface يا اصطلاحا درگاهي که اين ارتباط را بين حافظه VGA و مادربورد مرتبط ميسازد، در کامپيوترهاي امروزي PCI-Express نام دارد که در نسخه 1.0 ، سرعت تبادل اطلاعات حداکثر 8GB/S و در نسخه 2.0 اين مقدار، حداکثر به 16GB/S ميرسد.
آنچه در نگاه اول از نرخ تبادل اطلاعات، بين حافظه کارتهاي گرافيک و حافظه اصلي سيستم استنتاج ميشود، اين است که تراکنش اطلاعات بين اين دو، به اندازه سرعت تبادل اطلاعات بين GPU و حافظه محلي موجود در کارت گرافيک به مراتب اهميت کمتري دارد. اين موضوع دو دليل عمده دارد:
• پهناي باند حافظه اصلي سيستم در پلتفرمهاي کنوني و رايج کمپانيهاي Intel و AMD حتي با استفاده از بهترين و پرسرعتترين حافظههاي موجود به ندرت از مقدار حداکثر 16GB/S عبور ميکند ( البته با وجود پلتفرم جديد Corei7 کمپاني اينتل اين موضوع کمياهميت بيشتري پيدا خواهد کرد). همچنين پهناي باند ارتباط GPU با حافظه Local در مدلهاي قدرتمند کارتهاي گرافيک موجود در بازار چيزي بيشتر از 100GB/S است که اختلاف فاحش بين اين دو، به وضوح اين مسئله را ثابت ميکند.
• معمولا موتورهاي گرافيکي به کار رفته در بازيهاي کامپيوتري و بسياري از نرم افزارهاي ويرايش تصاوير 3D به گونهاي کد نويسي و در نهايت بهينه سازي ميشوند که ارتباط بين اين دو حافظه، حداقل در رزوليشنها و تکنيکهاي هموار کردن ناصافيها (Anti-Aliasing) متعارف به کمترين مقدار خود برسد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey02_s.jpg
شکل 2: حافظه کارت گرافيک به طور مستقيم با GPU، CPU و حافظه اصلي سيستم در ارتباط است.
از آن گذشته، هدف اصلي ما در اين مقاله بررسي نتايج به دست آمده در ماحصل تغييرات حجم و پهناي باند حافظه موجود بر روي بورد کارت گرافيک ميباشد که همانطور که قبلا اشاره کرديم به صورت مستقيم با GPU در ارتباط است.
حجم حافظه ( Memory Size ) :
کارتهاي گرافيکي مدرن و امروزي معمولا بيش از256MB حافظه بر روي برد خود دارند. همچنين تجربه و نتايج به دست آمده در تستهاي مختلف نرم افزارها وبرايش تصاوير 3 بعدي و بازيهاي کامپيوتري مدرن نشان داده است که در رزوليشنهاي متعارف که کاربردهاي عموميبيشتري دارند (رزوليشني که مونيتورهاي السيدي حداکثر 20 اينچ موجود در بازار پشتيباني ميکنند) و همينطور مقدار جزئيات قابل پردازش به نحو قابل قبول توسط کارتهاي گرافيک رده متوسط، 512MB حافظه Local به خوبي جوابگوي نيازهاي کنوني و حتي آينده نزديک است.
پهناي باند حافظه ( Memory Bandwidth )
2 عامل مهم، در شکل گيري پهناي باند بين GPU و حافظه Local ، نقش مهمي دارند :
• width Memory Bus :
در واقع واسط حافظه ناميده ميشود. اين واسط در کارتهاي گرافيک مدرن امروزي بيش از 256Bit ميباشد. کمپانيهاي سازنده، با توجه به Controller به کار رفته در GPU و محاسبه قيمت تمام شده کارتهاي گرافيک، اين مقدار را تعيين ميکنند. لازم به ذکر است که يکي از مهم ترين عواملي که قيمت تمام شده يک کارت گرافيک را در نهايت تعيين ميکند همين عامل ميباشد.
• Memory Clock :
فرکانس کاري حافظه نيز عامل ديگر است که در شکل گيري پهناي باند حافظه موثر ميباشد، اين عامل خود در وحله اول به تکنولوژي ساخت حافظه وابسته است. هر يک از تکنولوژيهاي DDR ،DDR2 ،DDR3 ، GDDR4 وGDDR5 محدوه فرکانس خاص خود را دارند. براي مثال حافظههاي DDR2، در استاندارد JEDEC و با توجه به مدل، در محدوده فرکانسي 1066MHz - 800MHz - 667MHz - 533MHz - 400MHz کار ميکنند و داراي ولتاژ کاري1.8v هستند. همچنين مدلهاي GDDR2 اين حافظهها که از استانداردهاي JEDEC تبعيت نميکنند در Cycle timeهاي کمتر و با ولتاژي حدود 2.0v کار ميکنند. حافظههاي DDR3 نيز تحت همان استاندارد JEDEC در محدوده فرکانسي
800MHz - 1066MHz - 1333MHz - 1600MHz و با ولتاژ کاري حدودا 1.5v کار ميکنند. همچنين مدلهاي GDDR3 نيز با Cycle time هاي کمتر و ولتاژي حدودا تا 1.9v نيز در محدوده فرکانسي 1600MHz - 1800MHz - 2000MHz کار ميکنند.
براي درک بيشتر تاثير دو عامل بالا ميتوانيم اين طور مثال بزنيم:
کارت گرافيکي با واسط حافظه 128 Bitو فرکانس کاري2000MHz GDDR3 - داراي پهناي باند حافظه برابر با حداکثر 32GB/S ميباشد.
حال همان کارت گرافيک با واسط حافظه 256 Bit و فرکانس کاري GDDR2 -1000MHz نيز داراي همان پهناي باند حداکثر 32GB/S ميباشد.
در واقع مشاهده کرديد که اين دو عامل در واقع مکمل يکديگر ميباشد.
تست و بررسي و تحليل نتايج
براي اين منظور از يکي از مدلهاي پرفروش بازار، يعني nvidia Geforce 9500GT استفاده کرديم. انواع و اقسام مختلف از اين مدل در بازار موجود هستند.
مشخصات فني چيپ گرافيکي G96 کمپاني nVidia که در اين مدل به کار رفته و همچنين مدل حافظههاي توصيه شده توسط کمپاني سازنده چيپ مطابق شکل 3 است:
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey03_s.jpg
شکل 3 : مشخصات فني چيپ گرافيکي G96
همانطور که در جدول فوق مشخص است، کمپاني سازنده، حجم حافظه از نوع DDR3 1600MHz را 256MB تعيين کرده است، همچنين براي مدل DDR2 استفاده از حافظه با حجم 512MB و فرکانس کاري 1000MHz را کافي دانسته است. در واقع سياستهاي کمپاني سازنده براي کنترل قيمت تمام شده مدل مورد نظر، در زماني اعمال شده بود که قيمت جهاني حافظهها بالا بوده، در حال حاضر که قيمت جهاني حافظههاي ياد شده به مقدار قابل توجهي کاهش يافته، حتي کمپانيهاي معتبر نيز اقدام به استفاده از حافظههاي مختلف با حجمهاي دو برابر مقدار ياد شده کردهاند. لازم به ذکر است که تقريبا تمام کمپانيهاي تولید کننده کارتهاي گرافيک که از مدل 1GB حافظه DDR2 براي اين مدل استفاده نمودهاند از نوع DDR2-800MHz در اين استفاده کرده¬اند. اين تغيير، بدون شک جهت کنترل قيمت تمام شده محصول بوده است.
لابراتوار رايانه خبر براي اين مقاله دو مدل زير را تهيه کرده است :
Model : SPARKLE Nvidia Geforce 9500GT
Memory Type : GDDR3 1600MHz
Memory Size : 512MB
Memory Width : 128Bit
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey04_s.jpg
شکل 4 : مشخصات کارت انتخابي 1
Model : SPARKLE Nvidia Geforce 9500GT
Memory Type : DDR2 800MHz
Memory Size : 1024MB
Memory Width : 128Bit
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey05_s.jpg
شکل 5 : مشخصات کارت انتخابي 2
در حال حاضر اين دو مدل با قيمت مشابه حدود 90 هزار تومان در بازار ايران ( با گارانتي شرکت فاره ) موجود هستند.
همانطور که از مشخصات مدلهاي بالا نمايان است، ما دو مدل را انتخاب کرديم، به اين صورت که پهناي باند حافظه در مدل DDR3 دو برابر و از سوي ديگر حجم حافظه در مدل DDR2 2 برابر مدل DDR3 است.
در واقع هدف اصلي ما از اين مقاله، بررسي و تست شرايط بالا بود تا تاثيرات حجم و پهناي باند حافظه را در کارتهاي گرافيک با GPUهاي يکسان مشاهده کنيم.
شرايط تست :
براي تست کارتهاي گرافيک ياد شده از سيستم پلتفرم اينتل لابراتوار رايانه خبر استفاده نموديم.
جدول 1: جدول مشخصات سيستم تست
از آنجا که تقريبا تمام بازيهاي کامپيوتري مدرن بر پايه DirectX 10.0 پايه ريزي ميشوند، ما هم در تستها به غير از تست 3DMARK 06 تماما از بازيهاي کامپيوتري و نرم افزار معتبر بر پايه Direct X 10 بهره برديم.
همچنين اين پيشبيني را نيز کرديم که چون حافظه Local فقط زماني به خوبي محک ميخورد که تستها در رزوليشنهاي بالا و تنظيمات جزييات بازي بالا انجام شود، به همين دليل تست ها تماما با حداکثر رزوليشن قابل پشتيباني توسط يک مونيتور السيدي 20 اينچ رايج (1680 x 1050) و جزييات گرافيکي بالا انجام شده است. همچنين اگر FPS در حين تست قابل قبول بود از Anti-Aliasing نيز در تست استفاده کرديم.
تست(3DMARK 06 (DX 9.0
تست مزبور همواره يکي از بهترين تست ها جهت محک زنی کارتهاي گرفيک بوده، اين نرم افزار با استفاده از تستهاي مجزا، تکنيکهاي سايهزني رنگ Shader Model 2.0 و Shader Model 3.0 کارتهاي گرافيک را با تستهاي نسبتا سنگين ارزيابی می کند.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey06_s.jpg
شکل 6
آنچه از نگاه اول از نتيجه اين تست بدست ميآيد اين است که برتري 30% درصدي مدل 512MB DDR3 به روشني نمايان است.
تست(3DMARK Vantage (DX 10.0
اين تست بدون شک يکي از سنگينترين و در عين حال معتبرترين تستهاي Direct X 10.0 محسوب ميشود. اين تست به شدت در رزولوشنهاي بالا، حافظه Local موجود بر روي بورد کارت گرافيک را اشغال ميکند و از زواياي مختلف نظير استفاده از آخرين تکنولوژيهاي سايه زني رنگ (Shader model 4.0) و نور پردازي، GPU را مورد آزمايش قرار ميدهد. همچنين اگر کمي موشکافانه در حين تست اين نرم افزار CPU Usage را مشاهده کرده باشيد، متوجه ميشويد که تستهاي GPU اين نرم افزار به شدت نسبت به پردازنده ايزوله هستند، به بيان ديگر پردازنده در تست ياد شده خود را دخالت نميدهد يا اينکه تاثير بسيار کمي دارد و فقط کارت گرافيک است که مورد ارزيابي قرار ميگيرد. اين خصيصه، نرم افزار ياد شده را در زمره نرم افزارهاي کاملا تخصصي تست کارتهاي گرافيک قرار ميدهد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey07_s.jpg
شکل 7
در اين تست نيز برتري 40% درصدي، با مدل 512MB DDR3 است.
تست(Call of Juarez (DX 10.0
اين بازي يکي از بازيهاي پرفروش و در عين حال مدرن که در بسياري از منابع معتبر تست و بررسي سخت افزار، مرجع معتبري براي تست کارتهاي گرافيک است.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey08_s.jpg
شکل 8
در اين تست نسبتا سنگين نيز برتري 42% درصدي مدل 512MB DDR3 مشهود است. در واقع نتيجه به دست آمده براي هر دو مدل به دليل کم بودن FPS مناسب نيست، ولي هدف اصلي ما از اين تست تحت فشار قرار دادن هر دو مدل بود که به خوبي محقق شده است.
تست(Crysis warhead (DX 10.0
بدون شک، شاهکار کمپاني Crytek با بهره گيري از موتور گرافيکي قدرتمند Cry Engine تا به امروز، بهترين بازي از لحاظ گرافيکي است، در اين بازي کامپيوتري از آخرين تکنولوژيهاي سايه پردازي، سايه زني رنگها و همين طور جلوههاي واقع گرايانه تصوير براي داشتن طبيعيترين صحنهها، استفاده شده است.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey09_s.jpg
شکل 9
در اين تست نيز مدل 512MB DDR3 با اختلاف 33% درصدي، عملکرد بهتري نسبت به مدل 1GB DDR2 داشت.
تست(DEVIL MAY CRY 4 (DX 10.0
اين تست نيز، به دليل استفاده از جلوههاي واقع گرايانه بسيار مهيج و طرفداران کثير اين بازي، در بسياري از منابع تست و بررسي قطعات سخت افزاري مورد استفاده قرار ميگيرد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey010_s.jpg
شکل 10
در اين تست نيز، باوجود برتري 35% درصدي مدل 512MB DDR3، جايي براي بحث باقي نميماند.
تست(Far Cry 2 (DX 10.0
Far Cry 2 نيز با بهره بردن از موتور گرافيکي Cry Engine از آخرين تکنولوژهاي گرافيکي به کار رفته در بازيهاي کامپيوتري مدرن، پشتيباني ميکند، در اين بازي کامپيوتري شما ميتوانيد دورنمايي چند کيلومتري از جنگلهاي آفريقا را به همراه نور پردازي مثال زدني، مشاهده کنيد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey011_s.jpg
شکل 11
در آخرين تست اين مقاله نيز، کماکان مدل 512MB DDR3 حدودا 25% عملکرد بهتري نسبت به مدل 1GB DDR2 داشت.
نتيجه نهايي
همانطور که نتايج تستها نشان ميدهد، به طور ميانگين مدل 512MB DDR3 حدودا 34% از مدل 1GB DDR2 نتايجي بهتري کسب کرده است. در واقع حجم حافظه بيشتر حتي در رزوليشنهاي بالا نتوانست به هيچ وجه، ضعف پهناي باند حافظه را جبران کند. از سوي ديگر اگر نتايج را به صورت موشکافانه بررسي کرده باشيد، و احيانا از طرفداران بازيهاي کامپيوتري باشيد، متوجه خواهيد شد که مقدار فريم در ثانيه (FPS) در اکثر تستها کمتر از مقدار قابل قبول براي داشتن حداقل کيفيت مطلوب براي اجراي بازيهاي مورد نظر است ( اگر آستانه کيفيت مطلوب را 20FPS در نظر بگيريم ). در نتيجه، حتي براي داشتن کيفيتي مطلوبتر، بايد رزوليشن و جزئيات کمتري را براي اجراي قابل قبول بازيهاي کامپيوتري نام برده، به کار بگيريم.
در واقع اينطور ميتوان نتيجهگيري کرد که در کاربردهاي معمولي، نظير بازيهاي کامپيوتري، نرمافزارهاي فني مهندسي رايج و... حجم بيشتر حافظه گرافيکي Local، نسبت به مقدار استاندارد تعيين شده توسط کمپاني سازنده پردازنده گرافيکي، در کارتهاي گرافيک رده متوسط و رده ضعيف، به هيچ وجه راهکار مناسبي براي افزايش کارايي نهايي نيست. از طرفي ديگر همانطور که قبلا اشاره کرديم، کمپانيهاي تولید کننده کارتهاي گرافيکي براي کنترل قيمت تمام شده مدلهاي ياد شده، با افزايش حجم حافظه گرافيکي، از حافظههايي با سرعت کمتر استفاده ميکنند که در نهايت کاهش پهناي باند حافظه را به دنبال دارد. اين امر نيز همانطور که در اين تست و بررسي ديديم، نتيجه خوبي را به دنبال ندارد.
و سرانجام، در سخن پاياني ميتوان به اين نکته اشاره کرد که در کارتهاي گرافيکي امروزي که پردازندههاي گرافيکي نقش بسيار بيشتري نسبت به پردازنده مرکزي در اجراي جلوههاي سه بعدي دارند ، حجم حافظه گرافيکي بيشتر نميتواند عاملي براي برتري باشد، بلکه پهناي باند حافظه است که نقش محوري تري در اين امر دارد.
اين 2 مدل کارت گرافيک اسپارکل را شرکت محترم شرکت فاره رايانه فرد جهت تست و نگارش مقاله در اختيار لابراتوار ماهنامه رايانه خبر قرار داد که بدين طريق از اين همکاري، صميمانه قدرداني ميگردد.
http://computernews.ir/Files/Articles/Items/2010/7/1001638_b.jpg
اشاره :
محبوبيت بازيهاي کامپيوتري در بين نوجوانان و جوانان در کشورهاي توسعه يافته و همينطور در حال توسعه روز به روز در حال افزايش است.
مقدمه
در بين کنسولهاي مختلف بازي، شمار زيادي از افراد، از کامپيوترهاي شخصي براي اين منظور استفاده ميکنند. چنين کامپيوترهايي براي اجراي بازيهاي کامپيوتري مدرن در بهترين حالت، بايد داراي پردازندههاي قدرتمند،حافظه اصلي با سرعت و حجم مناسب و از همه مهم تر کارت گرافيک به روز و سريع باشند.
آمار و تجربه در بين فروشندگان قطعات سخت افزاري کامپيوترهاي شخصي، نشان ميدهد بيشتر افرادي که از کامپيوترهاي شخصي خود براي اجراي بازيهاي کامپيوتري نيز استفاده ميکنند، هزینه ای بين 90 الي 150 هزار تومان را براي خريد کارت گرافيک کنار ميگذارند.
حال جالب است بدانيد، بيشترين تنوع در بين کارتهاي گرافيک با مدلهاي يکسان از نظر سرعت و حجم حافظه و ... در اين محدوده قيمت وجود دارد. لذا همواره در بين خريداران نوعي دو دلي وجود دارد که انتخاب نهايي را مشکل ميسازد.
در اين مقاله قصد داريم با اتکا به تستهاي استاندارد و مختلف انتخاب را براي شما آسانتر سازيم.
معرفي
قبل از شروع هر گونه توضيح ابتدا لازم است، بخشهاي مختلف و عواملي که در افزايش توانايي و سرعت کارتهاي گرافيک نقش مهميايفا ميکنند را نام ببريم.
GPU :
پردازنده گرافيکي که به اصطلاح لاتين Graphic Processing Unit ناميده ميشود نوعي پردازنده است که بر اساس پردازش موازي کار ميکنند و بر خلاف CPU که از دستورالعملهاي(Single Instruction Multiple Data)SIMD براي پرداش بردار استفاده ميکنند، از دستورالعملهاي (Single Instruction Multiple Thread)SIMTبراي اين منظور استفاده ميکنند.
عوامل زيادي در افزايش تواناييGPU موثرند، از اين موارد ميتوان به تعداد پردازندههاي جرياني(Stream Processors) به کار رفته در آن، فرکانس هسته و فرکانس پردازندههاي سایه زن (Shader Clock)و در نهايت کيفيت و بازدهي معماري به کار رفته در GPU اشاره کرد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey01_s.jpg
شکل 1: نمايي از چيپ کارت گرافيک
Video Memory
اين حافظه که به اصطلاح Local Video Memory ناميده ميشود و بر روي بورد کارت گرافيک مستقر است به طور مستقيم با پردازنده گرافيکي (GPU) و به واسطه MCH يا چيپ کنترلر حافظه مادربورد، با پردازنده مرکزي (CPU) و در نهايت حافظه اصلي سيستم(RAM) در ارتباط است.
Interface يا اصطلاحا درگاهي که اين ارتباط را بين حافظه VGA و مادربورد مرتبط ميسازد، در کامپيوترهاي امروزي PCI-Express نام دارد که در نسخه 1.0 ، سرعت تبادل اطلاعات حداکثر 8GB/S و در نسخه 2.0 اين مقدار، حداکثر به 16GB/S ميرسد.
آنچه در نگاه اول از نرخ تبادل اطلاعات، بين حافظه کارتهاي گرافيک و حافظه اصلي سيستم استنتاج ميشود، اين است که تراکنش اطلاعات بين اين دو، به اندازه سرعت تبادل اطلاعات بين GPU و حافظه محلي موجود در کارت گرافيک به مراتب اهميت کمتري دارد. اين موضوع دو دليل عمده دارد:
• پهناي باند حافظه اصلي سيستم در پلتفرمهاي کنوني و رايج کمپانيهاي Intel و AMD حتي با استفاده از بهترين و پرسرعتترين حافظههاي موجود به ندرت از مقدار حداکثر 16GB/S عبور ميکند ( البته با وجود پلتفرم جديد Corei7 کمپاني اينتل اين موضوع کمياهميت بيشتري پيدا خواهد کرد). همچنين پهناي باند ارتباط GPU با حافظه Local در مدلهاي قدرتمند کارتهاي گرافيک موجود در بازار چيزي بيشتر از 100GB/S است که اختلاف فاحش بين اين دو، به وضوح اين مسئله را ثابت ميکند.
• معمولا موتورهاي گرافيکي به کار رفته در بازيهاي کامپيوتري و بسياري از نرم افزارهاي ويرايش تصاوير 3D به گونهاي کد نويسي و در نهايت بهينه سازي ميشوند که ارتباط بين اين دو حافظه، حداقل در رزوليشنها و تکنيکهاي هموار کردن ناصافيها (Anti-Aliasing) متعارف به کمترين مقدار خود برسد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey02_s.jpg
شکل 2: حافظه کارت گرافيک به طور مستقيم با GPU، CPU و حافظه اصلي سيستم در ارتباط است.
از آن گذشته، هدف اصلي ما در اين مقاله بررسي نتايج به دست آمده در ماحصل تغييرات حجم و پهناي باند حافظه موجود بر روي بورد کارت گرافيک ميباشد که همانطور که قبلا اشاره کرديم به صورت مستقيم با GPU در ارتباط است.
حجم حافظه ( Memory Size ) :
کارتهاي گرافيکي مدرن و امروزي معمولا بيش از256MB حافظه بر روي برد خود دارند. همچنين تجربه و نتايج به دست آمده در تستهاي مختلف نرم افزارها وبرايش تصاوير 3 بعدي و بازيهاي کامپيوتري مدرن نشان داده است که در رزوليشنهاي متعارف که کاربردهاي عموميبيشتري دارند (رزوليشني که مونيتورهاي السيدي حداکثر 20 اينچ موجود در بازار پشتيباني ميکنند) و همينطور مقدار جزئيات قابل پردازش به نحو قابل قبول توسط کارتهاي گرافيک رده متوسط، 512MB حافظه Local به خوبي جوابگوي نيازهاي کنوني و حتي آينده نزديک است.
پهناي باند حافظه ( Memory Bandwidth )
2 عامل مهم، در شکل گيري پهناي باند بين GPU و حافظه Local ، نقش مهمي دارند :
• width Memory Bus :
در واقع واسط حافظه ناميده ميشود. اين واسط در کارتهاي گرافيک مدرن امروزي بيش از 256Bit ميباشد. کمپانيهاي سازنده، با توجه به Controller به کار رفته در GPU و محاسبه قيمت تمام شده کارتهاي گرافيک، اين مقدار را تعيين ميکنند. لازم به ذکر است که يکي از مهم ترين عواملي که قيمت تمام شده يک کارت گرافيک را در نهايت تعيين ميکند همين عامل ميباشد.
• Memory Clock :
فرکانس کاري حافظه نيز عامل ديگر است که در شکل گيري پهناي باند حافظه موثر ميباشد، اين عامل خود در وحله اول به تکنولوژي ساخت حافظه وابسته است. هر يک از تکنولوژيهاي DDR ،DDR2 ،DDR3 ، GDDR4 وGDDR5 محدوه فرکانس خاص خود را دارند. براي مثال حافظههاي DDR2، در استاندارد JEDEC و با توجه به مدل، در محدوده فرکانسي 1066MHz - 800MHz - 667MHz - 533MHz - 400MHz کار ميکنند و داراي ولتاژ کاري1.8v هستند. همچنين مدلهاي GDDR2 اين حافظهها که از استانداردهاي JEDEC تبعيت نميکنند در Cycle timeهاي کمتر و با ولتاژي حدود 2.0v کار ميکنند. حافظههاي DDR3 نيز تحت همان استاندارد JEDEC در محدوده فرکانسي
800MHz - 1066MHz - 1333MHz - 1600MHz و با ولتاژ کاري حدودا 1.5v کار ميکنند. همچنين مدلهاي GDDR3 نيز با Cycle time هاي کمتر و ولتاژي حدودا تا 1.9v نيز در محدوده فرکانسي 1600MHz - 1800MHz - 2000MHz کار ميکنند.
براي درک بيشتر تاثير دو عامل بالا ميتوانيم اين طور مثال بزنيم:
کارت گرافيکي با واسط حافظه 128 Bitو فرکانس کاري2000MHz GDDR3 - داراي پهناي باند حافظه برابر با حداکثر 32GB/S ميباشد.
حال همان کارت گرافيک با واسط حافظه 256 Bit و فرکانس کاري GDDR2 -1000MHz نيز داراي همان پهناي باند حداکثر 32GB/S ميباشد.
در واقع مشاهده کرديد که اين دو عامل در واقع مکمل يکديگر ميباشد.
تست و بررسي و تحليل نتايج
براي اين منظور از يکي از مدلهاي پرفروش بازار، يعني nvidia Geforce 9500GT استفاده کرديم. انواع و اقسام مختلف از اين مدل در بازار موجود هستند.
مشخصات فني چيپ گرافيکي G96 کمپاني nVidia که در اين مدل به کار رفته و همچنين مدل حافظههاي توصيه شده توسط کمپاني سازنده چيپ مطابق شکل 3 است:
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey03_s.jpg
شکل 3 : مشخصات فني چيپ گرافيکي G96
همانطور که در جدول فوق مشخص است، کمپاني سازنده، حجم حافظه از نوع DDR3 1600MHz را 256MB تعيين کرده است، همچنين براي مدل DDR2 استفاده از حافظه با حجم 512MB و فرکانس کاري 1000MHz را کافي دانسته است. در واقع سياستهاي کمپاني سازنده براي کنترل قيمت تمام شده مدل مورد نظر، در زماني اعمال شده بود که قيمت جهاني حافظهها بالا بوده، در حال حاضر که قيمت جهاني حافظههاي ياد شده به مقدار قابل توجهي کاهش يافته، حتي کمپانيهاي معتبر نيز اقدام به استفاده از حافظههاي مختلف با حجمهاي دو برابر مقدار ياد شده کردهاند. لازم به ذکر است که تقريبا تمام کمپانيهاي تولید کننده کارتهاي گرافيک که از مدل 1GB حافظه DDR2 براي اين مدل استفاده نمودهاند از نوع DDR2-800MHz در اين استفاده کرده¬اند. اين تغيير، بدون شک جهت کنترل قيمت تمام شده محصول بوده است.
لابراتوار رايانه خبر براي اين مقاله دو مدل زير را تهيه کرده است :
Model : SPARKLE Nvidia Geforce 9500GT
Memory Type : GDDR3 1600MHz
Memory Size : 512MB
Memory Width : 128Bit
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey04_s.jpg
شکل 4 : مشخصات کارت انتخابي 1
Model : SPARKLE Nvidia Geforce 9500GT
Memory Type : DDR2 800MHz
Memory Size : 1024MB
Memory Width : 128Bit
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey05_s.jpg
شکل 5 : مشخصات کارت انتخابي 2
در حال حاضر اين دو مدل با قيمت مشابه حدود 90 هزار تومان در بازار ايران ( با گارانتي شرکت فاره ) موجود هستند.
همانطور که از مشخصات مدلهاي بالا نمايان است، ما دو مدل را انتخاب کرديم، به اين صورت که پهناي باند حافظه در مدل DDR3 دو برابر و از سوي ديگر حجم حافظه در مدل DDR2 2 برابر مدل DDR3 است.
در واقع هدف اصلي ما از اين مقاله، بررسي و تست شرايط بالا بود تا تاثيرات حجم و پهناي باند حافظه را در کارتهاي گرافيک با GPUهاي يکسان مشاهده کنيم.
شرايط تست :
براي تست کارتهاي گرافيک ياد شده از سيستم پلتفرم اينتل لابراتوار رايانه خبر استفاده نموديم.
جدول 1: جدول مشخصات سيستم تست
از آنجا که تقريبا تمام بازيهاي کامپيوتري مدرن بر پايه DirectX 10.0 پايه ريزي ميشوند، ما هم در تستها به غير از تست 3DMARK 06 تماما از بازيهاي کامپيوتري و نرم افزار معتبر بر پايه Direct X 10 بهره برديم.
همچنين اين پيشبيني را نيز کرديم که چون حافظه Local فقط زماني به خوبي محک ميخورد که تستها در رزوليشنهاي بالا و تنظيمات جزييات بازي بالا انجام شود، به همين دليل تست ها تماما با حداکثر رزوليشن قابل پشتيباني توسط يک مونيتور السيدي 20 اينچ رايج (1680 x 1050) و جزييات گرافيکي بالا انجام شده است. همچنين اگر FPS در حين تست قابل قبول بود از Anti-Aliasing نيز در تست استفاده کرديم.
تست(3DMARK 06 (DX 9.0
تست مزبور همواره يکي از بهترين تست ها جهت محک زنی کارتهاي گرفيک بوده، اين نرم افزار با استفاده از تستهاي مجزا، تکنيکهاي سايهزني رنگ Shader Model 2.0 و Shader Model 3.0 کارتهاي گرافيک را با تستهاي نسبتا سنگين ارزيابی می کند.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey06_s.jpg
شکل 6
آنچه از نگاه اول از نتيجه اين تست بدست ميآيد اين است که برتري 30% درصدي مدل 512MB DDR3 به روشني نمايان است.
تست(3DMARK Vantage (DX 10.0
اين تست بدون شک يکي از سنگينترين و در عين حال معتبرترين تستهاي Direct X 10.0 محسوب ميشود. اين تست به شدت در رزولوشنهاي بالا، حافظه Local موجود بر روي بورد کارت گرافيک را اشغال ميکند و از زواياي مختلف نظير استفاده از آخرين تکنولوژيهاي سايه زني رنگ (Shader model 4.0) و نور پردازي، GPU را مورد آزمايش قرار ميدهد. همچنين اگر کمي موشکافانه در حين تست اين نرم افزار CPU Usage را مشاهده کرده باشيد، متوجه ميشويد که تستهاي GPU اين نرم افزار به شدت نسبت به پردازنده ايزوله هستند، به بيان ديگر پردازنده در تست ياد شده خود را دخالت نميدهد يا اينکه تاثير بسيار کمي دارد و فقط کارت گرافيک است که مورد ارزيابي قرار ميگيرد. اين خصيصه، نرم افزار ياد شده را در زمره نرم افزارهاي کاملا تخصصي تست کارتهاي گرافيک قرار ميدهد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey07_s.jpg
شکل 7
در اين تست نيز برتري 40% درصدي، با مدل 512MB DDR3 است.
تست(Call of Juarez (DX 10.0
اين بازي يکي از بازيهاي پرفروش و در عين حال مدرن که در بسياري از منابع معتبر تست و بررسي سخت افزار، مرجع معتبري براي تست کارتهاي گرافيک است.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey08_s.jpg
شکل 8
در اين تست نسبتا سنگين نيز برتري 42% درصدي مدل 512MB DDR3 مشهود است. در واقع نتيجه به دست آمده براي هر دو مدل به دليل کم بودن FPS مناسب نيست، ولي هدف اصلي ما از اين تست تحت فشار قرار دادن هر دو مدل بود که به خوبي محقق شده است.
تست(Crysis warhead (DX 10.0
بدون شک، شاهکار کمپاني Crytek با بهره گيري از موتور گرافيکي قدرتمند Cry Engine تا به امروز، بهترين بازي از لحاظ گرافيکي است، در اين بازي کامپيوتري از آخرين تکنولوژيهاي سايه پردازي، سايه زني رنگها و همين طور جلوههاي واقع گرايانه تصوير براي داشتن طبيعيترين صحنهها، استفاده شده است.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey09_s.jpg
شکل 9
در اين تست نيز مدل 512MB DDR3 با اختلاف 33% درصدي، عملکرد بهتري نسبت به مدل 1GB DDR2 داشت.
تست(DEVIL MAY CRY 4 (DX 10.0
اين تست نيز، به دليل استفاده از جلوههاي واقع گرايانه بسيار مهيج و طرفداران کثير اين بازي، در بسياري از منابع تست و بررسي قطعات سخت افزاري مورد استفاده قرار ميگيرد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey010_s.jpg
شکل 10
در اين تست نيز، باوجود برتري 35% درصدي مدل 512MB DDR3، جايي براي بحث باقي نميماند.
تست(Far Cry 2 (DX 10.0
Far Cry 2 نيز با بهره بردن از موتور گرافيکي Cry Engine از آخرين تکنولوژهاي گرافيکي به کار رفته در بازيهاي کامپيوتري مدرن، پشتيباني ميکند، در اين بازي کامپيوتري شما ميتوانيد دورنمايي چند کيلومتري از جنگلهاي آفريقا را به همراه نور پردازي مثال زدني، مشاهده کنيد.
http://computernews.ir/Files/Gallery/2010/7/1GPU2ModelMemoey011_s.jpg
شکل 11
در آخرين تست اين مقاله نيز، کماکان مدل 512MB DDR3 حدودا 25% عملکرد بهتري نسبت به مدل 1GB DDR2 داشت.
نتيجه نهايي
همانطور که نتايج تستها نشان ميدهد، به طور ميانگين مدل 512MB DDR3 حدودا 34% از مدل 1GB DDR2 نتايجي بهتري کسب کرده است. در واقع حجم حافظه بيشتر حتي در رزوليشنهاي بالا نتوانست به هيچ وجه، ضعف پهناي باند حافظه را جبران کند. از سوي ديگر اگر نتايج را به صورت موشکافانه بررسي کرده باشيد، و احيانا از طرفداران بازيهاي کامپيوتري باشيد، متوجه خواهيد شد که مقدار فريم در ثانيه (FPS) در اکثر تستها کمتر از مقدار قابل قبول براي داشتن حداقل کيفيت مطلوب براي اجراي بازيهاي مورد نظر است ( اگر آستانه کيفيت مطلوب را 20FPS در نظر بگيريم ). در نتيجه، حتي براي داشتن کيفيتي مطلوبتر، بايد رزوليشن و جزئيات کمتري را براي اجراي قابل قبول بازيهاي کامپيوتري نام برده، به کار بگيريم.
در واقع اينطور ميتوان نتيجهگيري کرد که در کاربردهاي معمولي، نظير بازيهاي کامپيوتري، نرمافزارهاي فني مهندسي رايج و... حجم بيشتر حافظه گرافيکي Local، نسبت به مقدار استاندارد تعيين شده توسط کمپاني سازنده پردازنده گرافيکي، در کارتهاي گرافيک رده متوسط و رده ضعيف، به هيچ وجه راهکار مناسبي براي افزايش کارايي نهايي نيست. از طرفي ديگر همانطور که قبلا اشاره کرديم، کمپانيهاي تولید کننده کارتهاي گرافيکي براي کنترل قيمت تمام شده مدلهاي ياد شده، با افزايش حجم حافظه گرافيکي، از حافظههايي با سرعت کمتر استفاده ميکنند که در نهايت کاهش پهناي باند حافظه را به دنبال دارد. اين امر نيز همانطور که در اين تست و بررسي ديديم، نتيجه خوبي را به دنبال ندارد.
و سرانجام، در سخن پاياني ميتوان به اين نکته اشاره کرد که در کارتهاي گرافيکي امروزي که پردازندههاي گرافيکي نقش بسيار بيشتري نسبت به پردازنده مرکزي در اجراي جلوههاي سه بعدي دارند ، حجم حافظه گرافيکي بيشتر نميتواند عاملي براي برتري باشد، بلکه پهناي باند حافظه است که نقش محوري تري در اين امر دارد.
اين 2 مدل کارت گرافيک اسپارکل را شرکت محترم شرکت فاره رايانه فرد جهت تست و نگارش مقاله در اختيار لابراتوار ماهنامه رايانه خبر قرار داد که بدين طريق از اين همکاري، صميمانه قدرداني ميگردد.