بررسی باب کت، یک معماری جدید از amd

**shirin71** · 07-03-2011 10:09 PM

رقابت بر سر پردازنده ها تمامی ندارد و هر گاه این رقابت جنبه خاصی را شامل می شود. زمانی رقابت بر سر افزایش فرکانس بود، زمانی بر سر افزایش تعداد هسته ها و سطح اورکلاک و امروزه بر سر ارائه معماری های جدید برای عملکرد بالاتر و تعداد هسته های بیشتر. این بار شرکت AMD دو معماری جدید خود را معرفی کرده که دو بازار متفاوت را هدف می گیرند. معماری Bobcat، برای بازار پردازنده های کم مصرفی ارائه شده که در نت بوک ها، تبلت ها و اسمارتفون های استفاده می شوند. معماری Bulldozer برای بازار پردازنده های با کارایی بالا طراحی شده است. پس همراه ما باشید تا از جزئیات کامل معماری Bobcat اطلاع پیدا کنید. جزئیات معماری Bulldozer نیز به زودی توسط نارنجی منتشر خواهد شد.

-در اعماق یک Bobcat:

ابتدا یک دیاگرم سطح بالا را به نمایش خواهیم گذاشت و پس از آن، مرحله به مرحله، به بررسی کامل جزئیات این نمودار می پردازیم. معماری باب کت برای رقابت با پردازنده های Atom اینتل عرضه شده است؛ البته برخی از اجزاء این معماری، شبیه سری اتم اینتل می باشند اما پردازنده های جدید و کم مصرف AMD که بر پایه معماری باب کت عرضه می شوند، ملاک های متفاوتی را برای پردازش در نظر می گیرند. در واقع استاندارد های جدیدی هستند که در پردازنده های جدید رعایت می شوند و بسیاری اعتقاد دارند که همین استاندارد ها باعث عملکرد بهتر پردازنده ها شده است، معماری باب کت نیز آن ها را رعایت می کند و در عین حال با ملاک های جدیدی که در پردازش خود در نظر گرفته، انتظار می رود که پردازنده های (مشابه) سری Bobcat از سری Atom اینتل پیشی بگیرند. البته در این مورد باید مثل همیشه منتظر بنچمارک ها باشیم.

حالا زمان توضیحات فرا می رسد: در دیاگرم بالا، 64 کیلوبایت کش از نوع L1 در نظر گرفته شده است که 32 کیلوبایت آن، برای دستورات و 32 کیلوبایت دیگر برای داده ها استفاده می شود. همچنین در هر هسته 512 کیلوبایت کش L2 وجود دارد. یعنی پردازنده ی دو هسته ای دارای یک مگابایت کش L2 خواهد بود.

اما میرسیم به بخش کد گشایی یا همان Decoding که در دیاگرم بالا با رنگ قرمز دیده می شود: درست مانند پردازنده های Atom، باب کت هم از یک کدگشای دو گانه برای کدگشایی دستورات x86 استفاده می کند. از زمانی که سری پنتیوم پرو عرضه شد، تقریبا تمام ریز پردازنده ها کد های x86 را قبل از هر کاری در قسمتی به نام Micro-ops به کد هایی ترجمه می کردند که بتوانند آن ها را مورد پردازش صحیح قرار دهند. زمانی که اینتل معماری پردازنده های سری Atom را رونمایی کرد، اعلام شد که این پردازنده ها می توانند دستورات x86 را بدون نیاز به ترجمه در قسمت Micro-ops، اجرا کنند. در عوض می تواند ترکیبی از دستورات دیگر را در این قسمت ترجمه کند. در این جا دو سوال متداول وجود دارد که باید به آن پاسخ بدهیم.

اول از همه بسیاری می گویند: دستورات x86 چیست؟ دستورات x86، دستورات 32 بیتی هستند که توسط سیستم عامل به پردازنده داده می شوند. البته این دستورات فقط برای سیستم عامل نیست و بسیاری از برنامه های 32 بیتی نیز از این نوع دستورات در کد های خود استفاده می کنند. دستورات x86 از زمانی متداول شدند که اینتل پردازنده های 32 بیتی را روانه بازار کرد و همگان به مزایای بالا و گسترده بودن اعمال قابل انجام توسط این پردازنده ها پی بردند و پس از آن، این پردازنده ها گسترش زیادی یافتند.

سوال دوم این است که پردازش غیر مستقیم دستورات x86 چه ضرری دارد؟ به این سوال هم جواب دادیم: از سری پنتیوم پرو به بعد، پردازنده ها این دستورات را به طور مستقیم اجرا نمی کردند، بلکه در قسمت Decoding و در بخش هایی به نام Micro-Op این دستورات را ترجمه کرده و سپس آن ها را مورد پردازش قرار می دادند. این موضوع از دو نظر باعث اتلاف زمان می شد: یکی این که دستورات x86 بسیار متداول هستند و این یعنی بسیاری از دستورات نیاز به ترجمه داشتند. دوم این که دستورات x64 و 64 بیتی نیز وجود دارند که هنوز آن قدر متداول نشدند اما بیشتر این دستورات هم نیاز به ترجمه دارند و این یعنی مشغول شدن بیشتر Micro-Op ها و کم شدن کارایی.

AMD اعلام کرده که پردازنده های Bobcat می توانند 89 درصد دستورات x86 را به طور مستقیم اجرا می کند.یعنی در این فرایند 89 در صد دستورات x86 فقط با درگیر کردن یک Micro-Op ترجمه می شوند و 10 در صد ، مانند گذشته در رشته ای از Micro-Op ها پردازش خواهد شد. بقیه اطلاعات که کم تر از 1 درصد را شامل می شود، در قسمت Micro-Coded، کد گشایی می شود. این هم یکی دیگر از مواردی است که شبیه به سری اتم اینتل طراحی شده. مزیت این طراحی این است که وقت کمتری برای پردازش دستورات تلف شده و به این ترتیب عملکرد پردازنده سریع تر و موثر تر خواهد شد.

قصد نداریم در این مقاله سراغ اطلاعات جزئی و پیشرفته ای مانند عملکرد ارگان های FPU یا ALU (قسمت های نارنجی و فیروزه ای نمودار بالا) برویم. اما در این مورد باید بگوییم، که عملکرد آن ها هم مانند بسیاری از پردازنده های سطح بالا می باشد. انگار که ای ام دی تمام ویژگی های مفید را به سرقت برده، اگر چه فکر نمی کنم این کار ها را با سرقت کردن انجام داده باشد. از این که بگذریم، باید گفت که هنگامی که سری Atom ساخته شد، اینتل سعی کرده بود از ارگان های پردازشی-اجرایی نسبتا کمی در پردازنده ها استفاده کند و گرما و توان مصرفی پایین را به عنوان توجیهی برای این کار مطرح می کرد. اما AMD با این مساله تفاهم چندانی ندارد. AMD می گوید، قدرت را فدای مصرف انرژی نمی کند. بنا بر این با نگاهی به نمودار بالا متوجه خواهید شد که این پردازنده در ارگان های پردازشی – اجرایی (در قسمت های نارنجی و فیروزه ای شاهد آن ها هستید) هم چیزی کم نگذاشته است.

کش L2 باب کت که 512 کیلوبایت گنجایش دارد، از نوع کش های 16-Way می باشد. این کش ها به این صورت عمل می کنند:

البته چیزی که در تصویر مقایسه ای بالا می بینید، مربوط به کش های 2-Way می شود، اما به همین نسبت برای کش های 16-way هم صدق خواهد کرد. بنابر این در کش های 16 راهی، هر واحد حافظه می تواند در یکی از 16 واحد، کش شود. اما در کش های مستقیم، هر واحد حافظه به یک واحد در کش منتقل می شود. پس می توان دریافت که بهره وری کش های با WAY های بالاتر، بیشتر است.

پس Bobcat دارای یک کش 512KBL2 16-Way؛ است اما باید به آن سیستم ECC را اضافه کنید، که سیستم برطرف کردن خودکار خطا ها می باشد. این کش برای مصرف کم تر، با نصف سرعت اش کار می کند. البته این دقیقا به این معنا نیست که این کش به طور پیش فرض از 50 در صد کلاک پایه استفاده می کند یا این که وقتی کم کار است ، 50 درصد کار می کند.

-پایپ لاین ها: اول از همه اگر به این سوال فکر می کنید که پایپ لاین چیست، به مطلب بررسی کرتکس و تگرا 2 در نارنجی مراجعه نمایید. اما نمودار زیر، تصویری است از نوع پایپ لاین های این سری و عملکرد آن ها.

در کل این سری، از پایپ لاین های 15 مرحله ای استفاده می کند که شش مرحله گردشی اصلی دارد و سه قسمت از آنها مربوط به شاخه براورد محاسبه ای، با زمان تاخیر 13 دور می باشد و باید گفت که ای ام دی در مورد علت این کار چیزی توضیح نداده است. در مقابل پایپ لاین های پردازنده اتم 16 مرحله ای می باشند. انتظار می رود با این وجود، پایپ لاین ها کمی موثر تر واقع شوند. زمان تاخیر کش L1 در این معماری برابر با 3 دور برای لود و زمان تاخیر کش L2، 17 دور برای لود می باشد.

-سخن آخر و چند نکته هیجان انگیز:

پردازشگرهای اتم شرکت اینتل در طی دو سال و نیم گذشته، به خوبی خود را در بازار نت بوک ها شناسانده است. اگر چه ای ام دی نیز قصد دارد چنین کاری را انجام دهد؛ اما معتقدیم که به بار نشستن باب کت، مقداری زمان خواهد برد. پردازنده Ontario که یک پردازنده دو هسته ای بر پایه معماری باب کت است؛ در سال 2011 به بازار عرضه خواهد شد. این پردازنده مطمئنا نخواهد توانست که در ماه های اول، کسب و کار اتم را در بازار های جهانی کساد کند. هر چند که احتمالا در عملکرد از اتم بهتر خواهد بود. باز هم باید منتظر رویارویی این دوچیپ باشیم تا ببینیم نتیجه به نفع کدام یک رقم می خورد.

اما اگر به بخش پردازنده گرافیکی این چیپ مراجعه کنیم، می بینیم که اوضاع خوب پیش می رود. در سال 2012 پلتفرم Brazos از طرف ای ام دی عرضه خواهد شد که از پردازنده Ontario ، پردازنده گرافیکی مبتنی بر DX11 و حافظه DDR3 پشتیبانی می کند. اما من دوست دارم به این فکر کنم که اینتل یک GPU جدید را برای پردازنده های Atom ، عرضه کرده و همه را حیرت زده کند. اگر چه این چندان حیرت آور نیست اما جالب تر این است که اگر اینتل از پردازنده های گرافیکی ساخت AMD احساس خطر کند، ممکن است در برابر انویدیا تغییر لحن دهد و با انویدیا متحد شود تا بر AMD غلبه کند. اگر این طور باشد، اوضاع سختی برای AMD پیش می آید، هر چند که مهم ترین داور این رقابت، کاربران خواهند بود.

منابع: Hothardware