سیستم ذخیره انبوه آنالیز تجربی
سیستم ذخیره انبوه آنالیز تجربی – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 48000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۶۰ |
کد مقاله | COM60 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | آنالیز تجربی سیستم ذخیره انبوه |
نام انگلیسی | Experimental analysis of a mass storage system |
تعداد صفحه به فارسی | ۴۳ |
تعداد صفحه به انگلیسی | ۲۲ |
کلمات کلیدی به فارسی | کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID |
کلمات کلیدی به انگلیسی | RAID controller, disk, IBMDS4300, IBMFAStT600, mass storage systems, parallel computing, performance evaluation, RAID |
مرجع به فارسی | دپارتمان مهندسیبرق، دانشگاه مهندسیو تکنولوژی، لاهور، پاکستاندپارتمان انفورماتیک بیوپزشکی، دانشگاه اوهایو، آمریکامرکز سوپرکامپیوتر اوهایو |
مرجع به انگلیسی | Department of Electrical Engineering, Biomedical Informatics, Ohio Supercomputer Center |
کشور | ایالات متحده |
آنالیز تجربی سیستم ذخیره انبوه
چکیده
سیستم های ذخیره انبوه (MSSs) نقش مهمیرا در محاسبات موازی دادههای فشرده بازی میکنند. اخیرترین کاربرد سیستمهای ذخیره انبوه در آرایههای افزونگی دیسکهای مستقل/ ارزان (RAID) به کار گرفته شد که در آن دیسک های وابسته در کنار یکدیگر همراه با سخت افزار کنترلر خاص قرار داده شدهاند. پیش بینی عملکرد چنین سیستمهایی مشکل میباشد، چرا که غالب جزئیات داخلی رفتار کنترلر هنوز به صورت اطلاعات عمومیعرضه نشدهاند. در این مقاله جهت ارزیابی تجربی عملکرد سیستمهای ذخیره انبوه از یک روش سیستماتیک بهره گرفته شده است که از طریق آن برآوردها و سنجش هایی بر روی یک سری از پیکربندیهای RAID با اندازه افزایشی و پیچیدگی فزاینده حاصل شده است. ما از این روش جهت بررسی سیستم ذخیره انبوه مرکز سوپر کامپیوتر اوهایو بهره گرفتیم. در این مرکز ۱۶ پردازنده ورودی و خروجی قرار داشته که هر کدام از آنها به چهار سیستم ۸+۱ RAID5 متصل بوده و بر این اساس قابلیت فراهم آوردن ۱۲۸ ترابایت (TeraByte) از فضای ذخیره سازی مهیا شده است (این مقدار فضا پس از فرمت ۱۱۶٫۸ TB را در اختیار قرار خواهد داد). روش بکار گرفته شده در این مبحث به طراحان سیستم ذخیره سازی اطلاعات اجازه میدهد تا با اطمینان قابل توجهی از نقطه نظر تجربی به ارزیابی عملکرد سیستم های خود بپردازند. با وجود آنکه آزمایشات خود را بر اساس محتویات یک سیستم خاص انجام دادهایم، روش بکار گرفته شده برای کلیه سیستم های ذخیره اطلاعات بزرگ قابلیت کاربرد را دارا خواهد بود. روالهای سنجش و اندازه گیری حاصل شده از طریق این روش به برنامه نویسهای کاربردی اجازه میدهد تا از محدودیت های عملکرد کدهای برنامه های خود آگاه شوند.
کلمات کلیدی: کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID
سیستم ذخیره انبوه آنالیز تجربی
۱- مقدمه
کاربردهای سطح بالای محاسبات کنونی و مقولههای ارائه شده در رشتههای فیزیک، نجوم و بیوانفورماتیک که بصورت فزآینده و گستردهای مطرح شدهاند، دسترسی پایدار به مجموعههای اطلاعاتی در محدوده پتابایت (petabyte) را طلب مینمایند. در مبحث ذخیره سازی انبوه چنین نیازهایی را تنها با بهره گیری از مجموعهای از دیسک های بزرگ میتوان پاسخگو بود که تحت عنوان آرایههای افزونگی دیسکهای مستقل/ ارزان (RAID) خوانده میشوند. اغلب دیسک های RAID با عملکرد و ظرفیت بالا از کنترلرهای قدرتمندی استفاده میکنند، با این حال پیشبینی میزان عملکرد آنها مشکل میباشد، چرا که اطلاعات اندکی در خصوص جزئیات داخلی چنین کنترلرهایی، بوسیله سازندگان آن، در اختیار عموم قرار گرفته است. کاربران این سیستمها نمیتوانند اطمینان داشته باشند که آیا عملکرد حاصل شده از طریق چنین سیستمهایی را میتوان براستی به عنوان حداکثر توانایی مطلوبی بشمار آورد که سخت افزارهای آنها میتوانند انجام دهند یا خیر. علاوه بر این، در صورتی که سخت افزارهای حاضر قابلیت بکارگیری چنین سیستمهایی را نداشته باشند سوال پیش روی اینگونه مطرح خواهد شد که تنگنا و مشکل مربوطه در چه قسمتی بوجود میآید؟
این مقوله روشی را عرضه میدارد تا بر اساس آن بتوان نسبت به ارزیابی تجربی سیستمهای ذخیره سازی انبوه (MSSs) اقدام نمود. انگیزه تحقیقات ما نیز بر پایه نیاز جهت درک عملکرد سیستم ذخیره انبوه، در مرکز سوپر کامپیوتر اوهایو (OSC)، استوار بوده است. این سیستم بر مبنای یک مخزن کنترلرهای ذخیره سازی IBM FAStT600/DS4300 همراه با ۱۶ پردازشگر اختصاصی (ورودی / خروجی (xio)) اینتل پنتیوم ۴ و ۵۷۶ دیسک مکستور (Maxtor) با فضای ۱۱۶٫۸ TB بنیان شده است. با این وجود روشی که تشریح میکنیم برای کلیه آرایههای RAID قابل استفاده میباشند.
این مقاله به شکل ذیل طبقه بندی شده است. بخش ۲ مشکلات مربوط به پیش بینی عملکرد RAID را مورد بررسی قرار داده و بر این اساس یک اسلوب سه مرحلهای پیشنهادی را عرضه میدارد. بخشهای۳،۴و۵ چگونگی کاربرد روش سه مرحلهای ما برای مخزن OSC FAStT600 را تشریح میکند و در نهایت بخش ۶ نتیجه گیری موارد فوق الذکر را ارائه میدارد.
سیستم ذخیره انبوه آنالیز تجربی
۲- روش شناسی
۱-۲ عملکرد آرایه های RAID
تکنولوژی RAID بسرعت در اوایل دهه ۱۹۹۰ توسعه یافت، از این تکنولوژی برای ساخت حافظه ثانویه دارای سرعت و حجم بالا و مطمئن در دیسکهای سخت ارزان قیمت استفاده شده است. این مبحث موارد ذیل را در بر میگیرند. بحث مدلسازی عملکرد درایو دیسک، بررسی موارد و ارتقای حاصل شده اخیر، نرخهای کارای خواندن و نوشتن دستگاههای RAID با انواع مختلف اندازه های متفاوت.
اخیراً آرایه های دارای عملکرد بالا و ظرفیت بالای RAID در زمینه های سخت افزار کنترلر به کار گرفته شده اند. قابلیتهای چنین کنترلرهایی غالباً به عنوان عامل قابل توجه جهت تشخیص عملکرد کلی یک سیستم مدنظر میباشد. متأسفانه، جزئیات داخلی چنین کنترلرهایی به ندرت به صورت آشکار برملا گردیده است و مستندات قابل توجهی درباره آنها وجود ندارد. در نتیجه، مدیران سیستمی و کاربران آرایه های RAID بزرگ غالباً از این موضوع اطمینان ندارند که آیا قادر به تحصیل حداکثر عملکرد ممکن با منابعی که در اختیار آنها میباشد خواهند بود یا خیر.
۲-۲ روش پیشنهادی
ما یک فرآیند سه مرحلهای را برای ارزیابی تجربی یک سیستم ذخیره انبوه پیشنهاد میکنیم.
بررسی معماری سیستم جهت مشخص نمودن اجزایی که عملکرد آنها را میتوان به صورت مجزا تحت مطالعه قرار داد.
مشخص نمودن تنگناهای بالقوه در سیستم. در صورت امکان، بررسیهای ساده و کسب تجربه در زمینه اجزای واحد جهت مشخص نمودن تنگناهای وابسته بدان. بطور مثال، نرخ I/O ناخالص یک دیسک واحد را میتوان به آسانی اندازه گیری نمود و از این طریق نسبت به مشخص نمودن موانع تئوریکی قابل توجه در زمینه عملکرد آن اقدام کرد. در این بررسی میتوان یک یا دو جزء که به احتمال قوی به عنوان تنگناهای اساسی مدنظر میباشند را مورد بررسی قرار داد.
انجام یک سری از برآوردها بر روی آرایه های RAID دارای اندازه های مختلف، که در حول و حوش سخت افزار استفاده شده در سیستم مقصد، پیکر بندی گردیدهاند.
سیستم ذخیره انبوه آنالیز تجربی
۳- مرحله ۱: مطالعه معماری
نگرش یک برنامه نویس کاربردی در زمینه OSC کلاستر اینتل پنتیوم ۴ زئون (XEON) در شکل ۱ مشخص شده است. چنین مقوله ای متشکل از ۲۵۶ گره کامپیوتری میباشد که به ۱۶ گره های xio متصل گردیده و ۱۱۲ نمونه از چنین پردازشگرهایی به ۱۶ گره xio از طریق یک شبکه Infiniband سوئیچ شده با نرخ داده s-1 Gbit8 متصل گردیدهاند. کلیه ۲۵۶ گره کامپیوتری نیز به ۱۶ گره xio، از طریق یک سوئیچ اترنت گیگا بایت، متصل شده اند. هر گره xio میتواند یک دستگاه دیسک RAID چهار سویه را کنترل نماید. در حقیقت، هریک از این دیسکها در این ۰RAID به یک دستگاه ۵RAID 8+1 مپ شدهاند که موارد مرتبط ذیلاً مورد بحث قرار میگیرند.
سیستم های ۵RAID دارای پارامترهای تعیین و تصحیح خطا میباشند. نرخ خواندن و نوشتن در ۵RAID، در عمل، در حدود ۸ یا ۹ برابر سرعت هر یک از دیسکها به صورت منفرد میباشد. در حقیقت، اورهدهای سخت افزار کنترلر۶۰۰FAStT نرخهای تجمعی، بسیار متمایز از موارد ارائه شده در مضامین تئوریکی، را ارائه میدهند.
۱-۳ اجزای سیستم
۱-۱-۳ ۶۰۰FAStT
سرور ذخیره اطلاعات ۶۰۰FAStT IBM(توربو) از جمله عنصر کلیدی مخزن اطلاعات OSC میباشد. این سرور قابلیت پشتیبانی از ۱۱۲ درایو سخت با مجموع ظرفیت ۴/۱۶ ترابایت را دارا میباشد. هریک از این سیستم های ۶۰۰FAStT دارای کنترلر دوبل بوده و آنها را میتوان به گونهای پیکربندی نمود تا پیکربندیهای RAID مختلفی را به جهان بیرون عرضه دارند. به طور مثال، شکل ۵ نشان دهنده یک ۶۰۰FAStT میباشد که آن را به شش روش مختلف برای اهداف تجربی خود پیکربندی نموده ایم (که بعداً در این مقاله تشریح خواهند شد). بکارگیری این پیکربندی، در یک کاربری معمولی در OSC، در انتهای این تصویر نشان داده شده است. در این مورد ۳۶ دیسک تحت ۴ دستگاه ۵RAID که هرکدام متشکل از ۹ دیسک میباشند در نظر گرفته شده و هریک از کنترلر ها به ۲ LUN تخصیص داده شدهاند. علاوه بر این میتوان از موارد نصب متفاوتی بهره گرفت، به طور مثال، دو سیستم ۵RAID 14 دیسکی را میتوان در نظر داشت. معماری و عملکرد کنترلر۶۰۰FAStT بعداً مورد بحث قرار خواهد گرفت.
۲-۱-۳ دیرکتور سیسکو ۹۵۰۹ (Cisco Director)
دور سوئیچ کانال فیبری دیرکتور سیسکوی ۹۵۰۹ در سیستم OSC بکار گرفته شدهاند تا آنکه بتوان واحدهای ۶۰۰FAStT را به پردازنده های xio مدنظر متصل نمود. چنین اتصالاتی به صورت ایستا بوده و تحت کنترل مدیران سیستم میباشند.
۳-۱-۳ دیسکهای مکستور
دیسکهای استفاده شده در مخزن ذخیره ۶۰۰FAStT در حقیقت مکستور ۷Y250M0 SATA میباشند (SATA مخفف «الحاق تکنولوژی پیشرفته سریال» است)، این دیسکها از ظرفیت ۲۵۰ گیگا بایتی برخوردار میباشند. جدول ۱ نشان دهنده پارامترهای اصلی این دیسک میباشد که مرتبط با مبحث جاری هستند. علاوه بر این این نکته قابل توجه میباشد که تکنولوژی «ثبت ناحیهای» (Zone recording) در این دیسک بکار گرفته شده است. این امر بدان معناست که تعداد سکتورها در هر ترک با توجه به قطر آن متفاوت میباشد. این موضوع خود بعنوان یک جبران برای افزایش محیط ترک ها با افزایش قطر آنها مطرح خواهد بود. بر این اساس ۱۶ ناحیه بر روی هر سطح دیسک وجود دارد و تعداد ۵۱۲-Bسکتور نیز دیده میشود که از ۶۱۰ در ناحیه داخلی الی ۱۱۰۲ تا ناحیه بیرونی متفاوت میباشد (جدول ۲).
۲-۳ گرههای xio
۱۶ پردازنده xio در مخزن ذخیره FAStT600 وجود دارند که هرکدام از آنها به آرایه ۵RAID 8+1 چهار سویه متصل میباشند. این پردازندهها در حقیقت پردازنده دوتایی اینتل پنتیوم ۴ زئون (Xeons) با سرعت ساعت ۴/۲ گیگا هرتز و رم ۴ گیگابایت میباشند که تحت سیستم عامل لینوکس ۲٫۶٫۶ (زنجیرههای هایپر) اجرا میشوند، بگونهای که پردازنده های دوبل به نظر چهار پردازنده مجزا جلوه مینمایند. این امر یکی از نقاط قابل توجه برای برنامه نویسان میباشد چرا که چنین پدیده ای به معنای آن خواهد بود که کدینگ نوشته شده به وسیله ۴ الی ۸ زنجیره به خوبی بر روی این ماشین ها اجرا خواهد شد.
سیستم ذخیره انبوه آنالیز تجربی
۴- مرحله ۲: شناسایی تنگناهای بالقوه
تعداد زیادی از تنگناهای بالقوه بین پردازنده xio و رسانه مغناطیسی در دیسکها وجود دارند. این موارد در شکل ۴ نشان داده شده اند. بخش های ذیل مباحثی را در زمینه اهمیت هریک از تنگناهای بالقوه مطرح میسازند. انگیزه این مبحث رویارویی با این حقیقت میباشد که با وجود آنکه ۳۶ دیسک (که هریک از آنها با حداقل نرخ خواندن داده پایدار برآورد شده ۳۴٫۵ MBs-1 میباشند) متصل به هر یک از پردازندههای xio وجود دارند، نرخ خواندن دادهها به صورت پایدار در این پردازنده xio بیش از مقدار حدوداً ۳۰۰ MBs-1 نمیباشد، که بسیار کمتر از محدوده سقف تئوریکی (۳۶ × ۳۴٫۵ =) ۱٫۲۴۲ GB s-1 خواهد بود. برخی از عناصر این زنجیره بین رسانه مغناطیسی و پردازنده xio عملکردی مشابه با یک تنگنا را خواهند داشت. حال اجازه دهید تا هر یک از این احتمالات را مورد بحث قرار دهیم.
۱-۴٫ فایل سیستم
فایل سیستم ext3 بر روی گرههای xio بدون شک بر عملکرد کلی سیستم تأثیرگذار میباشد. با این وجود، آزمایشی که در شکل ۳ تشریح شده است معرف این نکته است که چنین فایل سیستمی قابلیت پشتیبانی از نرخ انتقال نزدیک به نرخ های انتقال داده خام این دیسک به هنگامیکه سیستم FAStT600 بایپاس میشود را خواهد داشت. از اینرو فایل سیستم ext3 را نمیتوان به عنوان عامل اصلی تأثیرگذار بر روی عملکرد سیستم بشمار آورد.
۲-۴٫ پهنای باند باس
باسهای داخلی پردازندههای xio بگونهای طراحی شدهاند که میتوانند از پردازنده های ۴/۲ گیگاهرتز پنتوم ۴ پشتیبانی نموده و دارای پهنای باند مرتبه GB s–1 میباشند. چنین موردی تا زمانی که I/O مد نظر میباشد را نمیتوان عامل بوجود آورن تنگنا برای سیستم بشمار آورد.
۳-۴٫ لینک های کانال فیبری
دو لینک کانال فیبری بین کنترلرهای FAStT600 و هر یک از پردازندههای xio وجود دارند. هریک از این لینک ها دارای یک پهنای ۲۱۲٫۵ MB s-1 میباشند که به صورت ترکیبی پهنای باند ۴۲۵ MB s-1 برای پردازنده xio را بوجود میآورند. این امر به میزان قابل توجهی بیشتر از حداکثر نرخ های دادهای میباشد که ما نسبت به سنجش آنها از/ به دیسکها در طی بایپس نمودن FAStT600 اقدام نموده ایم.
۴-۴. سوئیچ Cisco
این سوئیچ در حقیقت یک سوئیچ غیر انسدادی میباشد که کاملاً قابلیت پشتیبانی ترافیک ۲ GB s–1در هر پورت را دارا میباشد. علاوه بر این، این سوئیچ به صورت آماری جهت اتصال FAStT600 به پردازندههای xio مورد استفاده قرار میگیرد، بنابراین هیچگونه رخدادهای وابسته به روال های تأخیری سوئیچینگ را شاهد نخواهیم بود. بر این اساس چنین سوئیچی قابلیت پشتیبانی ترافیک ۴۲۵ MB s–1، که به وسیله لینک های کانال فیبری عرضه میشود، را خواهد داشت.
۵-۴ دیسک: لینک SATA ، مکانیکی و کنترلر
پیک نرخ داده SATAبه میزان ۱۵۰MB s-1 میباشد (جدول ۱). نرخ ثابت داده احتمالاً بسیار کمتر خواهد بود. مشخصههای دیسک مکستور ۷Y250M0 در جدول ۲ نشان داده شده است که معرف نرخ های انتقال ثابت یا پایدار ۳۷–۶۷ MB s–1 میباشد. آزمایشاتی که بر روی دیسکهایی که به صورت مستقیم متصل شده اند (شکل ۳) و موارد دیگر موکد نرخ های انتقال پایدار ۳۴٫۵–۶۰٫۵ MB s–1 بوده اند. از آنجائیکه حداقل ۳۶ دیسک به هریک از کنترلرها متصل شده بود، ما به صورت جمعی نرخ حداقل (۳۴.۵ × ۳۶ =) ۱.۲۴۲ GB s–1 به کنترلر FAStT600 را فراهم ساختیم. از اینرو، یک دستگاه دیسک (متشکل از لینک SATA، کنترلر دیسک و رسانه مغناطیسی) را نمیتوان به عنوان تنگنا در نظر گرفت.
۶-۴٫ کنترلر FAStT600
این دستگاه که دارای برچسب کنترلر FAStT600 میباشد در حقیقت از ۲ آداپتور باس میزبان تشکیل شده است که به دو کنترلر RAID متصل گردیدهاند. رفتار داخلی کنترلر RAID ناشناخته میباشد و اینگونه تخمین میزنیم که چنین مواردی ممکن است به عنوان تنگناهای اساسی این سیستم در نظر گرفته شوند.
سیستم ذخیره انبوه آنالیز تجربی
۵- مرحله ۳: یکسری از روالهای اندازه گیری
۱-۵٫ شش پیکر بندی تجربی
در امتداد با روش تشریح شده در بخش های اولیه این مبحث، نسبت به انجام یک سری از آزمایشات، مشتمل بر ۶ مورد، بر روی RAID اقدام نمودیم که از نظر اندازه از دیسک های ۱ الی ۳۶ همانگونه که در شکل ۵ نشان داده شده است متفاوت بوده اند. جهت راحتی کار، از ایده nC:m(r) برای معرفی یک مجموعه مورد نظر با n کنترولر و m LUN اقدام نمودیم و در این زمینه (r) معرف پیکربندی ۵RAID در یک lun میباشد. به طور مثال، پیکربندی ۱C:2 × (۸ + ۱)یک روال نصب کنترلر واحد با ۲ (۸+۱) RAID میباشد. هدف این سری از آزمایشات نشان دادن این نکته میباشد که عملکرد RAID های بزرگتر متوالی به صورت یکنواخت افزایش یافته است و همچنین حداکثر عملکرد ۲C:4 × (۸ + ۱) RAID)) نیز بوسیله RAID های کوچکتر پیش بینی شده است.
۲-۵ تجربههای مربوط به خواندن
جهت تست عملکرد خواندن، ما در ابتدا با این مانع مواجه شدیم که چگونه میتوانیم انواع مختلف حافظه cache یا حافظه پنهانی را خالی سازیم. برای فایلهای بحد کفایت بزرگ، این مورد در حقیقت یک مشکل حاد بشمار نمیآید چرا که در نهایت میزان کفایت حافظه cache وجود خواهد داشت، اما هدف ما حصول اطمینان کافی از عملکرد فایلهای کوچکتر نیز میباشد. از آنجا که نمیتوانیم سیستم را مجدداً بوت نماییم یا آنکه فایل سیستم ها را مجدداً نصب و برپا کنیم، باید گزینه دیگری را در نظر بگیریم. جهت خالی کردن cache کرنل، در ابتدا اقدام به نوشتن بر روی فایلی نمودیم که دو برابر اندازه رم ماشین بوده است و سپس آن فایل را از طریق دستور «sync» بر روی دیسک ذخیره و بعدا پاک نمودیم. جهت اطمینان بعدی از آنکه cache کنترلر FAStT600 پاک شده است، از طریق یک فایل مجازی (dummy) اقدام به خواندن نموده که این فایل نیز دو برابر اندازه رم کنترلر بوده است (به میزان یک گیگا بایت). …
۱-۲-۵٫ ۱C:1 × (۱): یک دیسک واحد
یک دیسک واحد متصل شده به یک FAStT600 نمیتواند یک سیستم RAID را تشکیل دهد. با این وجود، عملکرد اندازهگیری شده (شکل ۶) معرف بینش لازم در خصوص اورهدها در کنترلر FAStT600 میباشد. در این حالت، هیچگونه مزیتی در وجود حالت چند زنجیرهای، همانند مواردی که از این حالت جهت خواندن از یک دیسک اقدام میشود و منجر به بروز رقابت میگردد، متصور نخواهد بود. اندازه بافر دارای تأثیر اندکی میباشد. نرخ داده مشخص شده به میزان قابل توجهی با توجه به اندازه فایل افزایش خواهد یافت و حداکثر تحصیل شده به میزان ۴۳ MB s–1 خواهد بود که بیشتر از نرخ داده خوانده شده مستقیم حداقل ۳۴٫۵ MB s–1 (از خواندن تراک داخلی) که در شکل ۳ گزارش شده است، میباشد. دلیل این امر نیز بدین علت است که یک دیسک ۶۶ گیگا بایتی در حدود ۲۵% یک دیسک واحد را تشکیل داده و از اینرو نمیتواند محدود به تراک های داخلی (نرخ داده اندک) باشد.
۲-۲-۵٫ ۱C:1 × (۴ + ۱) : دیسک ۵ تایی RAID5
در این آزمایش (شکل ۷)، یک RAID5 متشکل از ۵ دیسک مشخص شده است (۴ دیسک داده و یک دیسک توازن). در اینجا یک تأثیر مثبت کوچک در زمینه افزایش اندازه بافر وجود دارد و یک مورد کاهش در عملکرد با توجه به افزایش چند زنجیرهای بچشم میخورد. حالت آخری از احتمال بیشتری برخوردار میباشد چرا که چنین سیستمینمیتواند از درخواستهای چندگانه پشتیبانی به عمل آورد. میزان نرخ حداکثر خواندن داده ها در حدود ۸۵ MB s–1 میباشد. این میزان در حقیقت نصف مقدار تئوریکی [(۴ + ۱) × ۳۴.۵] = ۱۷۲.۵ MB s–1 (بر مبنای تراک داخلی، نرخ خواندن مستقیم) میباشد.
۳-۲-۵٫ نواحی داده و FAStT600
ما بر روی یک RAID ۴+۱ ما تستی را جهت تعیین این موضوع که آیا زمانهای خواندن برای فایل هایی که قبلاً در یک فایل سیستم خالی در برابر فایل هایی که بعداً ساخته شده اند تفاوت خواهند داشت یا خیر انجام دادیم. بر روی یک دیسک واحد متصل شده به صورت مستقیم به یک pc یا کامپیوتر شخصی یک تنوع آشکار همانگونه که در شکل ۳ دیده میشود وجود دارد. فایلهای اولیه براساس انتظار در نزدیک ترکهای خارجی وجود آمده اند که خود موجب عمل خواندن سریعتر در مقایسه با فایلهای بعدی که در قسمت حلقههای داخلی تولید میشوند خواهد شد. ما ۱۶ فایل را بوجود آوردیم که پارتیشن مجازی۴+۱ RAID5 را به میزان ۱ ترابایت تحت پوشش قرار دادهاند. هر یک از فایل ها با ظرفیت ۵/۵۴ گیگابایت در نظر گرفته شده و ۱۶ فایل به صورت جمعی میزان ۸۸۴ گیگا بایت از ۹۲۸ گیگا بایت کل فضای موجود را اشغال نموده اند (یعنی ۹۵%). با چنین استفاده بالایی، تأثیرات نواحی خوانده شده در صورت وجود کاملاً آشکار خواهند بود. …
۴-۲-۵٫ ۱C:1 × (۸ + ۱) : یک دیسک RAID5 9 تایی
دستگاه RAID5 که در این آزمایش مورد ارزیابی قرار میگیرد دارای ۹ دیسک میباشد (۸ دیسک داده و ۱ دیسک توازن) و همچنین این موارد به طور دقیق منطبق با یک چهارم از یک مورد چهارتایی کامل LUNها میباشند که در مخزن داده های FAStT600 بعنوان OSC مورد استفاده قرار گرفته اند. پیک یا حداکثر نرخ های خواندن حاصل شده به میزان ۸۰ MB s–1 برای فایل های ۶۴ گیگا بایتی میباشد (شکل ۸) در اینجا تأثیر بسیار اندک اندازه بافر دیده میشود و از اینرو تنها اندازه بافر ۴ مگا بایت را نشان دادهایم و در طرح های جاری آن را بکار میبریم. در اینجا نیز هیچگونه مزیتی در زمینه مقوله چند زنجیره ای دیده نمیشود.
۵-۲-۵٫ ۱C:2 × (۸ + ۱): یک کنترلر و ۱۸ دیسک
این پیکربندی دارای دو RAID5 (1+8) میباشد که به یک کنترلر متصل شده است (شکل ۸). عملکرد این سیستم به میزان قابل توجهی بهتر از عملکرد یک سیستم واحد (۸+۱) RAID5 میباشد. بعلاوه، افزایش اندکی در عملکرد دیده میشود که همزمان با افزایش سیستم زنجیرهای است که معرف این موضوع است که حالت چند زنجیره ای دارای تأثیر قابل توجهی در مشغول نمودن این دیسک ها دارد. البته یک ناهنجاری در سیستم تایمینگ چنین مقولهای دیده میشود: نرخ های داده برای فایل های ۶۴ گیگا بایتی (که در کنار ستاره در شکل ۹ نشان داده شده اند) در حدود نصف موارد فایل های ۳۲ گیگا بایتی میباشند.
۶-۲-۵٫ ۲C:2 × (۸ + ۱): ۲ کنترلر و ۱۸ دیسک
این پیکربندی (شکل ۱۰) دارای یک محدوده مشخص از موارد ارتقا یافته است، اما این محدوده، در عین حال، در مقایسه با پیکربندی کنترلر- واحد از ارتقای زیادی برخوردار نمیباشد. هیچ گونه حالت بی قاعدگی از نوع بحث شده قبلی در اینجا دیده نمیشود، اما نرخهای داده برای اندازههای فایل بزرگ (۶۴-۸ گیگا بایت) به صورت کاملاً کلاسترشدهای میباشند که معرف آن است که چنین سیستمیحالت اشباع خود را آغاز نموده است. (در شکل ۱۰، طرح های مرتبط با ۱۶ و ۳۲ گیگا بایتی در بین طرح های ۸ و ۶۴ گیگابایتی قرار میگیرند اما به منظور اجتناب از بکار بردن تصاویر بیشتر از آنها اجتناب شده است.) برای اندازه های فایل بزرگ، زمانی که تعداد زنجیره های از ۲ به ۴ افزایش مییابد، میتوان ارتقای قابل توجهی را در عملکرد مشاهده نمود.
۷-۲-۵٫ ۲C:4 × (۸ + ۱): نوع کامل RAID5 ۳۶ دیسکی
شکل ۱۱ معرف عملکرد خواندن پایدار دستگاه (۱+۸) RAID5 چهار طرفه کامل میباشد. این نکته آشکار است که برای هریک از فایل های بزرگ (۶۴-۲ گیگا بایت ) حداکثر نرخ داده حاصل شده در محدوده ۲۵۰–۲۸۰ MB s–1 میباشد.
۳-۵٫ آنالیز نتایج خواندن
نرخ های پیک خواندن که در بخش های قبلی حاصل شده اند تا اندازهای ناامیدکننده میباشند، با این وجود، لازم است تا آزمایشاتی را در زمینه دستگاههای RAID دارای اندازه متفاوت از نقطه نظر پیوند با یکدیگر انجام داد. جهت پاسخ دادن به این سوال ما نرخ های خواندن به دست آمده از فایل های ۶۴ گیگا بایت را با استفاده از ۴ زنجیره و اندازه بافر ۶۴ مگا بایتی برای هریک از این آزمایش به کار گرفتیم. شکل ۱۳ نشان دهنده سطح بدست آمده میباشد نقاط این سطح مترادف با نقاطی است که از هر یک از این ۶ آزمایش بدست آمده است (چهار زنجیره، اندازه بافر ۴ گیگا بایت، اندازه فایل ۴ گیگا بایت). سطح شکل ۱۳ نشان دهنده پیشرفت منطقی در سرعت داده ها میباشد، آن هم به هنگامی که منابع سیستمیافزایش یافته و خود در نتیجه شکل قابل پذیرشی را فراهم آورده و هیچ گونه قطعی ناگهانی را بروز نخواهد داد. ما نقاط متمایز مترادف با پیکربندی های کنترلر تکی یا دوتایی را مشخص نمودیم. حالت انشعاب بوجود آمده در سطح بواسطه چنین تفاوتی میباشد.
۴-۵ آزمایشات نوشتاری
جهت تست عملکرد نوشتن، ما یکسری از آزمایشات بزرگ را در محیط ایزوله انجام دادهایم، که هریک از آنها داده های مجازی را به یک فایل جدید واحد از یک زنجیره واحد نوشتهاند و علاوه بر این اندازه فایل و اندازه بافر کاربردی نیز به منظور یافتن پیک عملکرد متفاوت در نظر گرفته شده است. دلایل متعددی باعث این انتخاب شده است تا از یک زنجیره واحد جهت نوشتن در فایل های جدید استفاده شود (بر خلاف استفاده از یک سری از زنجیرهای متغیر جهت بازنویسی بخش هایی از فایل های موجود). برای یک مورد، ما مشخص نمودیم که عملکرد، برای یک حالت نصب چهار سویه ۱+۸، به میزان ناکافی بوده است آن هم به هنگامی که دو یا سه زنجیره، در مقایسه با استفاده از تنها یک زنجیره واحد، جهت بازنویسی بر روی بخش های موجود یک فایل مورد استفاده قرار گرفته اند. در وهله بعدی، به هنگامیکه توجه خود را بر روی مورد یک زنجیرهای متمرکز نمودیم دریافتیم که به هنگامیکه فایل های جدیدی را میسازیم، در برابر بازنویسی فایل های قدیمی، عملکرد بهتر میگردد. برای مشاهده بحث های بیشتر در خصوص آن که چرا تنها زنجیره واحد را میتوان جهت بوجود آوردن فایل های جدید مورد استفاده قرار داد به (۱۲) رجوع شود.
۵-۵٫ تست خواندن موازی به ۱۶ روش
ما این تست را جهت ارزیابی پهنای باند انباشته حاصل شده بوسیله سیستم به هنگامیکه کلیه ۱۶ پردازنده xio فعال بوده و هر به فایل سیستم خود دسترسی داشتند، انجام دادیم. این امر موکد سوئیچ کانال فیبری تا حداکثر ممکن آن میباشد. در این تست از ۴ زنجیره برای هر ماشین استفاده نموده و با استفاده از هم آوایی هر ۱۶ تست خواندن را انجام دادیم. نتایج حاصل شده در شکل ۱۵ نشان داده شدند و معرف این نکته میباشند که سرعت داده انباشته به میزان حداکثر ۴۲۶۲ MB s-1 میباشد که مترادف با سرعت میانگین هر ماشین ۲۶۶ MB s-1 است، آماری که کاملاً نزدیک به حداکثر میزان اندازه گیری شده بوسیله ما یعنی ۲۸۰ MB s-1 میباشد. آمار ۴٫۳ GB s-1 نیز به عنوان معیاری مدنظر میباشد تحت عنوان یک نقطه ارجاع برای کلیه کاربردهایی که برای این سیستم توسعه یافته اند محسوب میشود.
سیستم ذخیره انبوه آنالیز تجربی
۶- نتیجه گیری
در این مبحث یک روش سیستماتیک برای ارزیابی تجربی عملکردهای سیستم ذخیرهسازی انبوه (MSS) ارائه شده است. این روش به منظور برآورد عملکرد نرخ های داده خواندنی و نوشتاری پایدار برای مخزن ذخیره سازی FAStT600 در OSC مورد استفاده قرار گرفت. ما نشان دادیم که سرعت های خواندن و نوشتن پایدار حداکثر، برای این سیستم بترتیب ۲۸۰ MB s-1 و ۱۲۰ MB s-1 (برحسب گره ذخیره) میباشند. با این وجود، آمارهای نوشتاری کاملاً کمتر از فاکتورهای تئوریکی ۹/۸ برای نرخ خواندن میباشند. کنترلر FAStT600 به نظر تنگنا مربوطه در سیستم OSC میباشد.
توصیههای ما برای توسعه دهندگان برنامه های کاربردی جهت مخزن ذخیره FAStT600 OSC به شرح ذیل اعلام میگردد. (با وجود آنکه این رهنمودها برای یک MSS خاص میباشند، آنها احتمالاً مترادف با سیستم های دیگر خواهند بود).
زنجیره های چندگانه را باید برای خواندن مورد استفاده قرار داد. توسعه دهندگان میبایست ۴ الی ۸ زنجیره را تجربه نمایند تا آنکه شماره ای که بهترین نتایج را حاصل میسازد را مشخص کنند. از آنجائیکه که xio به صورت موثر یک ماشین ۴ پردازندهای میباشد، به طور معمول جهت مشغول نگه داشتن کامل این ماشین به بیش از چهار زنجیره نیاز خواهیم داشت.
زنجیره های چندگانه ممکن است به هنگامی که بخش هایی از یک فایل موجود بزرگ را آپدیت میکنیم مفید باشند. با این وجود، به هنگامیکه یک فایل بزرگ را بوجود میآوریم، هیچ گونه گزینه ای مدنظر نخواهد بود، به غیر از استفاده از یک زنجیره واحد با یک عملکرد پایین.
نتایج خواندن در زمینه خواندن پایدار فایل های بسیار بزرگ (۱۶ الی ۶۴ گیگابایت) کاربرد دارد. برای فایل های کوچکتر، نرخ های پایدار خواندن احتمالاً کمتر خواهند بود. برای فایل های بسیار کوچک، این نرخ ها دوباره افزایش خواهند یافت چرا که تأثیرات کشینگ در بخش های مختلف سیستم وجود دارد.