PHFS کاهش وقفه دسترسی شبکه داده
PHFS کاهش وقفه دسترسی شبکه داده – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 68000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۱۶۵ |
کد مقاله | COM165 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | PHFS: روش همتاسازی دینامیکی جهت کاهش وقفه دسترسی در شبکه داده های چند لایه |
نام انگلیسی | PHFS: A dynamic replication method, to decrease access latency in the multi-tier data grid |
تعداد صفحه به فارسی | ۶۸ |
تعداد صفحه به انگلیسی | ۱۲ |
کلمات کلیدی به فارسی | شبکه داده, همتاسازی دینامیکی |
کلمات کلیدی به انگلیسی | Data Grid, Dynamic replication, CFS, PHFS |
مرجع به فارسی | سیستم های کامپیوتری نسل آیندهدپارتمان CS، دانشگاه تبریز، ایرانالزویر |
مرجع به انگلیسی | Future Generation Computer Systems; Cs Department, University of Tabriz, Tabriz, Iran; Elsevier |
کشور | ایران |
PHFS: روش همتاسازی دینامیکی جهت کاهش وقفه دسترسی در شبکه داده های چند لایه
چکیده
همتاسازی داده ها به عنوان روشی جهت ارتقای عملکرد دسترسی به اطلاعات در سیستم های توزیعی به شمار می آید. فرایند همتاسازی دینامیکی روشی می باشد که از پیکر بندی همتاسازی، با توجه به تغییر رفتار کاربران در طی زمان، جهت تضمین مزیت های مرتبط با این فرایند استفاده می نماید. در این مقاله، ما یک روش همتاسازی دینامیکی جدید در یک شبکه داده ای چند لایه، تحت عنوان روش انتشار سریع سلسله مراتبی پیش گویانه (PHFS)، نوعی نگارش تعمیم یافته از روش انتشار سریع (یک روش همتاسازی دینامیکی در شبکه داده ها) را ارائه می نمائیم. با توجه به محلیت فضایی، PHFS سعی در پیش بینی نیازهای آتی نموده و متعاقباً این موارد را در یک حالت سلسله مراتبی پیش همتاسازی نموده تا قابلیت افزایش ویژگی محلی از نقطه نظر دسترسی به وجود آمده و در نهایت بتوان عملکرد را نیز ارتقا داد. در این مقاله، ما نسبت به مقایسه PHFS و CFS (انتشار سریع مشترک) با استفاده از یک مثال از چشم انداز وقفه دسترسی اقدام می نمائیم. نتایج نشان دهنده آن هستند که PHFS سبب ایجاد وقفه کمتری شده و بعلاوه در مقایسه با CFS از عملکرد بهتری نیز برخوردار می باشد.
کلمات کلیدی: شبکه داده، همتاسازی دینامیکی، CFS، PHFS
PHFS کاهش وقفه دسترسی شبکه داده
۱- مقدمه
امروزه، داده ها و اطلاعات زیادی در رشته های مختلف، نظیر آزمایشات علمی و کاربردهای مهندسی، تولید می شوند. به منظور به اشتراک گذاری داده ها و مشارکت آن ها، این داده های تولیدی می بایست در شبکه های گسترده قابلیت توزیع داشته باشند. بنابراین، مدیریت کارآمد حجم انبوه داده های به اشتراک گذاشته شده و توزیعی به عنوان یک مولفه مهم برای محققین علمی و همچنین کاربردهای تجاری بشمار می آید. بهره گیری از شبکه داده ها به عنوان یک راه حل برای این مسئله محسوب می شود [۱،۲]. ایده اصلی این شبکه / گرید اتصال منابع از موقعیت ها، سازمان ها و بسترهای ناهمگن متعدد به یکدیگر جهت ایجاد یک سیستم قابل مقیاس و توزیعی می باشد که به کاربران اجازه دسترسی شفاف به منابع را می دهد [۳]. این گریدها / شبکه ها را می توان به گریدهای محاسباتی و گریدهای داده ای تقسیم نمود [۳]. گریدها یا شبکه های محاسباتی برای مدیریت و تعامل با وظایف شدید محاسباتی توسعه یافته اند و گریدها یا شبکه های داده ای و اطلاعاتی نیز برای به اشتراک گذاری داده ها و تعامل در این زمینه مد نظر می باشند [۴]، و شامل “چرخه عمر دینامیکی کامل فرایندهای پیاده سازی خدمات، تدارکات، مدیریت و منسوخ سازی نیز می باشد” [۵]. شبکه تحقیقات انفورماتیک بیوپزشکی (BIRN) [6]، Large Hadron Collider (LHC) [7]، اتحادیه های مجازی بین المللی (IVOA)، گروه تحقیقات اجتماعی شبکه [۸]، گرید داده اروپا [۹]، به عنوان مثال های سازمان ها و ارگان هایی به شمار می آیند که از پروژه های E-SciencE (EGEE) بسمت گریدها یا شبکه های توانمند سازی روی آورده اند [۱۱].
ویژگی چند لایه ای به عنوان یک ساختار درخت مانند جهت ایجاد گریدها یا شبکه های داده ای به شمار می آید. معماری چند لایه ای در ابتدا به وسیله پروژه MONARC [12] برای مدل سازی LHC [7] محاسبات توزیعی در CERN [13] پیشنهاد شد. در این مدل سلسله مراتبی پیشنهادی، داده های خام که در CERN تولید می شوند در لایه صفر ذخیره می گردند. این داده های خام به وسیله مراکز متعدد محلی در لایه ۱، مراکز ملی در لایه ۲، بسیاری از مراکز صنعتی در لایه ۳ و در نهایت صدها یا هزاران کاربر در لایه ۴ مورد استفاده قرار می گیرند. این معماری فراهم آورنده یک روش کارآمد و کم هزینه برای به اشتراک گذاری منابع بین کاربران می باشد. پروژه شبکه داده EU یکی از مهم ترین و قابل توجه ترین پروژه های شبکه ای اطلاعات به شمار می آید که در آن تعداد زیادی از محققین در ارتباط با مدیریت فرایندهای همتاسازی در شبکه های اطلاعاتی، مخصوصاً در ارتباط با شبکه اطلاعات چند لایه، مشغول به کار و تحقیق می باشند [۱۰].
…
این مقاله به شرح ذیل سازماندهی شده است: بخش ۲ در ارتباط با تحقیقات وابسته در زمینه همتاسازی دینامیکی در شبکه های اطلاعاتی و تحقیقی در خصوص روش های پیش گویانه می باشد. در بخش ۳، PHFS ارائه می شود. مثال و نتایج مرتبط در بخش ۴ عرضه گردیده و بخش ۵ نهایتاً تحقیقات آتی و نتیجه گیری این مقاله را ارائه می نماید.
PHFS کاهش وقفه دسترسی شبکه داده
۲- تحقیقات مرتبط
برخی از مطالعات اخیر اقدام به بحث پیرامون مشکلات همتاسازی دینامیکی در شبکه های اطلاعاتی نموده اند. برخی از این تحقیقات در این بخش مورد بررسی قرار می گیرند.
در [۱۸] پنج استراتژی متمایز برای شبکه داده های چند لایه ای ارائه شده است. این استراتژی ها از نقطه نظر عملکرد به وسیله یک شبیه سازی مقایسه می شوند. این استراتژی ها به شرح ذیل هستند:
عدم همتاسازی: داده ها صرفاً در گره به وجود آمده ذخیره سازی شده و در گره های دیگر همتاسازی نمی شوند. این استراتژی به عنوان یک حالت مبنا برای مقایسه بکار گرفته شده است.
بهترین کلاینت: هر گره اقدام به ضبط درخواست های فایل های خود نموده و متعاقباً این اطلاعات را در بازه های منظم کنترل می نماید. در صورتی که تعداد درخواست ها برای یک فایل فراتر از میزان آستانه گردد، مکانیزم همتاسازی اقدام به اعمال فرایند همتاسازی فایل مربوطه در گره ای می نماید که دارای درخواست های بالاتری برای آن فایل می باشد. چنین گره ای تحت عنوان بهترین کلاینت خوانده می شود.
آبشاره سازی: در صورتی که تعداد دسترسی یک فایل فراتر از حد آستانه گردید، یک همتاسازی در مرحله بعد بر روی مسیر منتهی به بهترین کلاینت اعمال می شود. این فرایند در امتداد سطوح پایین تر ادامه می یابد تا آنکه به بهترین کلاینت برسد.
نهان سازی و آبشاره سازی: در این استراتژی، فرایندهای نهان سازی و آبشاره سازی با یکدیگر ترکیب می شوند. بنابراین فایل درخواستی در گره کلاینت همتا (قرار گرفته در حافظه نهان) گردیده و فایل های معروف به وسیله سرور مشخص شده و به صورت سلسله مراتبی (آبشاره ای) انتشار می یابند.
انتشار سریع: در این استراتژی، فایل درخواستی در کلیه گره ها از مسیر مبدأ به مسیر مقصد (گره های کلاینت) همتاسازی می گردد.
به علاوه در مرجع [۱۸] سه نوع از موقعیت ها ارائه شده اند.
موضع موقتی (زمانی): فایل های که اخیراً دسترسی یافته اند به احتمال بیشتری به عنوان موارد مجدداً درخواست شده مدنظر خواهند بود.
موضع جغرافیایی (کلاینت): فایل های جدیداً دسترسی یافته به وسیله کلاینت احتمالاً به وسیله دیگر کلاینت های مجاور نیز درخواست خواهند شد.
موضع فضایی (فایل): فایل های مرتبط با مجموع فایل های اخیراً دسترسی یافته نیز به احتمال زیاد مجدداً درخواست خواهند شد.
در این فرایند ارزیابی استراتژی ها، سه نوع از الگوهای دسترسی ارائه شده اند. این الگوهای دسترسی شامل الگوی دسترسی تصادفی، موقعیت زمانی در الگوهای دسترسی و موقعیت زمانی و جغرافیایی در الگوهای دسترسی می باشند. از آنجایی که این استراتژی ها برای خواندن شبکه داده های چند لایه ای گسترده با توجه به آبجکت های اطلاعاتی صرفاً خواندنی توسعه یافته اند، در هیچ کدام از استراتژی های فوق، مسئله ثبات موارد همتاسازی شده مدنظر قرار نگرفته است. نتایج شبیه سازی در مرجع [۱۸] نشان دهنده آن می باشند که انتشار سریع دارای عملکرد بهتری در مقایسه با الگوی دسترسی تصادفی می باشد و به علاوه الگوی آبشاره سازی نیز دارای عملکرد بهتری در ارتباط با ویژگی های دسترسی محلی است. انتشار سریع همچنین منجر به صرفه جویی زیادی در مصرف پهنای باند در مقایسه با دیگر روش ها می شود.
…
PHFS کاهش وقفه دسترسی شبکه داده
۳- انتشار سریع سلسله مراتبی پیش گویانه
در این بخش، یک روش همتاسازی دینامیکی جدید در شبکه داده های چند لایه تحت عنوان PHFS ارائه می شود. PHFS به عنوان یک نگارش تعمیم یافته CFS به شمار می آید. PHFS از روش های پیش گویانه جهت پیش بینی نیازهای آتی و همتاسازی آنها به صورت سلسله مراتبی در گره های مختلف لایه های متفاوت در شبکه داده های چند لایه از مسیر منتج شده از گره مبدأ به کلاینت استفاده می نماید. همانگونه که قبلاً ذکر شد، شبکه داده های چند لایه ای دارای ساختاری درخت مانند می باشد. شکل ۱ نشان دهنده شبکه داده های چند لایه نوعی است [۲۹].
در شبکه داده های چند لایه، گره های واقع در لایه های فوقانی دارای ظرفیت ذخیره سازی و توان محاسباتی بسیار بیشتری در مقایسه با گره های سطح تحتانی می باشند. به علاوه، پهنای باند لینک های بین گره ها در سطوح فوقانی بزرگتر از لینک ها در گره های سطح تحتانی است. بنابراین، روش همتاسازی در انتشار سریع قابلیت همتاسازی اقلام بیشتری در گره های سطح فوقانی را داشته و در مقابل این میزان در سطوح پایینی کمتر خواهد بود. هدف این نوع از همتاسازی سلسله مراتبی بهینه سازی کاربرد منابع برای همتاسازی و فراهم آوردن ویژگی محلیت حداکثری با منابع در دسترس می باشد.
در فاز اولیه، PHFS اقدام به جمع آوری اطلاعات دسترسی ها از کلیه موارد در سیستم نموده و متعاقباً فایل های لاگ یا ثبت اطلاعات دسترسی ایجاد می گردند. بعداً، PHFS از تکنیک های داده کاوی همانند قوانین وابستگی و خوشه بندی جهت مشخص سازی فایل های لاگ استفاده می نماید. چنین موردی جهت مشخص سازی دانش و اطلاعات مفید نظیر موارد ذیل بکار گرفته می شود: (۱) خوشه فایل هایی که با احتمال سطح بالا دارای دسترسی توأم می باشند، و (۲) الگوهای دسترسی ترتیبی که به صورت مکرر و غالب شکل می گیرند. البته می توان این موضوع را بیان داشت که این فایل ها دارای محلیت فضایی منطقی می باشند. به عبارت دیگر، در فاز اولیه، PHFS سعی در یافتن ارتباط بین فایل ها برای پیش بینی های متعاقب می نماید.
۳ـ۱٫ مدل معماری PHFS
همانگونه که قبلاً ذکر شد PHFS به عنوان روشی به شمار می آید که قابلیت پیش بینی درخواست های متعاقب فایل ها بر مبنای ارتباطات بین آنها را دارد. به علاوه این موضوع بیان شده است که ارتباط بین فایل ها را می توان از الگوهای دسترسی قبلی استنباط نمود. در اینجا در PHFS، ما به مکانیزمی برای حفظ دسترسی های قبلی و تحلیل آنها جهت یافتن ارتباطات نیاز خواهیم داشت. بنابراین، PHFS دارای سه فاز می باشد: فاز مانیتورینگ یا نظارت، فاز تحلیل و فاز همتاسازی.
نظارت: در فاز مانیتورینگ یا نظارت، یک عامل نرم افزاری در گره ریشه اقدام به جمع آوری اطلاعات دسترسی به فایل ها از کلیه کلاینت ها در سیستم مربوطه نموده و آنها را در یک فایل لاگ یا فایل اطلاعاتی خاص ثبت می نماید.
تحلیل: در فاز تحلیل، موتور داده کاوی فرایند استخراج اطلاعات فایل های لاگ یا ثبت شده را انجام داده و متعاقباً اطلاعات مفید همانند ارتباط بین فایل ها را مشخص می سازد.
…
۳ـ۲٫ مدیریت همتاسازی در PHFS
در PHFS، فرایند مدیریت همتاسازی با تعامل مؤلفه های مدیریت همتاسازی انجام می گردد. بر مبنای معماری PHFS، جزء مدیریت همتاسازی در هر گره از یک مؤلفه تعاملی با جزء یکسان در گره های پدر و فرزند برخوردار می باشد. این اجزا جهت تبادل همتاهای بین گره ها برای حاصل آوردن پیکربندی بهینه با یکدیگر همکاری می نمایند. جزء مدیریت همتاسازی متشکل از مؤلفه همتاسازی اولیه، مؤلفه ضبط PWS، و مؤلفه تطبیق (مؤلفه تغییر اولویت و مؤلفه تغییر پیکربندی همتاسازی) می باشد.
۳ـ۲ـ۱٫ جزء ضبط PWS
تابع مؤلفه یا جزء ضبط PWS وظیفه ضبط اطلاعات مفید در هر گره را به عهده دارد. اطلاعات ضبط شده در جزء ضبط PWS به شرح ذیل می باشند:
لیست های PWSs که در هر گره وجود دارند.
اولویت های PWSهای موجود در هر گره.
اعضای PWSs موجود در گره خاص.
به علاوه ثبت دسترسی ها به هر عضو PWSs
اطلاعات فوق الذکر جهت تغییر اولویت PWSs در جزء تغییر اولویت بکار گرفته شده و بر این مبنا اقدام به تغییر پیکربندی همتاسازی در جزء پیکربندی فرایند همتاسازی خواهد شد. اطلاعات ضبط PWS به هنگامی به روزرسانی خواهد شد که اولویت ها با توجه به جزء تغییر اولویت تغییر یافته باشند و همچنین به هنگامی که پیکربندی PWS با توجه به جزء تغییر پیکربندی همتاسازی با تغییر رو به رو شده باشد.
۳ـ۲ـ۲٫ جزء تطبیقی
جزء تطبیقی متشکل از دو مؤلفه است:
جزء تغییر اولویت و
جزء تغییر پیکربندی همتاسازی
۳ـ۲ـ۲ـ۱٫ جزء تغییر اولویت
ایده کلی تعدیل اولویت PWS ذیلاً تشریح می شود. فرایند تغییر اولویت PWS به عنوان یک رخداد گسسته به شمار آمده و در انتهای بازه های زمانی گسسته اعمال می شود. در طی این بازه های زمانی، دسترسی به اعضای PWS همراه با دیگر اطلاعات نظیر رفتارهای سیستمی قابل کنترل و مشاهده می باشد و این موارد به وسیله جزء ضبط PWS ذخیره سازی می گردند. در انتهای این بازه ها، اولویت های PWSs بر مبنای اطلاعات ذخیره سازی شده مورد ارزیابی و تعدیل قرار می گیرند. اولویت ارزیابی شده برای PWS در انتهای هر بازه معتبر شناخته شده و صرفاً برای تطبیق در بازه بعدی بکار گرفته خواهد شد. بازه های کوتاه مدت سبب افزایش در تطبیق پذیری سیستمی می شوند، چرا که این بازه های کوتاه سبب حس سریع تغییرات و واکنش سریع به وسیله جزء مدیریت همتاسازی خواهد شد. اما بازه های کوتاهتر ممکن است سبب بروز سربارهای بیشتری به سیستم شوند. تعیین طول بازه زمانی بهینه برای موقعیت های مختلف در تحقیقات بعدی مورد بررسی قرار خواهد گرفت. اولویت هر عضو PWS در انتهای بازه های زمانی با توجه به معادله (۱) محاسبه می شود:
۳ـ۳٫ مدل سازی پیش بینی و وقفه دسترسی در PHFS
در این بخش، پیش بینی و وقفه دسترسی در PHFS به صورت رسمی مورد بحث قرار می گیرد. به همین دلیل، ما دارای فرضیه های ذیل می باشیم.
F = {f1, f2,… , fn}: مجموعه ای از فایل ها در سیستم
C = {c1, c2,… , cm}: مجموعه ای از کلاینت ها
R(fi, fj): ارتباط بین فایل های fi و fj و ۰ < R(fi, fj) < 1. به علاوه، این مورد نشان دهنده احتمال درخواست فایل j پس از دسترسی به فایل i می باشد.
PWS(cl, k): مجموعه کاری پیش گویانه که به هنگامی ایجاد خواهد شد که cl اقدام به درخواست فایل k نماید.
AL(cl, fi): سطح دسترسی کلاینت cl به فایل fi.
۳ـ۳ـ۱٫ مدل سازی پیش بینی در PHFS
این موضوع مشخص شده است که PHFS قابلیت پیش بینی درخواست های احتمالی آتی بر مبنای ارتباط بین فایل ها را خواهد داشت. در اینجا، ارتباط بین فایل ها به وسیله یک گراف تحت عنوان گراف ارتباط فایل ارائه می شود (شکل ۸).
۳ـ۳ـ۲٫ مدل سازی وقفه دسترسی در PHFS
هر گره در این سیستم بر مبنای یک شناسه منحصر به فرد مشخص شده است و به عنوان مجموعه ای از جفت های منظم شده ارائه می شوند. اولین جزء هر جفت به عنوان یک فایل به شمار می آید که بر روی آن گره قرار گرفته است و دومین جزء دارای اطلاعات مشخصی در خصوص آن فایل است. اطلاعاتی که می توان آن را برای یک فایل ذخیره نمود در ارتباط با PWS آن فایل، تعداد دسترسی ها در بازه زمانی جاری، تعداد دسترسی ها در بازه های زمانی قبلی، و موارد دیگر می باشد. کلیه این فرا داده ها به عنوان جزء دوم جفت های منظم شده به شمار می آیند. این اطلاعات به وسیله جزء ضبط PWS به روزرسانی می شود.
PHFS کاهش وقفه دسترسی شبکه داده
۴- مقایسه انتشار سریع و PHFS
در این بخش، PHFS و CFS از نقطه نظر وقفه دسترسی با استفاده از یک مثال مورد مقایسه قرار می گیرند. فرضیه های ارائه شده برای این مثال به شرح ذیل هستند:
شبکه داده ای چند لایه ای دارای چهار لایه همانند شکل ۱ می باشد.
گره در سطح دو دارای یک فضای ذخیره سازی برای چهار فایل و در سطح سه دارای ذخیره سازی برای دو فایل می باشد. گره کلاینت صرفاً می تواند یک فایل را در خود جای دهد.
کلیه فایل ها دارای اندازه یکسانی هستند.
تأخیر یا وقفه برای انتقال فایل از یک سطح به سطح پایین تر به عنوان یک واحد زمانی در نظر گرفته می شود.
موتور کاوش مشخص می سازد که A، B، C، D و E، F، G، H به عنوان دو مجموعه ای از فایل هایی به شمار می آیند که به احتمال بالایی با یکدیگر دسترسی دارند.
Tmax یک آستانه، برای حرکت یک آیتم به سطح پایین تر برای دو بار در نظر گرفته می شود.
X و Y به عنوان دو کلاینتی به شمار می آیند که در یک پروژه مشترک در یک لابراتوار در یک منطقه بکار گرفته شده اند.
…
PHFS کاهش وقفه دسترسی شبکه داده