الگوریتم ژنتیک گروهی خوشه بندی ویژگی
الگوریتم ژنتیک گروهی خوشه بندی ویژگی – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 48000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۱۸۱ |
کد مقاله | COM181 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | استفاده از الگوریتم ژنتیک گروهی جهت ارتقای عملکرد خوشه بندی ویژگی |
نام انگلیسی | Using group genetic algorithm to improve performance of attribute clustering |
تعداد صفحه به فارسی | ۴۸ |
تعداد صفحه به انگلیسی | ۸ |
کلمات کلیدی به فارسی | خوشه بندی ویژگی, انتخاب ویژگی, الگوریتم ژنتیک, الگوریتم ژینتیک گروه بندی, داده کاوی |
کلمات کلیدی به انگلیسی | Attribute clustering, Feature selection, Genetic algorithm, Grouping genetic algorithm, Data mining |
مرجع به فارسی | محاسباتی نرم افزاری کاربردیدپارتمان مهندسی علوم کامپیوتر و اطلاعات، دانشگاه ملی کائوهسونگ، تایوان، جمهوری خلق چینالزویر |
مرجع به انگلیسی | Applied Soft Computing; Department ofComputer Science and Information Engineering, National University ofKaohsiung, Kaohsiung Taiwan, ROC; Elsevier |
کشور | تایوان |
استفاده از الگوریتم ژنتیک گروهی جهت ارتقای عملکرد خوشه بندی ویژگی
چکیده
انتخاب ویژگی به عنوان یک مرحله پیش پردازشی در ارتباط با داده کاوی و فراگیری ماشینی به شمار آمده و در خصوص تحلیل داده های ابعادی سطح بالا بسیار مهم تلقی می شود. خوشه بندی ویژگی برای انتخاب ویژگی پیشنهاد شده است. در صورتی که قابلیت خوشه بندی ویژگی های مشابه را در گروه ها داشته باشیم، در صورت از دست دادن برخی از مقادیر ویژگی ها آنها را متعاقباً می توان به آسانی به وسیله خوشه های دیگر در همان گروه جایگزین نمود. Hong و همکاران جهت یافتن خوشه های ویژگی مناسب یک الگوریتم ژنتیک (GA) را پیشنهاد نمودند. با این وجود، در این رویکردها، کروموزوم های متعدد معرف نتیجه خوشه بندی ویژگی مشابه (راه حل محتمل) به واسطه خصیصه های ترکیبی هستند، و بنابراین فضای جستجو بزرگتر از حد ضروری می باشد. این مطالعه اقدام به ارتقای عملکرد فرآیند خوشه بندی ویژگی بر مبنای الگوریتم ژنتیک و با توجه به الگوریتم ژنتیک گروهی (GGA) می نماید. در رویکرد پیشنهادی، شاخص ها و عملگرهای GGA جهت کاهش افزونگی در شاخص های کروموزوم در ارتباط با خوشه بندی ویژگی بکار گرفته می شوند. آزمایشات همچنین جهت مقایسه کارایی رویکرد پیشنهادی با رویکرد موجود اعمال شده اند. نتایج معرف آن می باشند که رویکرد پیشنهادی می تواند سبب حصول دستاوردهای مناسب و کارآمد در خصوص گروه بندی ویژگی شود.
کلمات کلیدی: خوشه بندی ویژگی، انتخاب ویژگی، الگوریتم ژنتیک، الگوریتم ژینتیک گروه بندی، داده کاوی
۱- مقدمه
انتخاب ویژگی به عنوان یک مؤلفه مهم پیش پردازشی در داده کاوی و فرآیند ماشینی به شمار می آید [۸]. یک مجموعه فرعی مناسب ویژگی ها نه تنها قابلیت کاهش زمان اجرای مورد نیاز برای قواعد حاصله را خواهد داشت [۲]، بلکه می تواند دقت دسته بندی را نیز افزایش دهد. انتخاب ویژگی همچنین به عنوان یک مورد حیاتی در خصوص طبقه بندی داده ها و فراخوانی آنها به شمار آمده و به طور گسترده ای در بسیاری از رشته های تحقیقی، نظیر شناسایی الگو، ویژگی های آماری و داده کاوی بکار گرفته شده است. از آنجایی که انتخاب ویژگی در حقیقت به عنوان یک مسئله بهینه سازی تلقی می شود، تکنیک های زیادی را می توان مورد استفاده قرار داد. برخی از رویکردهای شناخته شده در این مبحث همانند الگوریتم ژنتیک [۱۵، ۱۷]، الگوریتم بهینه سازی ازدحام ذرات [۲۰، ۲۱]، الگوریتم بهینه سازی کلونی مورچه [۱۳]، و دیگر الگوریتم های بهینه سازی الهام گرفته از ویژگی های زیستی [۹، ۱۰، ۲۲] در این زمینه قابل توجه می باشند.
رویکردهای الگوریتم ژنتیک مبنای بسیاری وجود دارند که برای انتخاب ویژگی پیشنهاد شده اند [۱۵، ۱۷]. به علاوه برخی از الگوریتم های مبتنی بر PSO یا ACO نیز برای مشکلات مربوط به انتخاب ویژگی عرضه گردیده اند [۱۳، ۲۱]. به طور مثال، در مرجع [۲۱]، یک رویکرد بهینه سازی ازدحام ذرات چند هدفه (PSO) برای انتخاب ویژگی بکار گرفته شد. هدف این رویکرد ایجاد مجموعه ای از راه حل های پارتو (زیر مجموعه های ویژگی) برای دسته بندی می باشد. در مرجع [۱۳]، یک الگوریتم فراابتکاری ترکیبی تحت عنوان الگوریتم بهینه سازی کلونی مورچه ـ فاخته پیشنهاد شد، که به عنوان یک مؤلفه ترکیبی الگوریتم کلونی مورچه و جستجوی فاخته برای انتخاب ویژگی در فرآیند ماموگرافی دیجیتال به شمار می آید. به عبارت دیگر، هدف اصلی این رویکردها فراهم آوردن مجموعه ای از ویژگی های انتخابی برای دسته بندی می باشد.
…
ادامه این مقاله به شرح ذیل سازماندهی شده است. برخی از مطالعات مرتبط در بخش ۲ مورد بررسی قرار می گیرند. روش پیشنهادی بر مبنای الگوریتم ژنتیک گروهی (GGA) برای خوشه بندی ویژگی با ارائه برخی از مثال های مرتبط عرضه می شود تا از این طریق قابلیت نشان دادن کاربرد آن در بخش ۳ حاصل گردد. نتایج تجربی در بخش ۴ ارائه شده و مورد بحث قرار می گیرند. در نهایت، نتیجه گیری ها و پیشنهاداتی برای تحقیقات آتی در بخش ۵ ارائه خواهد شد.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۲- بررسی تحقیقات مرتبط
این فصل برخی از تحقیقات مرتبط را مورد بررسی قرار می دهد و مطالبی نظیر انتخاب ویژگی، خوشه بندی ویژگی، برآوردهای وابستگی ویژگی و الگوریتم ژنتیک استفاده شده جهت مخاطب قرار دادن مسایل گروه بندی را تحت پوشش قرار می دهد.
۲ـ۱٫ انتخاب ویژگی
انتخاب ویژگی به عنوان یک مؤلفه پیش پردازشی مهم در زمینه فراگیری ماشینی و داده کاوی به شمار می آید، مخصوصاً به هنگامی که فرآیند یادگیری بر روی مجموعه های اطلاعاتی دارای ویژگی های ابعادی بالا اجرا می شود. Dash و همکاران [۵] اقدام به تعریف انتخاب ویژگی برای دسته بندی به عنوان مشخصه جهت یافتن زیر مجموعه های با اندازه حداقلی ویژگی ها که قابلیت حفظ دقت دسته بندی در توزیع کلاس حاصله را دارد نموده اند. یک زیر مجموعه ویژگی مناسب نه تنها قابلیت کاهش زمان آموزش و ضروریات I/O را خواهد داشت، بلکه منجر به درک بهتر داده ها و پیش بینی های دقیقتری می شود. یک مجموعه ویژگی ورودی غالباً دارای برخی از ویژگی های خاص می باشد که برای اهداف مربوطه بصورت حشو یا غیرمرتبط به شمار می آیند. …
۲ـ۲٫ برآوردهای وابستگی های ویژگی
برآوردهای وابستگی جهت ارزیابی مشابهت بین ویژگی ها بکار گرفته می شوند. آنها به وسیله Han و همکاران [۱۱] و Li و همکاران [۱۴] پیشنهاد شده اند. Hong و Liou از برآورد وابستگی در روش خوشه بندی ویژگی خود بر مبنای رویکردهای انتخاب ویژگی استفاده نمودند [۱۰]. ویژگی هایی که دارای تعامل مشابهی با دسته بندی هستند از وابستگی بالایی به یکدیگر برخوردار می باشند. به طور رسمی، با توجه به دو ویژگی Ai و Aj، مقدار نسبی وابستگی Ai با توجه به Aj تحت عنوان Dep(Ai, Aj) مشخص می گردد که خود بر حسب فرمول (۱) به شرح ذیل تعیین شده است:
۲ـ۳٫ خوشه بندی ویژگی بر مبنای الگوریتم های ژنتیک
Hong و Wang [16] یک روش خوشه بندی مبتنی بر الگوریتم ژنتیک برای خوشه بندی ویژگی را پیشنهاد نمودند که قابلیت یافتن زیر مجموعه های ویژگی تقریبی را برای دسته بندی دارد. آنها در ابتدا رویکردی را پیشنهاد کردند که دقت میانگین دسته بندی را در نظر داشته و قابلیت ایجاد نوعی تعادل در خصوص خوشه های ویژگی، ارائه شده به وسیله کروموزوم ها، و با توجه به معیار ارزیابی برازندگی، را خواهد داشت. دقت میانگین دسته بندی جهت محاسبه کلیه ترکیب های زیر مجموعه ویژگی محتمل از نتایج خوشه بندی کروموزوم بکار گرفته شده و متعاقباً به منظور ارزیابی قابلیت این دسته بندی زیر مجموعه ویژگی های انتخابی با توجه به مجموعه های داده های مشخص شده مورد استفاده قرار می گیرند. برآورد دیگر استفاده شده در این رویکرد تعادل خوشه است که جهت کمک به فرآیند خوشه بندی الگوریتم ژنتیک به منظور یافتن خوشه های دارای تعداد مشابهی از ویژگی ها مورد استفاده قرار می گیرد. در صورتی که نتیجه خوشه بندی ارائه شده به وسیله یک کروموزوم از تعادل بیشتری برخوردار باشد، متعاقباً این مقدار بزرگتر خواهد بود.
۲ـ۴٫ الگوریتم های ژنتیک و مشکلات گروه بندی
بسیاری از روش های مبتنی بر الگوریتم ژنتیک برای حل مسایل گروه بندی پیشنهاد شده اند [۱۲]، با این حال چالش های مشخصی در ارتباط با الگوریتم ژنتیک استاندارد همچنان باقی مانده اند. دو ضعف اصلی الگوریتم ژنتیک در این زمینه به شرح ذیل می باشند.
اولین ضعف، طرح کدگذاری استاندارد الگوریتم ژنتیک از ویژگی های کاملاً اضافه با توجه به مشکلات گروه بندی در رنج می باشد. در نظر بگیرید که N موضوع یا آبجکت را می بایست در K خوشه تحت فرآیند خوشه بندی قرار داد. هر کروموزوم ممکن است به عنوان یک توالی N ـ ژن به شمار آید، که بر مبنای آن هر ژن به عنوان یکی از سمبل های k گروه به شمار آمده و معرف موضوع یا آبجکت ژنی می باشد که متعلق به آن گروه است. به طور مثال، در نظر بگیرید که یک کروموزوم ABBAC وجود دارد، که معرف پنج آبجکت در سه گروه می باشد. اولین و چهارمین آبجکت در گروه A قرار داشته و دومین و سومین آبجکت در گروه دیگر B قرار گرفته اند و پنجمین آبجکت در یک گروه تکی C قرار می گیرد. این طرح کدگذاری دارای K! کروموزوم متمایز جهت مشخص سازی نتیجه گروه بندی یکسان می باشد، و عملگرهای ژنتیک قابلیت مشخص سازی آنها را نخواهند داشت. بنابراین، فضای جستجو به واسطه دوبله شدگی این طرح افزایش شدیدی یافته و به طور جدی بر روی کارایی الگوریتم ژنتیک تأثیر می گذارد.
۲ـ۵٫ الگوریتم ژنتیک گروه بندی
از آنجایی که رویکرد الگوریتم ژنتیک متعارف دارای ضعف هایی به هنگام بکارگیری در خصوص مسایل گروه بندی می باشد، همانگونه که در بالا ذکر شد، Falkenauer اقدام به ارائه الگوریتم ژنتیک گروهی (GGA) نموده است. این الگوریتم به صورت موفقی برای مسایل مرتبط با گروه بندی و خوشه بندی مختلف نظیر مشکلات چیدمان جعبه ها و صرفه جویی های مقیاسی [۷] بکار گرفته شده است. به علاوه، Pankratz یک ویژگی خاص مربوط به این الگوریتم را برای مشکل مسیریابی وسایل نقلیه بکار گرفت [۱۸] و Rekiek نیز از این الگوریتم برای حل مسئله جابجایی و حمل و نقل افراد معلول استفاده کرد [۱۹]. نتایج آزمایشات Falkenauer نشان دهنده آن می باشد که عملکرد الگوریتم ژنتیک گروهی بهتر از الگوریتم ژنتیک عادی با توجه به حل این مشکلات به شمار می آید [۶].
۲ـ۵ـ۱٫ ارائه ویژگی های کروموزوم
در تحقیق Falkenauer در خصوص ویژگی های الگوریتم ژنتیک گروهی، یک کروموزوم متشکل از دو بخش می باشد که هر بخش برای آبجکت و گروه مدنظر است. بخش آبجکت قابلیت ذخیره سازی اطلاعات در زمینه چگونگی گروه بندی آبجکت ها را خواهد داشت و بخش گروه به عنوان یک لیست مرتب شده گروه ها به شمار می آید. بخش گروه به وسیله یک رشته دارای طول ثابت شکل می گیرد، که در آن هر ژن در آن رشته معرف برچسب گروه یک آبجکت می باشد. به طور مثال، یک بخش آبجکت را در کروموزوم در نظر بگیرید: ACBBA. این کروموزوم معرف آن است که اولین و پنجمین آبجکت متعلق به گروه “A” می باشند. سومین و چهارمین آبجکت متعلق به گروه “B” به شمار آمده و دومین آبجکت متعلق به گروه “C” می باشد. بخش گروه به عنوان تفاوت اصلی از الگوریتم ژنتیک سنتی به شمار می آید. این بخش قابلیت ذخیره سازی نام های گروه در یک ترتیب طول متغیر را خواهد داشت. در الگوریتم ژنتیک گروهی، یک کروموزوم معرف آن خواهد بود که چگونه آبجکت های مشخص شده گروه بندی می شوند. بر چسب ها یا تگ های گروه صرفاً جهت ایجاد تمایز در این زمینه بکار گرفته می شوند که کدام یک از آبجکت ها در یک گروه خاص قرار می گیرند و کدام یک در آن گروه نیستند، و بنابراین تگ مربوط به گروه مشخصی از آبجکت ها در کروموزوم های مختلف به معنای آن نخواهد بود که هیچ گونه ارتباطی بین گروه ها وجود دارد. مثالی از کروموزوم های کامل به شرح ذیل ارائه شده است:
۲ـ۵ـ۲٫ کراس اور
متمایز از کراس اور الگوریتم ژنتیک، کراس اور یا فرآیند تولید مثل الگوریتم ژنتیک گروهی بر مبنای گروه ها به جای آبجکت ها می باشد. Falkenauer از پنج مرحله ذیل برای این عملگر کراس اور GGA استفاده نموده است [۶].
انتخاب موقعیت درج در بخش گروه اولین والدین و متعاقباً انتخاب تصادفی یک قسمت مربوط به بخش گروه والدین دیگر.
کپی کلیه محتویات اولین والدین به هر کروموزوم خالی، و متعاقباً کپی و درج قسمت گروه انتخابی دیگر والدین انتخاب شده به کروموزوم جدید.
…
۲ـ۵ـ۳٫ جهش و وارونگی
جهش با استفاده از سه استراتژی در الگوریتم GGA حاصل می شود که عمدتاً شامل ایجاد یک گروه جدید، حذف یک گروه موجود، و تبادل اقلام در بین گروه ها می باشد. به علاوه، یک عملگر وارونه نیز بر الگوریتم GGA جهت تغییر ترتیب ژن ها در بخش گروه بکار گرفته می شود تا این اطمینان به وجود آید که برخی از گروه ها از فرصت های بیشتری جهت انتقال به فرزندان برخوردار هستند. این دو عملگر در خصوص اجتناب از به تله افتادگی در راه حل های بهینه محلی کارساز و مفید می باشند.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۳- خوشه بندی ویژگی مبتنی بر الگوریتم ژنتیک گروهی
روش پیشنهادی اقدام به تقسیم مجموعه کامل ویژگی به k مجموعه فرعی ویژگی مناسب می نماید، به گونه ای که انتخاب ویژگی و جابجایی را بتوان به آسانی با عملکرد مناسب انجام داد. در اینجا، k به عنوان یک ثابت از قبل تعیین شده می باشد. روش پیشنهادی اقدام به پذیرش الگوریتم ژنتیک گروهی پیشنهاد شده به وسیله Falkenauer جهت یافتن گروه های ویژگی مناسب می نماید [۶]. یک شاخص مشخص در ابتدا جهت کدگذاری هر کدام از نتایج خوشه بندی ویژگی محتمل در یک کروموزوم طراحی شده است. رویکرد الگوریتم ژنتیک گروهی متعاقباً به اجرا درآمده تا بر اساس آن قابلیت یافتن بهترین کروموزوم حاصل شود، که به عنوان نتیجه نهایی خوشه بندی تلقی می شود. به علاوه، تابع برازندگی ارائه شده در هر دو مورد الگوریتم های ویژگی مبتنی بر ـ GGA و GA به وسیله Hong و Wang [17] مورد استفاده قرار گرفته تا قابلیت مقایسه مناسب کارایی های آنها به وجود آید. ویژگی کروموزوم رویکرد پیشنهادی به شرح ذیل توصیف می شود.
۳ـ۱٫ شاخص کروموزوم
در رویکرد خوشه بندی ویژگی پیشنهادی، هر کروموزوم معرف یک نتیجه خوشه بندی ویژگی محتمل می باشد. حال اجازه دهید تا یک مجموعه ویژگی A متشکل از n ویژگی باشد که به وسیله نشان داده می شود. در صورتی که هدف انتخاب k ویژگی از A باشد بنابراین یک پارتیشن یا دسته بندی با K گروه ویژگی شکل خواهد گرفت. مجموعه ویژگی نهایی شامل ویژگی ها، با هر مورد انتخاب شده از یک گروه، خواهد بود. به طور رسمی، حال اجازه دهید تا i امین گروه ویژگی به صورت Gi مشخص گردد. بنابراین، و حاصل خواهد شد. یک کروموزوم که شامل اطلاعات پارتیشن k گروه است به صورت (G1, G2, …, GK) نشان داده می شود. همانگونه که در بالا ذکر شد، و با توجه به اصلاح اندک، یک کروموزوم GGA متشکل از دو بخش، یکی برای ویژگی ها و مورد دیگر برای گروه ها در نظر گرفته خواهد شد.
۳ـ۲٫ جمعیت اولیه
در ابتدا، یک جمعیت مربوط به کروموزوم ها به صورت تصادفی ایجاد می شود. حال فرض کنید که ما خواستار تقسیم بندی N ویژگی به K گروه می باشیم. در ابتدا، K گروه خالی G = {G1, G2, …, GK) ایجاد می شود. N ویژگی متعاقباً به صورت تصادفی به گروه ها تخصیص می یابد، آن هم با توجه به یک ویژگی برای یک گروه فرضی. در صورتی که همچنان یک گروه خالی پس از تخصیص کلیه ویژگی ها باقی مانده باشد، یک گروه به صورت تصادفی از مجموعه برگزیده شده و به دو گروه تصادفی تقسیم می گردد. فرآیند فوق تا زمانی تکرار خواهد شد که K گروه غیرخالی وجود داشته باشد.
۳ـ۳٫ برازندگی و انتخاب
در رویکرد پیشنهادی، تابع برازندگی پیشنهادی به وسیله Hong و Wang [17] جهت یافتن زیر مجموعه های ویژگی مناسب بکار گرفته شده است. این تابع برازندگی متشکل از دو عامل می باشد، دقت خوشه و تعادل خوشه، که به شرح ذیل به صورت مختصر تشریح می شوند.
۳ـ۴٫ کراس اور
عملگر کراس اور GGA دارای یک کروموزوم انتخابی فرضی به عنوان کروموزوم مبنا می باشد، و متعاقباً گروه های خاصی از کروموزوم دیگر در آن تزریق می گردد. سپس چنین موردی اقدام به حذف ویژگی های دوبل از کروموزوم جدیداً تشکیل شده خواهد نمود. به طور رسمی، در نظر بگیرید که دو کروموزوم C1 به عنوان کروموزوم پایه و C2 به عنوان کروموزوم درج شده وجود دارند:
۳ـ۵٫ جهش و وارونگی
عملگر جهش بر روی بخش آبجکت به تنهایی کار می کند. این عملگر به صورت تصادفی اقدام به تخصیص مجدد یک ویژگی به گروه دیگر می نماید. عملگر ژنتیک گروه دیگر به عنوان یک عملگر وارونگی خواهد بود. این عملگر به منظور کمک به عملگر کراس اور جهت انتخاب ترکیب های مختلف گروه ها به منظور تبادل بین دو والدین طراحی شده است. چنین موردی را می توان با یک چیدمان مجدد تصادفی یا بر مبنای اهداف خاص موقعیت های گروه ها انجام داد. گروه هایی که با توجه به موقعیت ترتیبی نزدیک تر باشند از فرصت بیشتری جهت انتقال برخوردار خواهند بود. در رویکرد پیشنهادی، این فرآیند چیدمان مجدد به صورت تصادفی اعمال می شود.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۴- الگوریتم پیشنهادی
بر مبنای توصیف فوق، الگوریتم GGA ـ مبنای پیشنهادی برای خوشه بندی ویژگی به شرح ذیل طراحی می شود.
الگوریتم خوشه بندی ویژگی GGA ـ مبنای پیشنهادی
ورودی: یک مجموعه داده آموزشی با N ویژگی و K خوشه
خروجی: یک نتیجه خوشه بندی ویژگی مناسب
مرحله ۱٫ تولید تصادفی یک جمعیت P، با توجه به آنکه هر جمعیت به عنوان نتیجه خوشه بندی ویژگی محتمل تلقی می شود.
مرحله ۲٫ محاسبه مقدار برازندگی هر کروموزوم Ci با استفاده از مراحل فرعی ذیل:
مرحله ۲ـ۱٫ محاسبه میانگین دقت کلیه ترکیب های ویژگی محتمل کروموزوم از طریق فرمول (۲).
مرحله ۲ـ۲٫ محاسبه تعادل خوشه کروموزوم، که از طریق تعداد ویژگی ها در گروه، با توجه به فرمول (۳)، مشخص می شود. یک کروموزوم به هنگامی دارای مقدار تعادل بیشتری خواهد بود که نتیجه خوشه بندی آن متعادل تر باشد.
مرحله ۲ـ۳٫ جامعیت مقادیر مراحل ۲ـ۲ و ۲ـ۳ جهت ارزیابی برازندگی کروموزوم به وسیله فرمول (۴).
مرحله ۳٫ اجرای عملیات کراس اور GGA.
مرحله ۴٫ اجرای عملیات جهش GGA.
مرحله ۵٫ اجرای عملیات وارونگی .GGA
مرحله ۶٫ اجرای مقادیر برازندگی کروموزوم های جدید.
مرحله ۷٫ ا نتخاب کروموزوم ها برای نسل بعد با استفاده از استراتژی انتخاب چرخ رولت.
مرحله ۸ . تکرار مراحل ۳ الی ۷ تا آنکه معیار اتمام حاصل شود.
مرحله ۹٫ خروجی کروموزوم با بهترین مقدار برازندگی.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۵- یک مثال
در این بخش، یک مثال جهت توصیف رویکرد خوشه بندی ویژگی GGA ـ مبنای پیشنهادی ارائه می شود. در نظر بگیرید که پنج شخص با هفت ویژگی ذیل وجود دارند:
جنسیت (S)، انگلیسی (E)، کشور (C)، درآمد (I)، سن (A)، وضعیت تأهل (M)، خرید کامپیوتر (B). نام کلاس Credit می باشد. مجموعه داده ها در جدول ۱ نشان داده شده اند.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۶- نتایج تجربی
در این بخش، نتایج تجربی برای الگوریتم پیشنهادی در زمینه ویژگی خوشه بندی ارائه می شوند. یک مجموعه اطلاعاتی توموگرافی (SPECT) در این آزمایش بکار گرفته شد. ویژگی های این مجموعه اطلاعاتی در جدول ۴ نشان داده شده است. آزمایشات با استفاده از زبان C++ بر روی یک کامپیوتر شخصی با ظرفیت پردازنده ۲ Duo E8400 3-GHz CPU و رم ۴ گیگابایت انجام شدند.
الگوریتم ژنتیک گروهی خوشه بندی ویژگی
۷- نتیجه گیری و تحقیقات آتی
رویکرد الگوریتم ژنتیک متعارف دارای برخی از نقاط ضعف به هنگام بکارگیری آن جهت مسایل گروه بندی ویژگی می باشد. در این مطالعه، ما نسبت به ارائه روش خوشه بندی ویژگی بر مبنای الگوریتم ژنتیک گروهی جهت ارتقای عملکرد فرآیند خوشه بندی ویژگی مبتنی بر الگوریتم ژنتیک اقدام نموده و نقاط ضعف الگوریتم ژنتیک را خاطرنشان ساختیم. اولین نقطه ضعف الگوریتم ژنتیک آن است که طرح کدگذاری استاندارد آن دارای نکات کاملاً اضافه در ارتباط با مسایل گروه بندی می باشد. دومین ضعف آن است که عملگر کراس اور الگوریتم ژنتیک نمی تواند این اطمینان را به وجود آورد که خواص ذاتی کودکان برابر با خواص والدین خود هستند. بنابراین در این مقاله، هدف اصلی رویکرد پیشنهادی الگوریتم ژنتیک گروهی تقسیم ویژگی ها به K گروه برای دسته بندی می باشد. ویژگی ها در یک گروه مشابه به معنای آن خواهند بود که آنها از خواص مشابهی برخوردار هستند. بنابراین، ما قابلیت انتخاب ویژگی ها از هر گروه را داشته و آنها را برای دسته بندی جمع نموده ایم. نتایج تجربی نشان دهنده آن هستند که رویکرد پیشنهادی قابلیت کاهش زمان دسته بندی از طریق انتخاب یک زیر مجموعه ویژگی مناسب را خواهد داشت. به علاوه، این الگوریتم می تواند با مشکلات مقادیر مفقوده نیز روبرو شود، چرا که قابلیت جایگزینی ویژگی ها با مقادیر مفقوده به وسیله ویژگی های دیگر در خوشه های مشابه را خواهد داشت. در تحقیقات آتی، ارزیابی برازندگی ارتقاء یافته و اطلاعات سابقه کاربران در تعامل با ویژگی های مربوطه جهت تسریع همگرایی و افزایش دقت نتایج بکار گرفته خواهد شد. البته، مسئله گروه بندی ویژگی را می توان با استفاده از الگوریتم های تکاملی دیگری نیز حل نمود، همانند الگوریتم بهینه سازی ازدحام ذرات، الگوریتم بهینه سازی کلونی مورچه، الگوریتم تکاملی تفاضلی یا دینفرانسیل و الگوریتم بهینه سازی مبتنی بر ویژگی های زیست جغرافیایی. با این وجود، آنها با مسایل مشابهی با الگوریتم ژنتیک به هنگام حل مشکلات گروه بندی ویژگی روبرو خواهند شد. این مسایل شامل فضاهای جستجو، زمان همگرایی، کدسازی، تابع برازندگی و موارد مختلف دیگر هستند. در آینده، ما سعی در حل مسئله گروه بندی ویژگی با استفاده از دو الگوریتم بهینه سازی الهام گرفته زیستی دیگر خواهیم کرد.