تشخیص چهره تجزیه تک ارزشی شبکه عصبی
تشخیص چهره تجزیه تک ارزشی شبکه عصبی – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 38000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۶۵ |
کد مقاله | COM65 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | تشخیص چهره انسان بر مبنای تجزیه تک ارزشی و شبکه عصبی |
نام انگلیسی | Human Face Recognition Based on Singular valued Decomposition and Neural Network |
تعداد صفحه به فارسی | ۳۱ |
تعداد صفحه به انگلیسی | ۶ |
کلمات کلیدی به فارسی | تشخیص چهره، شبکههای عصبی، تجزیه تک ارزشی |
کلمات کلیدی به انگلیسی | Face recognition, Neural Networks, Singular Value Decomposition |
مرجع به فارسی | دانشگاه اسلامی بین المللی مالزی، دانشکده مهندسی |
مرجع به انگلیسی | International Islamic University of Malaysia Faculty of Engineering |
کشور | مالزی |
تشخیص چهره انسان بر مبنای تجزیه تک ارزشی و شبکه عصبی
چکیده
این مقاله یک سیستم تشخیص چهره پیشرفته را ارائه مینماید. این روش از روال تجزیه تک ارزشی بهره جسته که در آن تصاویر از خصیصههای استخراجی و پس انتشاری شبکههای عصبی بعنوان کلاسیفایر یا رده بندی کننده دادهها استفاده میکنند. پارامترهای آموزش یا فراگیری پس انتشاری، به منظور یافتن بهترین پارامتر با بالاترین میزان دقت عمل، بصورت متفاوت و متغیر در نظر گرفته شدهاند. نتایج بدست آمده از آزمایشات نشان دهنده آن است که ترکیبات این دو مولفه نرخ شناسایی متناسبی را عرضه داشته و از اینرو میتوان چنین مضمونی را بعنوان یک سیستم موثر تشخیص چهره مد نظر قرار داد.
کلمات کلیدی: تشخیص چهره، شبکههای عصبی، تجزیه تک ارزشی
تشخیص چهره تجزیه تک ارزشی شبکه عصبی
۱- مقدمه
شناسایی اتوماتیک چهره انسان بعنوان یکی از مقولههای فعال در زمینه تحقیقات در طی سالیان اخیر مد نظر قرار گرفته است. علت این امر نیز بدین دلیل میباشد که نیاز فزآیندهای برای کاربرد این امور در مضامینی چون کنترل دسترسیهای ایمن، تراکنشهای مالی و غیره وجود دارد. از اینرو، از طریق کاربردهای نوظهور این پدیده در رشتههای مختلف، شناسایی اتوماتیک چهره انسان، که بطور کلی تحت عنوان سیستم شناسایی بیومتریک از آن یاد میشود، هم اکنون در جهان واقعی اهمیت بدیعی یافته است. تکنیک شناسایی بیومتریک بعنوان یک روش کارا و موثر عمل نموده و در عرصه فراخوانی اطلاعات کاربردهای گستردهای یافته است.
بنابر این، چنین سیستمی برای تصدیق و تایید یا شناسایی هویت اشخاص زنده بر مبنای خصیصههای بیومتریک آنها، نظیر صورت یا چهره، اثر انگشت، عنبیه یا برخی از ویژگیهای رفتاری همانند دستخط، طراحی شده است. با این وجود، بر روی این نکته تاکید میشود که چهره، بواسطه عدم وجود مشکلات بسیار، مطمئنترین خصیصه در مقایسه با ویژگیهای دیگر بشمار میآید. بطور عملی، چهره در برابر صدمات کوچک از حساسیت کمتری برخوردار بوده و در مقایسه با دیگر خصیصههای بیومتریک بسیار با ثبات میباشد.
بر این اساس، در خلال ۲۰ سال گذشته پیشرفتهای بسیاری در امر تشخیص چهره رخ داده است. تکنیکهای موجود و پیشنهادی در این خصوص عبارتند از تکنیک خاص چهرهها[۱]، انطباق موجک/ قابل ارتجاع[۲]، PCA و شبکههای عصبی. برای تقریبا کلیه روشهای پیشنهادی فوق، نرخ موفقیت تشخیص چهره وابسته به ارائه راه حل در زمینه دو مشکل ذیل خواهد بود: نمایش و انطباق. نمایش یک الگو را میتوان در تشخیص آن تحت عنوان استخراج خصیصهها بحساب آورد. بر اساس پیشنهاد هانگ ویژگیهای جبری جزء خصیصههای ثابت و معتبر در زمینه تشخیص موضوعاتی نظیر چهره بشمار میآیند. بدین منوال، وی روش تجزیه تک ارزشی (SVD) را پیشنهاد نمود که بر مبنای اسلوبی است که از مقادیر واحد بعنوان استخراج کننده خصیصهها بهره جسته و توانسته است نرخ قابل قبولی را در مقوله شناسایی عرضه دارد. بطور کلی، یک دیدگاه فراگیری غیرنظارتی قابلیت تحصیل نرخ بالای شناسایی را نخواهد داشت. تحت چنین شرایطی، جاییکه که نمیتوانیم تعداد زیادی از تصاویر چهره هر فرد را فراهم آوریم، بهرهگیری و استفاده موثر از کلیه نمونههای موجود بسیار مهم میباشد. بنابر این، روش تصدیق چهره پیشنهاد شده بوسیله یانهونگ وانگ، از تابع مبنای شعاعی[۳] (RBF) شبکه عصبی بعنوان کلاسیفایر و SVD بعنوان استخراج کننده خصیصهها استفاده میکند. بر این مبنا، قابلیت تمایز مناسب با نرخ دقت ۹۲% حاصل آمده است.
با این وجود، در این مقاله، ما یک سیستم تشخیص چهره بر مبنای روش طبقه بندی شبکه عصبی پس انتشاری را پیشنهاد میکنیم که خصیصههای تصویری آن بر مبنای تک ارزشهای (SV) تصاویر چهره بنا شده است، جاییکه کلیه تصاویر در ابتدا پیش پردازش میگردند. شکل ۱ نشان دهنده فرآیند مرتبط با سیستم پیشنهادی میباشد.
این سیستم شامل ۳ مرحله است:
مرحله آموزش یا فراگیری، مرحله تست و مرحله تشخیص.
[۱] eigen faces
[۲] wavelet/elastic matching
[۳] Radial Basis Function
تشخیص چهره تجزیه تک ارزشی شبکه عصبی
۲- تجزیه تک ارزشی
اعمال روال تجزیه تک ارزشی (SVD) در حقیقت در رده مرتبط با استخراج پارامترهای صورت فرآیند تشخیص چهره جای میگیرد. از نقطه نظر تئوریکی، تجزیه تک ارزشی (SVD) بعنوان روشی تعریف شده است که بصورت کارا جهت کاهش مقدار دادههای مورد پردازش بکار گرفته میشود. بطور اساسی، مفهوم پایه SVD معرفی تصویری با سایز m x n تحت عنوان ماتریس m x n دو بعدی میباشد. SVD بر این اساس برای این ماتریس بکار گرفته شده تا ماتریسهای u، s و v حاصل شوند. جاییکه ماتریس s یک ماتریس ۱ * n میباشد که بعنوان ماتریس قطری شناخته میشود، که در آن مقادیر مرتبط در حقیقت مقادیر تکی یا همان تک ارزشیهای یک تصویر خواهند بود. بنابر این، به منظور تعیین ماتریس s بعدی خواهیم داشت:
تشخیص چهره تجزیه تک ارزشی شبکه عصبی
۳– مدل شبکه عصبی
یک شبکه عصبی که در رشته پردازش تصویر مورد استفاده قرار گرفته است نتایج خوشبینانهای را بر حسب کیفیت بروندادهای حاصله و آسانی اجرا بدست آورده است. این موضوع مشخص شده است که در کاربردهایی که در آنها یک مدل مبتنی بر عملکرد یا دیدگاه پارامتریک در زمینه پردازش اطلاعات را نتوان بسادگی تحت قاعده و فرمول درآورد، شبکه عصبی بر مبنای یک روال خود اثباتی نمیتواند از کارایی مناسبی برخوردار باشد. تشریحات مرتبط با شبکه عصبی را میتوان بعنوان مجموعهای از واحدهای گردآمده در نظر گرفت که با اتصال با الگوی خاص اجازه ارتباطات بین واحدهایی را میدهد که تحت عنوان یاختههای عصبی یا گرهها خوانده میشوند. سیگنالهای خروجی در امتداد اتصالات، تحت عنوان وزن، به واحدهای دیگر تغذیه میشوند. این وزنها معمولا باعث القا یا بازداشتن سیگنال در حال ارتباط میشوند. یکی از موارد خاص شبکههای عصبی مرتبط با فاکتورهای واحدهای مخفی میباشد. عملکرد واحدهای مخفی یا سلولهای مخفی که همچنین تحت عنوان یاختههای عصبی مخفی نیز خوانده میشوند ایجاد تداخل بین ورودی بیرونی و خروجی شبکه است. شبکهای که نسبت به اجرای شبکه عصبی در داخل خود اقدام میکند بطور حقیقی قابلیت استخراج آمارهای مرتبه بالاتر، از طریق اضافه نمودن یکی یا چند لایه مخفی، را خواهد داشت.
الگوریتم آموزش پس انتشاری
الگوریتم پس انتشاری در حقیقت یک شبکه چند لایه میباشد که از روال تعدیل وزنی مبتنی بر تابع سیگموئید، همانند قانون دلتا، بهره میجوید. بر حسب الگوریتم شبکه پس انتشاری (BPN)، یک شبکه پیشخورد کاملا متصل در نظر گرفته میشود. از اینرو، مضمون فعالیت این مبحث در مسیر از لایه ورودی به لایه خروجی سیر نموده و واحدهای موجود در یک لایه همگی به کلیه واحدهای دیگر در لایه بعدی متصل میشوند. اساسا، الگوریتم پس انتشاری مشتمل بر دو جارو(ب) شبکهای یعنی جاروب جلویی و جاروب عقبی میباشد. جاروب جلویی تعریف کننده شبکه از لایه ورودی به لایه خروجی میباشد، که در آن این جاروب باعث انتشار بردارهای ورودی در امتداد شبکه میشود تا آنکه در نهایت بروندادها را در لایه خروجی فراهم آورد.
تشخیص چهره تجزیه تک ارزشی شبکه عصبی
۴- روال اجرایی و نتایج
یکسری از تصاویر چهره مورد استفاده قرار گرفته که هر کدام از آنها مترادف با گوناگونی حالات چهره (بسته و باز شدن چشمها، لبخند / یا حالت بدون لبخند) و دیگر جزئیات مرتبط با چهره (با عینک / بدون عینک) میباشد. در این مبحث از ۱۰ تصویر مختلف بانک اطلاعات ORL استفاده شده است. کلیه تصاویر با یک پس زمینه همگن یا مشابه و بصورت عکسهای رودررو و مستقیم با میزان تلرانس و چرخش ۲۰ درجه تهیه شدند. این تصاویر در محدوده رنگ خاکستری با رزولوشن ۱۱۲ * ۹۲ بودند. آزمایشات بوسیله ۸ تصویر آموزشی و ۲ تصویر آزمایشی برای هر فرد انجام گردید. مرحله پیش پردازشی به منظور تشخیص تصاویر مختلف انجام گردیده و روالهای فرعی نیز بشرح ذیل مشخص شدند:
تصویر اصلی دچار فرسودگی شده یا بصورت تدریجی فرسایش یافتند.
سپس، تصویر اصلی به منظور بزرگ نمایی و یا پهن سازی کلیه خصیصههای تصویری بکار گرفته شد.
در نهایت، تصویر پیش پردازشی بصورت تفاوت بین تصویر بزرگ شده و فرسایش یافته نمود یافته و مورد بهره برداری قرار گرفت.
۱-۴٫ آزمایش ۱
در مطالعه اولی ما نسبت به مطالعه عملکرد شناسایی، جهت تشخیص تعداد سلولهای مخفی که میتوانند در بدست آوردن بهترین میزان دقت در سیستم مشارکت دشته باشند، اقدام نمودیم. بر این اساس، نرخهای شناسایی هر دو مقوله تست و آموزش برای ۲۰، ۳۰، ۴۰ و ۵۰ مورد سلول مخفی پس از ۱۰۰۰ سیکل آموزشی (که همچنین بنام مبدا یا دوره نیز خوانده میشوند) مورد محاسبه قرار داده شد. علاوه بر این مقوله، عملکرد این سیستم در طی نرخهای متفاوت فراگیری نیز مورد بررسی قرار داده شد. نرخهای فراگیری ذکر شده که در طی روال آموزشی بکار گرفته شدند عبارتند از ۰٫۲، ۰٫۲۵، ۰٫۳ و ۰٫۳۵٫ نتایج مربوطه در شکلهای ۴، ۵، ۶ و ۷ نشان داده شدهاند. شکل ۴ معرف دقت تصاویر آموزشی پس از ۱۰۰۰ سیکل فراگیری میباشد. با توجه بدانکه تعداد سلولهای مخفی و نرخهای فراگیری متفاوت بوده است، عملکرد سیستم نیز متفاوت میباشد. دقت آموزش با نرخ فراگیری ۰٫۲ و با توجه به۳۰ و ۴۰ سلول مخفی تقریبا ۹۰% بوده است. این سیستم دقت تست مساوی ۸۰% ، پس از ۱۰۰۰ سیکل آموزش، را حاصل آورده است که بر اساس شکل ۵ تعداد سلولهای مخفی ۳۰ مورد و نرخ یادگیری آن ۰٫۲ بوده است.
…
۲-۴٫ ترکیب با دیگر روشهای تشخیص چهره
در خلال سالیان گذشته، بواسطه کاربردهای تجاری زیاد این مقوله، روشهای گوناگونی برای تشخیص چهره توسعه یافتند. معروفترین روش توسعه یافته در این بین تکنیک Eigenfaces بود که بوسیله ترک و پنتلند، بر مبنای اصل PCA توسعه یافت. هدف اصلی PCA طرح و ترسیم دادههای ورودی بشکل تصاویر چهره در یک فضای ابعادی کوچکتر و بصورتی میباشد که گوناگونی بین دادهها بحداکثر رسد. بعبارت دیگر، آمار مرتبه دوم دادهها بوسیله این روش از حالت همبستگی بیرون میآید. سیستم تشخیص چهره منتج شده از این روش بنظر دارای قدرت کافی جهت نمایش تغییرات حاصله میباشد و در عین حال از مزیت مرتبط با کارایی حاصل شده از کاهش ابعاد سود میبرد. با این وجود، این موضوع در نظر گرفته میشود که آمار مرتبه بالاتر در یک کاربرد نظیر تشخیص چهره از اهمیت بسیار زیادی برخوردار میباشد. PCA در بحساب آوردن مقوله آمار مرتبه بالاتر اقبالی نداشته است. عملکرد روش پیشنهادی با استفاده از بانک اطلاعات تصاویر آموزشی در فاز فراگیری مورد تست و آزمایش قرار گرفت. نرخهای شناسایی بر روی تصاویر مختلف مورد ارزیابی قرار گرفته و بر این اساس مشاهده شد که عملکرد مربوطه بهتر از عملکرد مرتبط با PCA میباشد.
تشخیص چهره تجزیه تک ارزشی شبکه عصبی