مقالات ترجمه شده دانشگاهی ایران

تجسم چهره و شناسایی آن

تجسم چهره و شناسایی آن

تجسم چهره و شناسایی آن – ایران ترجمه – Irantarjomeh

 

مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی

مقالات

چگونگی سفارش مقاله

الف – پرداخت وجه بحساب وب سایت ایران ترجمه(شماره حساب)ب- اطلاع جزئیات به ایمیل irantarjomeh@gmail.comشامل: مبلغ پرداختی – شماره فیش / ارجاع و تاریخ پرداخت – مقاله مورد نظر --مقالات آماده سفارش داده شده پس از تایید به ایمیل شما ارسال خواهند شد.

قیمت

قیمت این مقاله: 38000 تومان (ایران ترجمه - Irantarjomeh)

توضیح

بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.

مقالات ترجمه شده کامپیوتر - ایران ترجمه - irantarjomeh

 

شماره      
۶۴
کد مقاله
COM64
مترجم
گروه مترجمین ایران ترجمه – irantarjomeh
نام فارسی
تجسم چهره و شناسایی آن
نام انگلیسی
Face Hallucination and Recognition
تعداد صفحه به فارسی
۲۶
تعداد صفحه به انگلیسی
۹
کلمات کلیدی به فارسی
تجسم چهره ، شناسایی
کلمات کلیدی به انگلیسی
Face Hallucination, Recognition
مرجع به فارسی
دپارتمان مهندسی اطلاعات، دانشگاه هنگ کنگ، چین
مرجع به انگلیسی
Department of Information Engineering, The Chinese University of Hong Kong
کشور
چین

 تجسم چهره و شناسایی آن

چکیده
در سیستمهای نظارت و کنترل ویدئویی، چهره‌های بکار گرفته شده و مورد نظر معمولاً دارای اندازه کوچکی می‌باشند. رزولوشن یا وضوح تصویر به عنوان یک عامل مهم تاثیر گذار در زمینه تشخیص چهره بوسیله انسان و کامپیوتر مطرح می‌باشد. در این مقاله، نسبت به مطالعه عملکرد تشخیص چهره با استفاده از رزولوشن‌های تصویری مختلف اقدام می‌نماییم. برای تشخیص چهره بصورت اتوماتیک، محدوده رزولوشن  پایین در طی آزمایشات انجام شده تعیین و مشخص شده است. در این مبحث ما از روش تجسم مبتنی بر ترادیسی-‌خاص[۱] جهت ارتقاء رزولوشن  تصویر استفاده می‌کنیم. تصاویر چهره مجسم شده نه تنها بعنوان یک مقوله شناسایی قابلیت کاربرد بوسیله انسان را خواهند داشت و در این مضون بسیار کارگشا واقع می‌شوند، بلکه  روال شناسایی اتوماتیک را نیز آسانتر خواهند نمود، چراکه چنین مضمونی بر روی تفاوت چهره از طریق اضافه نمودن برخی از جزئیات دارای فرکانس بالا تأکید دارد.

تجسم چهره و شناسایی آن

 

۱- مقدمه
در سیستمهای نظارتی و کنترل ویدئویی تصاویر پخش شده معمولاً دارای اندازه کوچکی می‌باشند، چراکه فاصله زیادی بین دوربین و موضوعات مورد نمایش وجود دارد. رزولوشن تصویر به عنوان یک عامل بالقوه ای به شمار می‌آید که بر روی عملکرد شناسایی چهره تأثیر گذار می‌باشد. در تصاویر دارای رزولوشن پایین بسیاری از جزئیات مربوط به ویژگی های چهره از دست می‌روند و چهره ها دیگر به وسیله انسان قابل شناسایی نخواهند بود. بر این اساس، ما بدین نکته توجه داشته‌ایم که در بسیاری از سیستمهای شناسایی چهره اتوماتیک، تصاویر صورت به اندازه های کوچک تری تقسیم شده تا بدینسان عملکرد رضایت بخشی حاصل شود. اما سوال مطرح شده این خواهد بود که چگونه رزولوشن تصویر بر روی شناسایی دقیق تأثیر گذار خواهد گذاشت، موضوعی که همچنان مباحث مربوط بدان ادامه دارد.
الگوریتم های مختلفی برای بوجود آوردن تصویر چهره دارای رزولوشن  بالا از یک عکس دارای رزولوشن  کم معرفی گردیده اند. این تکنیک به نام  تجسم سازی[۲] خوانده می‌شود. از آنجایی که تصاویر چهره دارای ساختار خوبی بوده و از ظاهر مشابهی برخوردار می‌باشند، آنها در یک فضای تصویری و ابعادی بزرگ یک زیر مجموعه کوچک را شامل می‌شوند. این امر موکد آن است که جزئیات دارای فرکانس بالا را می‌توان از اجزاء یا مولفه های دارای فرکانس پایین استنتاج نموده و بر این اساس شباهت ساختاری چهره را مورد استفاده قرار داد.
ساده ترین روش جهت افزایش رزولوشن، بکارگیری روش درون یابی مستقیم[۳] تصاویر ورودی با استفاده از الگوریتمهایی نظیر نزدیک‌ترین مجاور یا همسایه[۴]، منحنی مکعبی[۵] می‌باشد. اما در عین حال، عملکرد این مجموعه در صورتی که اندازه تصویر بسیار کوچک باشد ضعیف خواهد بود.  بر این مبنا، اشخاصی بنامهای بیکر و کانادی نسبت به توسعه روش تجسم سازی بر مبنای خصیصه تصویر چهره اقدام نمودند. این روش باعث می‌شود تا مولفه های دارای فرکانس بالا از یک ساختار والد یا منشاء، از طریق تشخیص خصیصه های محلی از مجموعه های آموزشی، استنتاج گردد. لیو و همکاران یک دیدگاه مدل سازی آماری دو مرحله ای را توسعه دادند که پارامترهای عمومی ‌و محلی را با یکدیگر ترکیب می‌نمود. امر تجسم سازی به صورت موثری باعث ارتقای رزولوشن تصاویر چهره گردیده و بر این اساس امر شناسایی چهره ها را برای انسان ها بسیار آسانتر نموده است. با این وجود، میزان اطلاعات استخراجی از یک تصویر دارای رزولوشن پایین به وسیله فرآیند تجسم سازی و مشارکت آن در زمینه تشخیص اتوماتیک چهره در مقوله های قبلی مورد کنکاش و بررسی قرار نگرفته‌اند.
در این مقاله، ما نسبت به مطالعه عملکرد تشخیص چهره با استفاده از رزولوشن های تصویری مختلف اقدام میکنیم. ما از یک روش تجسم سازی بدیع بر مبنای روال ترادیسی یا تبدیل خاص بهره می‌جوییم. این مطالعه دارای ارتباط نزدیکی با تحقیقاتی دارد که در آن دیدگاه ترادیسی خاص به منظور شناسایی طرح و قالب مطلوب به کار گرفته شده است. در مدل ما، PCA در زمینه تصویر چهره دارای رزولوشن پایین به کار گرفته شده است. در فضای PCA، مولفه های فرکانس های مختلف به صورت مستقل می‌باشند. از طریق انتخاب یک سری از ویژگی ها یا صفات چهره ای خاص، ما قابلیت استخراج حداکثر میزان اطلاعات از یک تصویر چهره دارای رزولوشن پایین را خواهیم داشت و علاوه بر این قابلیت حذف نویزهای تصویر را نیز دارا می‌باشیم. تصویر چهره تجسم یافته جدید از طریق نقشه برداری بین جفت های آموزش دارای رزولوشن پایین و بالا تحقق می‌یابد. علاوه بر این ما نسبت به مطالعه تـأثیر روال تجسم سازی بر روی شناسایی اتوماتیک چهره اقدام نمودیم. از آنجاییکه روال تجسم سازی بر روی تفاوت چهره از طریق اضافه نمودن جزئیات دارای فرکانس بالا تمایز قایل می‌شود، می‌توان گفت که چنین رویه ای می‌تواند در زمینه تشخیص اتوماتیک موثر واقع شود. تجربه های مربوطه بر روی یک بانک اطلاعات که حاوی تصاویری از ۱۸۸ شخص خاص و داده‌های بانک اطلاعاتی چهره XM2VTS  بوده است انجام گردید.
 

تجسم چهره و شناسایی آن

 

۲- آنالیز چند رزولوشنه
با تصور یک شکل دو بعدی به عنوان یک بردار، فرآیند بدست آوردن تصویر چهره دارای رزولوشن پایین از یک تصویر چهره دارای رزولوشن بالا را می‌توان به شرح ذیل به صورت فرمول نشان داد.
   
در اینجا  و  به ترتیب معرف بردارهای تصویر چهره دارای رزولوشن بالا و پایین می‌باشند. H به عنوان ماتریس ترادیسی به شمار می‌آید که شامل فرآیند تیره سازی یا محوسازی و همچنین فرآیند کاهش رزولوشن تصویر که به نام دانسمپلینگ[۶] می‌باشد و  نیز به عنوان آشفتگی یا انحراف نویز در تصویر چهره دارای رزولوشن پایین به شمار می‌آید که به وسیله یک دوربین گرفته شده است.
همانگونه که در شکل ۱ نشان داده می‌شود، فرآیند هموارسازی تکراری و دانسمپلینگ تصویر چهره را به نوارهای مختلفی تجزیه می‌کنند، یعنی  ،…..، . در این روال تجزیه، باندهای فرکانس مختلف مستقل نمی‌باشند. برخی از مولفه ها یا اجزای دارای باندهای فرکانس بالا،  ، را می‌توان از باند فرکانس پایین  استنباط نمود. این امر در حقیقت به عنوان نقطه آغازین برای انجام روال تجسم سازی تصویر به شمار می‌آید. بسیاری از الگوریتم های دارای رزولوشن بالا یا سوپر رزولوشن امر وابستگی را به عنوان فیلدهای تصادفی مارکوف همگن  (MRFs) به شمار می‌آورند، بدان معنا که پیکسل مربوطه بر روی پیکسل های ناحیه مجاور یا همسایگی خود قرار خواهد گرفت. این موضوع یک فرضیه برای تصاویر کلی به شمار می‌آید. البته چنین مضمونی به عنوان یک موقعیت ایده آل برای کلاس چهره بدون در نظر گرفتن مشابهت های ساختاری چهره چندان قابل توجه نخواهد بود. یکی از روش های بهتر جهت مخاطب قرار دادن مضمون وابستگی استفاده از PCA می‌باشد، که در آن اجزای فرکانس مختلف به صورت مستقل خواهند بود.

تجسم چهره و شناسایی آن

 

۳- تجسم سازی و شناسایی
تصویر چهره را می‌توان از طریق برخی از ویژگی های چهره در شاخص های مربوط به PCA مورد بازسازی مجدد قرار داد. PCA علاوه بر این قابلیت تجزیه تصویر چهره به مولفه ها یا اجزای فرکانسی مختلف را خواهد داشت، اما این امر از طریق کد سازی اطلاعات چهره بصورت فشرده تر حاصل می‌شود، چرا که می‌بایست مضمون های توزیعی چهره را به حساب آورد. الگوریتم پیشنهادی ما در ابتدا از PCA تا حد امکان به منظور استخراج اطلاعات لازم از یک تصویر چهره دارای رزولوشن پایین بهره می‌گیرد و پس از آن نسبت به انجام روال مربوط به استخراج یک تصویر چهره دارای رزولوشن بالا از طریق مضمون کسب اطلاعات چهره اقدام می‌کند. تشریح کامل روال ترادیسی ویژگی های چهره را می‌توان در (۵) مشاهده نمود.
۱-۳ آنالیز اجزای اصلی
در اینجا ما نسبت به معرفی یک سری از تصاویر چهره در یک قالب N×M، اقدام می‌کنیم،  ، جاییکه  بردار تصویر، N تعداد پیکسل تصویر و M نیز تعداد نمونه های آموزش () خواهد بود. در PCA، یک سری از بردارهای ویژه  ، که همچنین تحت عنوان ویژگیهای چهره نیز خوانده می‌شوند، از مجموع ماتریس کوورایانس، محاسبه می‌شوند:
شکل ۲ نشان دهنده برخی از این ویژگی های صورت می‌باشد که به وسیله مقادیر ویژه ذخیره شده اند. این ویژگی های چهره با مقادیر بزرگ مربوطه که به صورت “چهره مانند” می‌باشند از خصیصه مولفه های دارای فرکانس پایین برخوردار می‌باشند. ویژگی های چهره ای که دارای مقادیر ویژگی اندکی باشد تحت عنوان “نویز- مانند” خوانده می‌شود و در حقیقت مشخص کننده جزئیات دارای فرکانس بالا می‌باشد.
۲-۳ ترادیسی خاص
با توجه به مجموعه نمونه دارای رزولوشن پایین L ، بر حسب قضیه تجزیه ارزش واحد،  را می‌توان از طریق معادله فوق محاسبه نمود:
 
این امر نشان دهنده آن است که تصویر چهره دارای رزولوشن پایین ورودی را می‌توان از طریق ترکیب خطی بهینه تصاویر چهره آموزشی دارای رزولوشن پایین M مورد بازسازی مجدد قرار داد. از طریق جایگزینی هریک از تصویرهای دارای رزولوشن پایین  با نمونه دارای رزولوشن بالای  و سپس جایگزینی  با میانگین چهره رزولوشن بالا، می‌توان چند تا نقطه را به دست آورد. که به نظر می‌رسد به عنوان یک تقریب برای تصویر چهره دارای رزولوشن بالای حقیقی مطرح است.
 
۳-۳ شناسایی
در الگوریتم ما، تصویر چهره تجسم یافته از طریق ترکیب خطی تصاویر آموزشی دارای رزولوشن بالا تحت فرآیند ترکیب یا سنتز قرار گرفته و از این طریق ضریب های مربوطه از تصاویر چهره دارای رزولوشن پایین با استفاده از روش PCA حاصل می‌شوند. بواسطه مشابهت های ساختاری در بین تصاویر چهره، در آنالیز چند رزولوشنه، یک همبستگی قوی بین باند دارای رزولوشن بالا و باند دارای رزولوشن پایین وجود دارد. برای تصاویر چهره دارای رزولوشن بالا، PCA قابلیت متراکم سازی این اطلاعات همبسته، به یک تعداد کوچکی از اجزای اصلی را خواهد داشت. از اینرو، در فرآیند ترادیسی ویژگیها، چنین اجزای اصلی را می‌توان از تصویر چهره دارای رزولوشن پایین و بواسطه برداشتن نقشه بین جفت های آموزشی دارای رزولوشن پایین استخراج نمود. بنابراین، برخی از اطلاعات در باند فرکانس بالا به صورت نسبی بازیافت می‌شوند.
در عمل، تصویر دارای رزولوشن پایین معمولاً به وسیله نویز توزیع یا پراکنده می‌گردد و دارای یک توزیع مسطح بر روی کلیه محورها خواهد بود. برای تصاویر چهره دارای رزولوشن پایین، انرژی بر روی بردارهای مشخصه کوچک به میزان اندک می‌باشد، بنابراین به وسیله نویز پوشانده می‌شوند. از طریق انتخاب یک عدد ویژگی چهره K ، ما قابلیت استخراج اطلاعات چهره و حذف نویزها را خواهیم داشت. اطلاعات مرتبط با اجزای دارای نویز(ویژگی های چهره پس از K در شکل ۳) از دست خواهند رفت و آنها را نمی‌توان مورد بازیافت قرار داد، چرا که اجزای مرتبط با بردارهای مشخصه مختلف، در فضای PCA به صورت مستقل می‌باشند. بدین مضمون روش مجسم سازی ما توانست حداکثر میزان اطلاعات چهره موجود در تصاویر چهره دارای رزولوشن پایین را استخراج نماید.
با توجه به ارتقای قابل ملاحظه ظاهر چهره از طریق اعمال فرآیند تجسم سازی، امر بررسی این مضمون که آیا روال تجسم سازی می‌تواند در زمینه شناسایی نیز کاربرد داشته باشد قابل توجه خواهد بود. از آنجایی که جزئیات دارای فرکانس بالا بازیافت می‌شوند، ما انتظار خواهیم داشت که فرآیند تجسم سازی بتواند در زمینه عملکرد شناسایی مفید و موثر واقع شود.

تجسم چهره و شناسایی آن

 

 ۴- تجربه
۱-۴ تجربه تجسم سازی
تجربه تجسم سازی ما بر روی یک مجموعه اطلاعاتی حاوی ۱۸۸ فرد که هرکدام دارای یک تصویر چهره بودند انجام پذیرفت. با استفاده از روش        «leave-one-out»، در هر زمان، یک تصویر برای تست انتخاب می‌شود و بقیه نیز جهت آموزش برگزیده می‌گردند. در فرآیند پیش پردازشی، تصاویر چهره به وسیله دو چشم منطبق می‌شوند. فاصله بین مرکز چشم به صورت ۵۰ پیکسلی تنظیم می‌شود و اندازه تصویر نیز به میزان ۱۱۷×۱۲۵ تثبیت می‌گردد. تصاویر به وسیله مشخص کردن میانگین پیکسل های مجاور و همچنین فرآیند دانسمپلینگ به تصاویر دارای رزولوشن پایین، به صورت تیره و تار درمی‌آیند. در اینجا ، ما از فاصله مرکز چشم .de جهت ارزیابی رزولوشن چهره استفاده می‌کنیم.
برخی از نتایج مجسم سازی در شکل ۴ نشان داده شده اند. تصاویر چهره ورودی به میزان ۲۵×۲۳ نمونه برداری شده که از طریق de مساوی۱۰ حاصل می‌شود. با مقایسه با نتایج درون یابی مکعبی B-Spline، تصاویر چهره مجسم شده دارای ویژگی های آشکارتر و جزئیات روشن تری خواهند بود. آن ها از تقریب مناسبی نسبت به تصاویر دارای رزولوشن بالا برخوردار می‌باشند.

تجسم چهره و شناسایی آن

۲-۴ آزمایش شناسایی
ما نسبت به بررسی عملکرد شناسایی با استفاده از تصاویر چهره با رزولوشن پایین و همچنین تصاویر چهره تجسم یافته اقدام نمودیم. بر این اساس ۲۹۵ فرد از بانک اطلاعاتی چهره XM2VTS انتخاب گردیدند، که در این آزمایش ۲ تصویر چهره در نشست های مختلف برای هر فرد به کار گرفته شد. یک تصویر به عنوان مرجع مورد استفاده قرار گرفت و تصویر دیگر نیز به عنوان تست به کار گرفته شد. ما از همبستگی مستقیم برای امر شناسایی استفاده نمودیم، که احتمالاً به عنوان ساده ترین الگوریتم شناسایی چهره می‌باشد. دقتهای  شناسایی در خلال رزولوشن های مختلف در شکل ۸ مشخص شده‌اند. به هنگامی‌که de از ۵۰ به ۱۰ کاهش یافت، تنها نوسان اندکی در خصوص دقت شناسایی با استفاده از تصاویر چهره دارای رزولوشن پایین محرز گردید. به هنگامی‌که de دوباره از ۷ به ۵ تقلیل یافت، دقت شناسایی نیز برای تصاویر چهره دارای رزولوشن پایین به میزان زیادی افت نمود. رزولوشن با توجه به de=10 احتمالاً به عنوان مرز حداقل برای شناسایی مطرح می‌باشد. در زیر این سطح اطلاعات قابل توجهی برای شناسایی وجود نخواهد داشت. این موضوع همچنین با آزمایش تجسم سازی بخش ۱-۴ نیز سازگار می‌باشد که اطلاعات مربوط به نتایج تجسم سازی به صورت موفق، به هنگامی‌که de>10  می‌باشد، را می‌توان حاصل نمود.
علاوه بر این ما سعی نمودیم تا نسبت به بررسی این موضوع اقدام کنیم که آیا روال تجسم سازی می‌تواند برای امر شناسایی چهره به صورت اتوماتیک به کار برده شود یا خیر. ما انتظار داریم که این روال بتواند  امر شناسایی را به صورت آسان تری انجام دهد، چرا که بر روی  تفاوت های چهره از طریق اضافه نمودن برخی از جزئیات دارای فرکانس بالا اقدام می‌کند. در این آزمایش، یک تصویر تست دارای رزولوشن پایین از طریق تصاویر چهره مرجع مورد تجسم سازی قرار گرفت، اما تصویر چهره افراد تست شده از مجموعه آموزشی کنار گذاشته شد. همانگونه که در شکل ۸ نشان داده شده است، روال تجسم سازی باعث ارتقای دقت شناسایی به هنگامی‌می‌شود که تصاویر چهره ورودی دارای رزولوشن بسیار پایینی می‌باشند.

تجسم چهره و شناسایی آن

 

۵. نتیجه گیری
روش تجسم سازی ما بر مبنای داده های ترادیسی خاص، قابلیت استخراج حداکثر داده های چهره، از تصاویر چهره با رزولوشن پایین، را دارا می‌باشد و همچنین از قابلیت استخراج برخی از خصیصه های چهره ای تصاویر دارای فرکانس بالا، به منظور حاصل آوردن تصاویر چهره به صورت متمایز تر، نیز برخوردار می‌باشد. بعلاوه، این تکنیک می‌تواند امر شناسایی چهره به صورت اتوماتیک را با راحتی بیشتری انجام دهد. در این مبحث ما همچنین نسبت به مطالعه عملکرد شناسایی چهره با توجه به رزولوشن های مختلف اقدام نمودیم. یک محدوده دارای رزولوشن پایین برای شناسایی در این  آزمایش مشخص شده است. البته لازم به ذکر است که چنین آزمایشاتی به عنوان مطالعات مقدماتی به شمار می‌آیند. نتایج بدست آمده نیازمند بررسی ها و تأیید بیشتری می‌باشند و برای این کار باید از الگوریتم های شناسایی چهره و مجموعه داده‌های بیشتر بهره جست.
[۱] eigentransformation
[۲] hallucination
[۳] direct interpolation
[۴] nearest neighbour
[۵] cubic spline
[۶] downsampling

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Irantarjomeh
لطفا به جای کپی مقالات با خرید آنها به قیمتی بسیار متناسب مشخص شده ما را در ارانه هر چه بیشتر مقالات و مضامین ترجمه شده علمی و بهبود محتویات سایت ایران ترجمه یاری دهید.