تجسم چهره و شناسایی آن
تجسم چهره و شناسایی آن – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 38000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۶۴ |
کد مقاله | COM64 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | تجسم چهره و شناسایی آن |
نام انگلیسی | Face Hallucination and Recognition |
تعداد صفحه به فارسی | ۲۶ |
تعداد صفحه به انگلیسی | ۹ |
کلمات کلیدی به فارسی | تجسم چهره ، شناسایی |
کلمات کلیدی به انگلیسی | Face Hallucination, Recognition |
مرجع به فارسی | دپارتمان مهندسی اطلاعات، دانشگاه هنگ کنگ، چین |
مرجع به انگلیسی | Department of Information Engineering, The Chinese University of Hong Kong |
کشور | چین |
تجسم چهره و شناسایی آن
چکیده
در سیستمهای نظارت و کنترل ویدئویی، چهرههای بکار گرفته شده و مورد نظر معمولاً دارای اندازه کوچکی میباشند. رزولوشن یا وضوح تصویر به عنوان یک عامل مهم تاثیر گذار در زمینه تشخیص چهره بوسیله انسان و کامپیوتر مطرح میباشد. در این مقاله، نسبت به مطالعه عملکرد تشخیص چهره با استفاده از رزولوشنهای تصویری مختلف اقدام مینماییم. برای تشخیص چهره بصورت اتوماتیک، محدوده رزولوشن پایین در طی آزمایشات انجام شده تعیین و مشخص شده است. در این مبحث ما از روش تجسم مبتنی بر ترادیسی-خاص[۱] جهت ارتقاء رزولوشن تصویر استفاده میکنیم. تصاویر چهره مجسم شده نه تنها بعنوان یک مقوله شناسایی قابلیت کاربرد بوسیله انسان را خواهند داشت و در این مضون بسیار کارگشا واقع میشوند، بلکه روال شناسایی اتوماتیک را نیز آسانتر خواهند نمود، چراکه چنین مضمونی بر روی تفاوت چهره از طریق اضافه نمودن برخی از جزئیات دارای فرکانس بالا تأکید دارد.
تجسم چهره و شناسایی آن
۱- مقدمه
در سیستمهای نظارتی و کنترل ویدئویی تصاویر پخش شده معمولاً دارای اندازه کوچکی میباشند، چراکه فاصله زیادی بین دوربین و موضوعات مورد نمایش وجود دارد. رزولوشن تصویر به عنوان یک عامل بالقوه ای به شمار میآید که بر روی عملکرد شناسایی چهره تأثیر گذار میباشد. در تصاویر دارای رزولوشن پایین بسیاری از جزئیات مربوط به ویژگی های چهره از دست میروند و چهره ها دیگر به وسیله انسان قابل شناسایی نخواهند بود. بر این اساس، ما بدین نکته توجه داشتهایم که در بسیاری از سیستمهای شناسایی چهره اتوماتیک، تصاویر صورت به اندازه های کوچک تری تقسیم شده تا بدینسان عملکرد رضایت بخشی حاصل شود. اما سوال مطرح شده این خواهد بود که چگونه رزولوشن تصویر بر روی شناسایی دقیق تأثیر گذار خواهد گذاشت، موضوعی که همچنان مباحث مربوط بدان ادامه دارد.
الگوریتم های مختلفی برای بوجود آوردن تصویر چهره دارای رزولوشن بالا از یک عکس دارای رزولوشن کم معرفی گردیده اند. این تکنیک به نام تجسم سازی[۲] خوانده میشود. از آنجایی که تصاویر چهره دارای ساختار خوبی بوده و از ظاهر مشابهی برخوردار میباشند، آنها در یک فضای تصویری و ابعادی بزرگ یک زیر مجموعه کوچک را شامل میشوند. این امر موکد آن است که جزئیات دارای فرکانس بالا را میتوان از اجزاء یا مولفه های دارای فرکانس پایین استنتاج نموده و بر این اساس شباهت ساختاری چهره را مورد استفاده قرار داد.
ساده ترین روش جهت افزایش رزولوشن، بکارگیری روش درون یابی مستقیم[۳] تصاویر ورودی با استفاده از الگوریتمهایی نظیر نزدیکترین مجاور یا همسایه[۴]، منحنی مکعبی[۵] میباشد. اما در عین حال، عملکرد این مجموعه در صورتی که اندازه تصویر بسیار کوچک باشد ضعیف خواهد بود. بر این مبنا، اشخاصی بنامهای بیکر و کانادی نسبت به توسعه روش تجسم سازی بر مبنای خصیصه تصویر چهره اقدام نمودند. این روش باعث میشود تا مولفه های دارای فرکانس بالا از یک ساختار والد یا منشاء، از طریق تشخیص خصیصه های محلی از مجموعه های آموزشی، استنتاج گردد. لیو و همکاران یک دیدگاه مدل سازی آماری دو مرحله ای را توسعه دادند که پارامترهای عمومی و محلی را با یکدیگر ترکیب مینمود. امر تجسم سازی به صورت موثری باعث ارتقای رزولوشن تصاویر چهره گردیده و بر این اساس امر شناسایی چهره ها را برای انسان ها بسیار آسانتر نموده است. با این وجود، میزان اطلاعات استخراجی از یک تصویر دارای رزولوشن پایین به وسیله فرآیند تجسم سازی و مشارکت آن در زمینه تشخیص اتوماتیک چهره در مقوله های قبلی مورد کنکاش و بررسی قرار نگرفتهاند.
در این مقاله، ما نسبت به مطالعه عملکرد تشخیص چهره با استفاده از رزولوشن های تصویری مختلف اقدام میکنیم. ما از یک روش تجسم سازی بدیع بر مبنای روال ترادیسی یا تبدیل خاص بهره میجوییم. این مطالعه دارای ارتباط نزدیکی با تحقیقاتی دارد که در آن دیدگاه ترادیسی خاص به منظور شناسایی طرح و قالب مطلوب به کار گرفته شده است. در مدل ما، PCA در زمینه تصویر چهره دارای رزولوشن پایین به کار گرفته شده است. در فضای PCA، مولفه های فرکانس های مختلف به صورت مستقل میباشند. از طریق انتخاب یک سری از ویژگی ها یا صفات چهره ای خاص، ما قابلیت استخراج حداکثر میزان اطلاعات از یک تصویر چهره دارای رزولوشن پایین را خواهیم داشت و علاوه بر این قابلیت حذف نویزهای تصویر را نیز دارا میباشیم. تصویر چهره تجسم یافته جدید از طریق نقشه برداری بین جفت های آموزش دارای رزولوشن پایین و بالا تحقق مییابد. علاوه بر این ما نسبت به مطالعه تـأثیر روال تجسم سازی بر روی شناسایی اتوماتیک چهره اقدام نمودیم. از آنجاییکه روال تجسم سازی بر روی تفاوت چهره از طریق اضافه نمودن جزئیات دارای فرکانس بالا تمایز قایل میشود، میتوان گفت که چنین رویه ای میتواند در زمینه تشخیص اتوماتیک موثر واقع شود. تجربه های مربوطه بر روی یک بانک اطلاعات که حاوی تصاویری از ۱۸۸ شخص خاص و دادههای بانک اطلاعاتی چهره XM2VTS بوده است انجام گردید.
تجسم چهره و شناسایی آن
۲- آنالیز چند رزولوشنه
با تصور یک شکل دو بعدی به عنوان یک بردار، فرآیند بدست آوردن تصویر چهره دارای رزولوشن پایین از یک تصویر چهره دارای رزولوشن بالا را میتوان به شرح ذیل به صورت فرمول نشان داد.
در اینجا و به ترتیب معرف بردارهای تصویر چهره دارای رزولوشن بالا و پایین میباشند. H به عنوان ماتریس ترادیسی به شمار میآید که شامل فرآیند تیره سازی یا محوسازی و همچنین فرآیند کاهش رزولوشن تصویر که به نام دانسمپلینگ[۶] میباشد و نیز به عنوان آشفتگی یا انحراف نویز در تصویر چهره دارای رزولوشن پایین به شمار میآید که به وسیله یک دوربین گرفته شده است.
همانگونه که در شکل ۱ نشان داده میشود، فرآیند هموارسازی تکراری و دانسمپلینگ تصویر چهره را به نوارهای مختلفی تجزیه میکنند، یعنی ،…..، . در این روال تجزیه، باندهای فرکانس مختلف مستقل نمیباشند. برخی از مولفه ها یا اجزای دارای باندهای فرکانس بالا، ، را میتوان از باند فرکانس پایین استنباط نمود. این امر در حقیقت به عنوان نقطه آغازین برای انجام روال تجسم سازی تصویر به شمار میآید. بسیاری از الگوریتم های دارای رزولوشن بالا یا سوپر رزولوشن امر وابستگی را به عنوان فیلدهای تصادفی مارکوف همگن (MRFs) به شمار میآورند، بدان معنا که پیکسل مربوطه بر روی پیکسل های ناحیه مجاور یا همسایگی خود قرار خواهد گرفت. این موضوع یک فرضیه برای تصاویر کلی به شمار میآید. البته چنین مضمونی به عنوان یک موقعیت ایده آل برای کلاس چهره بدون در نظر گرفتن مشابهت های ساختاری چهره چندان قابل توجه نخواهد بود. یکی از روش های بهتر جهت مخاطب قرار دادن مضمون وابستگی استفاده از PCA میباشد، که در آن اجزای فرکانس مختلف به صورت مستقل خواهند بود.
تجسم چهره و شناسایی آن
۳- تجسم سازی و شناسایی
تصویر چهره را میتوان از طریق برخی از ویژگی های چهره در شاخص های مربوط به PCA مورد بازسازی مجدد قرار داد. PCA علاوه بر این قابلیت تجزیه تصویر چهره به مولفه ها یا اجزای فرکانسی مختلف را خواهد داشت، اما این امر از طریق کد سازی اطلاعات چهره بصورت فشرده تر حاصل میشود، چرا که میبایست مضمون های توزیعی چهره را به حساب آورد. الگوریتم پیشنهادی ما در ابتدا از PCA تا حد امکان به منظور استخراج اطلاعات لازم از یک تصویر چهره دارای رزولوشن پایین بهره میگیرد و پس از آن نسبت به انجام روال مربوط به استخراج یک تصویر چهره دارای رزولوشن بالا از طریق مضمون کسب اطلاعات چهره اقدام میکند. تشریح کامل روال ترادیسی ویژگی های چهره را میتوان در (۵) مشاهده نمود.
۱-۳ آنالیز اجزای اصلی
در اینجا ما نسبت به معرفی یک سری از تصاویر چهره در یک قالب N×M، اقدام میکنیم، ، جاییکه بردار تصویر، N تعداد پیکسل تصویر و M نیز تعداد نمونه های آموزش () خواهد بود. در PCA، یک سری از بردارهای ویژه ، که همچنین تحت عنوان ویژگیهای چهره نیز خوانده میشوند، از مجموع ماتریس کوورایانس، محاسبه میشوند:
شکل ۲ نشان دهنده برخی از این ویژگی های صورت میباشد که به وسیله مقادیر ویژه ذخیره شده اند. این ویژگی های چهره با مقادیر بزرگ مربوطه که به صورت “چهره مانند” میباشند از خصیصه مولفه های دارای فرکانس پایین برخوردار میباشند. ویژگی های چهره ای که دارای مقادیر ویژگی اندکی باشد تحت عنوان “نویز- مانند” خوانده میشود و در حقیقت مشخص کننده جزئیات دارای فرکانس بالا میباشد.
۲-۳ ترادیسی خاص
با توجه به مجموعه نمونه دارای رزولوشن پایین L ، بر حسب قضیه تجزیه ارزش واحد، را میتوان از طریق معادله فوق محاسبه نمود:
این امر نشان دهنده آن است که تصویر چهره دارای رزولوشن پایین ورودی را میتوان از طریق ترکیب خطی بهینه تصاویر چهره آموزشی دارای رزولوشن پایین M مورد بازسازی مجدد قرار داد. از طریق جایگزینی هریک از تصویرهای دارای رزولوشن پایین با نمونه دارای رزولوشن بالای و سپس جایگزینی با میانگین چهره رزولوشن بالا، میتوان چند تا نقطه را به دست آورد. که به نظر میرسد به عنوان یک تقریب برای تصویر چهره دارای رزولوشن بالای حقیقی مطرح است.
۳-۳ شناسایی
در الگوریتم ما، تصویر چهره تجسم یافته از طریق ترکیب خطی تصاویر آموزشی دارای رزولوشن بالا تحت فرآیند ترکیب یا سنتز قرار گرفته و از این طریق ضریب های مربوطه از تصاویر چهره دارای رزولوشن پایین با استفاده از روش PCA حاصل میشوند. بواسطه مشابهت های ساختاری در بین تصاویر چهره، در آنالیز چند رزولوشنه، یک همبستگی قوی بین باند دارای رزولوشن بالا و باند دارای رزولوشن پایین وجود دارد. برای تصاویر چهره دارای رزولوشن بالا، PCA قابلیت متراکم سازی این اطلاعات همبسته، به یک تعداد کوچکی از اجزای اصلی را خواهد داشت. از اینرو، در فرآیند ترادیسی ویژگیها، چنین اجزای اصلی را میتوان از تصویر چهره دارای رزولوشن پایین و بواسطه برداشتن نقشه بین جفت های آموزشی دارای رزولوشن پایین استخراج نمود. بنابراین، برخی از اطلاعات در باند فرکانس بالا به صورت نسبی بازیافت میشوند.
در عمل، تصویر دارای رزولوشن پایین معمولاً به وسیله نویز توزیع یا پراکنده میگردد و دارای یک توزیع مسطح بر روی کلیه محورها خواهد بود. برای تصاویر چهره دارای رزولوشن پایین، انرژی بر روی بردارهای مشخصه کوچک به میزان اندک میباشد، بنابراین به وسیله نویز پوشانده میشوند. از طریق انتخاب یک عدد ویژگی چهره K ، ما قابلیت استخراج اطلاعات چهره و حذف نویزها را خواهیم داشت. اطلاعات مرتبط با اجزای دارای نویز(ویژگی های چهره پس از K در شکل ۳) از دست خواهند رفت و آنها را نمیتوان مورد بازیافت قرار داد، چرا که اجزای مرتبط با بردارهای مشخصه مختلف، در فضای PCA به صورت مستقل میباشند. بدین مضمون روش مجسم سازی ما توانست حداکثر میزان اطلاعات چهره موجود در تصاویر چهره دارای رزولوشن پایین را استخراج نماید.
با توجه به ارتقای قابل ملاحظه ظاهر چهره از طریق اعمال فرآیند تجسم سازی، امر بررسی این مضمون که آیا روال تجسم سازی میتواند در زمینه شناسایی نیز کاربرد داشته باشد قابل توجه خواهد بود. از آنجایی که جزئیات دارای فرکانس بالا بازیافت میشوند، ما انتظار خواهیم داشت که فرآیند تجسم سازی بتواند در زمینه عملکرد شناسایی مفید و موثر واقع شود.
تجسم چهره و شناسایی آن
۴- تجربه
۱-۴ تجربه تجسم سازی
تجربه تجسم سازی ما بر روی یک مجموعه اطلاعاتی حاوی ۱۸۸ فرد که هرکدام دارای یک تصویر چهره بودند انجام پذیرفت. با استفاده از روش «leave-one-out»، در هر زمان، یک تصویر برای تست انتخاب میشود و بقیه نیز جهت آموزش برگزیده میگردند. در فرآیند پیش پردازشی، تصاویر چهره به وسیله دو چشم منطبق میشوند. فاصله بین مرکز چشم به صورت ۵۰ پیکسلی تنظیم میشود و اندازه تصویر نیز به میزان ۱۱۷×۱۲۵ تثبیت میگردد. تصاویر به وسیله مشخص کردن میانگین پیکسل های مجاور و همچنین فرآیند دانسمپلینگ به تصاویر دارای رزولوشن پایین، به صورت تیره و تار درمیآیند. در اینجا ، ما از فاصله مرکز چشم .de جهت ارزیابی رزولوشن چهره استفاده میکنیم.
برخی از نتایج مجسم سازی در شکل ۴ نشان داده شده اند. تصاویر چهره ورودی به میزان ۲۵×۲۳ نمونه برداری شده که از طریق de مساوی۱۰ حاصل میشود. با مقایسه با نتایج درون یابی مکعبی B-Spline، تصاویر چهره مجسم شده دارای ویژگی های آشکارتر و جزئیات روشن تری خواهند بود. آن ها از تقریب مناسبی نسبت به تصاویر دارای رزولوشن بالا برخوردار میباشند.
تجسم چهره و شناسایی آن
۲-۴ آزمایش شناسایی
ما نسبت به بررسی عملکرد شناسایی با استفاده از تصاویر چهره با رزولوشن پایین و همچنین تصاویر چهره تجسم یافته اقدام نمودیم. بر این اساس ۲۹۵ فرد از بانک اطلاعاتی چهره XM2VTS انتخاب گردیدند، که در این آزمایش ۲ تصویر چهره در نشست های مختلف برای هر فرد به کار گرفته شد. یک تصویر به عنوان مرجع مورد استفاده قرار گرفت و تصویر دیگر نیز به عنوان تست به کار گرفته شد. ما از همبستگی مستقیم برای امر شناسایی استفاده نمودیم، که احتمالاً به عنوان ساده ترین الگوریتم شناسایی چهره میباشد. دقتهای شناسایی در خلال رزولوشن های مختلف در شکل ۸ مشخص شدهاند. به هنگامیکه de از ۵۰ به ۱۰ کاهش یافت، تنها نوسان اندکی در خصوص دقت شناسایی با استفاده از تصاویر چهره دارای رزولوشن پایین محرز گردید. به هنگامیکه de دوباره از ۷ به ۵ تقلیل یافت، دقت شناسایی نیز برای تصاویر چهره دارای رزولوشن پایین به میزان زیادی افت نمود. رزولوشن با توجه به de=10 احتمالاً به عنوان مرز حداقل برای شناسایی مطرح میباشد. در زیر این سطح اطلاعات قابل توجهی برای شناسایی وجود نخواهد داشت. این موضوع همچنین با آزمایش تجسم سازی بخش ۱-۴ نیز سازگار میباشد که اطلاعات مربوط به نتایج تجسم سازی به صورت موفق، به هنگامیکه de>10 میباشد، را میتوان حاصل نمود.
علاوه بر این ما سعی نمودیم تا نسبت به بررسی این موضوع اقدام کنیم که آیا روال تجسم سازی میتواند برای امر شناسایی چهره به صورت اتوماتیک به کار برده شود یا خیر. ما انتظار داریم که این روال بتواند امر شناسایی را به صورت آسان تری انجام دهد، چرا که بر روی تفاوت های چهره از طریق اضافه نمودن برخی از جزئیات دارای فرکانس بالا اقدام میکند. در این آزمایش، یک تصویر تست دارای رزولوشن پایین از طریق تصاویر چهره مرجع مورد تجسم سازی قرار گرفت، اما تصویر چهره افراد تست شده از مجموعه آموزشی کنار گذاشته شد. همانگونه که در شکل ۸ نشان داده شده است، روال تجسم سازی باعث ارتقای دقت شناسایی به هنگامیمیشود که تصاویر چهره ورودی دارای رزولوشن بسیار پایینی میباشند.
تجسم چهره و شناسایی آن