رابط انسان ربات سیستم دیداری هوشمند
رابط انسان ربات سیستم دیداری هوشمند – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 38000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
۶۶ | |
کد مقاله | COM66 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | سیستم بصری / دیداری هوشمند رابطی بین انسان و روبات |
نام انگلیسی | Intelligent Vision System for Human-Robot Interface |
تعداد صفحه به فارسی | ۲۹ |
تعداد صفحه به انگلیسی | ۷ |
کلمات کلیدی به فارسی | فیلتر چوله فازی، تعامل انسان ـ روبات، کنتراست جذر میانگین مربعات (RMS)، تفکیک رنگ پوست |
کلمات کلیدی به انگلیسی | Fuzzily skewed filter, human-robot interface, rms , contrast, skin color segmentation |
مرجع به فارسی | دپارتمان علوم کامپیوتر و مهندسی، دانشگاه جهانگیرنگار، بنگلادشدپارتمان روان شناسی، دانشگاه هال، انگلستان |
مرجع به انگلیسی | International Journal of Information and Communication Technology |
کشور |
سیستم بصری هوشمند رابطی بین انسان و روبات
چکیده
این مقاله توسعه سیستم بصری هوشمند در زمینه تعامل بین انسان و روبات را مورد بررسی قرار میدهد. دو مبحث جدید اعمال شده در این مقاله عبارتند از: ۱) تشخیص چهره انسان و ۲) مشخص نمودن موقعیت چشم. این روش بر مبنای صفات بصری یا دیداری رنگهای پوست انسان و آنالیز هندسی اسکلت صورت میباشد. این روش نسبت به معرفی روش فیلترینگ حوزه فضایی که به نام «فیلتر چوله فازی» خوانده میشود اقدام مینماید و در آن قواعد فازی برای تعیین سطح خاکستری پیکسلها در تصویر و در نواحی مجاور مورد استفاده قرار گرفته و همچنین مزیتهای فیلترهای میانه و حد میانگین نیز بکار گرفته شدهاند. تاثیر این روش در خلال اعمال دستورات رهگیری چشم با بکارگیری روباتی که به نام AIBO خوانده میشود مورد کنکاش و مطالعه قرار میگیرد.
کلمات کلیدی: فیلتر چوله فازی، تعامل انسان ـ روبات، کنتراست جذر میانگین مربعات (RMS)، تفکیک رنگ پوست
رابط انسان ربات سیستم دیداری هوشمند
۱- مقدمه
به هنگامی که روباتها در تعامل با انسانها کار میکنند، لازم خواهد بود تا نسبت به شناسایی مباحث مشارکتی و تبادلی در زمینه تمایلات و نکات مورد علاقه آنها اقدام شود. از آنجاییکه ارتباط بین انسانها و روباتها از طریق ادراکات بصری یا دیداری انجام میشود، رهگیری چشمی و مسیرهای نگاه، بعنوان نکات قابل توجه برای چنین تعاملی به حساب خواهد آمد. بنابراین، توسعه یک سیستم بصری هوشمند بعنوان یک مبحث مهم در تحقیقات روباتیک مطرح میباشد.
این مقاله نسبت به بررسی یک سیستم تشخیص چهره و رهگیری چشم اقدام میکند که در حقیقت در زمینه تشخیص چهرههای انسانی در شرایط نوری مختلف و تعیین موقعیتهای چشمی مدنظر است. تشخیص چهره از طریق یک روش دو مرحلهای اعمال میگردد: (۱) تفکیک رنگ پوست و (۲) عملیات مورفولوژیکی یا ریخت شناسی.
بقیه این مبحث نیز به شرح ذیل سازماندهی شده است. بخش ۲ معرف سیستم بصری روال تعامل انسان و روبات خواهد بود. تشخیص چهره و مورفولوژیهای تعیین موقعیت چشم نیز معرفی میگردند. بخش ۳ معرف نتایج و عملکردهای تجربی خواهد بود. بخش ۴ نتیجهگیری کلی این مقاله را عرضه میدارد.
رابط انسان ربات سیستم دیداری هوشمند
۲- سیستم بصری برای رابط انسان و روبات
سیستم بصری یا دیداری تعامل انسان و روبات شامل الگوریتمی جهت تشخیص چهره انسان و تعیین موقعیت چشم میباشد. این سیستم از دوربین ویدیوئی برای بدست آوردن دادههای مورد نیاز استفاده نموده و بر این اساس عملیات پردازش مقدماتی تصاویر را انجام میدهد. شکل ۱ معرف طراحی معماری سیستم تعامل انسان و روبات میباشد.
الف ـ پردازش مقدماتی تصویر
تصاویر ویدیوئی در ابتدا در معرض عملیات پردازش مقدماتی تصویر قرار میگیرند تا آنکه شرایط نوری و کنتراست مختلف به حساب آورده شود. فاز پردازش مقدماتی تصویر شامل اعمال رویههای توازن نورپردازی، توزان هیستوگرام و فیلترینگ میباشد.
توازن کنتراست و نورپردازی
کنتراست در حقیقت یک برآورد در زمینه حساسیت سیستم بصری انسان میباشد. جهت حاصل آوردن یک شاخص موثر و از نقطهنظر روان شناختی معنادار، و همچنین بوجود آوردن حالت ثبات نوری برحسب محیطهای آفتابی یا ابری، این مضمون در ابتدا از طریق فرآیند توازن یا برابر سازی نوری و کنتراست جذر میانگین مربعات (RMS) ثابت تحت پردازش قرار میگیرد.
برابر سازی هیستوگرام
تصاویر چهره ممکن است بواسطه محدودیتهای شرایط نوری از کنتراست ضعیفی برخوردار باشند. بنابراین توازن یا برابر سازی هیستوگرام جهت جبران این شرایط نوری و ارتقای کنتراست تصویر مورد استفاده قرار میگیرد.
فیلتر چوله فازی
انواع مختلف نویزها ممکن است در تصویر ورودی وجود داشته باشند. جزئیات ظریف تصاویر معرف فرکانسهای بالایی میباشند که با این نویزها ترکیب گردیدهاند. بنابراین فیلترهای پایین گذر جهت حذف برخی از جزئیات تصاویر مورد استفاده قرار میگیرند. این مقاله فیلتر جدیدی را به نام «چوله فازی» معرفی میکند تا آنکه بتوان نویزها را مرتفع ساخت.
رابط انسان ربات سیستم دیداری هوشمند
ب ـ تشخیص چهره
تشخیص چهره از طریق کاربرد تفکیک رنگ پوست حاصل میگردد. فرآیند تفکیک رنگ پوست بر مبنای اطلاعات بصری رنگهای پوست انسان از توالیهای تصویر میباشد. بدین منظور، رنگهای حاکم و رنگهای پوست نسبتا مرتبط از این دامنهها و توالی تصویر استخراج میگردد. بر این مبنا دو روش برای جداسازی تصویر برحسب رنگ پوست وجود دارد:
تبدیل تصویر RGB به فضای YCbCr یا فضای HSV . فضای YCbCr تصویر را به اجزای درخشنده و اجزای رنگی تقسیم میکند، در حالی که فضای HSV تصویر را به سه جزء رنگ، اشباع و ارزش رنگ تقسیم مینماید. مزیت اصلی تبدیل تصویر به حوزه YCbCr آن است که تاثیر درخشندگی را میتوان در طی پردازش تصویر حذف کرد. در محدوده RGB ، هر یک از اجزای تصویر (قرمز، سبز و آبی) دارای درخشندگی مختلفی میباشند.
ج ـ تعیین موقعیت چشم
به هنگامی که موقعیت چهره در یک تصویر شناسایی شد، چشمها در ناحیه مشخص شده داخل چهره مورد جستجو قرار میگیرند. بلوک تصویر چهره پس از آن به ۴ دسته تقسیم شده و چشمهای چپ و راست در بلوکهای فرعی تصویر چهره چپ فوقانی و راست فوقانی بترتیب مورد جستجو قرار میگیرند. با توجه به دید جلویی از چهره، چشمها از ناحیه چهره استخراج شده، و یک برچسب واحد برای هر یک از بلوک کاندید ایزوله از طریق مشخص نمودن برچسب در تصویر در نظر گرفته میشود. این نقاط مشخص شده معرف هر یک از بلوکهای مربوطه میباشند.
د- محاسبه مرکز ثقل چشم
از آنجائیکه تعیین موقعیت دقیق مردمک بسیار پیچیده و بغرنج میباشد، بنابر این بغیر از جستجوی نقطه مردمک، ما نسبت به تعیین موقعیت مرکز ثقل چشمها از بخشهای سیاه عنبیه تصویر تفکیک شده اقدام میکنیم. در صورتی که سطح خاکستری در هر نقطه (y، x) ناحیه مشخص شده E چشم بعنوان منطقه حجمی یا تودهای (y، x) در نظر گرفته شود، ما میتوانیم مرکز ثقل آن جزء و همچنین گشتاور ماند نقاط خاص یا خطوط را مشخص سازیم. pqامین مساحت گشتاور E در حدود مبدا (۰، ۰) بوسیله معادله ذبل مشخص میگردد:
رابط انسان ربات سیستم دیداری هوشمند
۳- نتایج تجربی و عملکرد
تاثیر این دیدگاه با استفاده از تصاویر مختلف با شرایط نورپردازی متفاوت مورد بررسی قرار گرفت. تجارب و آزمایشات مربوطه بوسیله یک کامپیوتر پنتیوم ۴ ۲/۲ مگاهرتز با رم ۲۵۴ مگاوایت و یک دوربین SONY VISCA انجام پذیرفت. الگوریتم مربوطه نیز بوسیله زبان برنامه نویسی ویژوال C++ صورت گرفت. به هنگامی که یک تصویر پیچیده در معرض ورودی قرار میگیرد، نتیجه تشخیص چهره باعث روشن شدن یا تمایز بخشهای چهره در تصویر، همانند شکل ۵ ، میگردد. اغلب تصاویر با استفاده از دوربین دیجیتال گرفته شد، اما برخی از آنها نیز توسط اسکنر و گروه دیگر بوسیله نوار ویدیویی از کانالهای تلویزیونی مختلف ضبط و ذخیره شدند.
رابط انسان ربات سیستم دیداری هوشمند
۴- نتیجهگیری
این مقاله یک سیستم بصری هوشمند جهت کنترل روبات بر مبنای حرکت چشم را عرضه مینماید. روش تشخیص سریع چهره همراه با تعیین موقعیت چشم بر اساس تفکیک رنگ و آنالیز مورفولوژیکی انجام میپذیرد.
تشخیص صورت و خصیصههای چهره با استفاده از تکنیکهای دیداری ماشینی از کاربردهای مفید زیادی برخوردار خواهد بود. البته با توجه به اعمال چنین وظایفی، آن هم به تعداد دفعات متوالی و بدون شمارش در هر روز از سوی انسان، میتوان به چالشهای پیش روی در این زمینه پی برد. در این مقاله، تشخیص چهره از طریق تفکیک رنگ پوست و عملیات مورفولوژیکی حاصل میگردد. در اینجا، موقعیت یابی چشم از طریق محاسبه بزرگترین ناحیه اتصال یافته از تصویر تفکیک شده رنگ پوست حاصل آمده و سپس موقعیتهای برچسب هر دو چشم مورد جستجو قرار میگیرند. در نهایت، مراکز ثقل چشمها محاسبه شده و روبات بر حسب حرکت چشم هدایت میشود. دیدگاه بعدی ما تعمیم یا گسترش این الگوریتم بسمت یک حالت تشخیصی چند چهرهای و صورتهای همپوشانی شده در تصاویر میباشد و همچنین کار بر روی آن دسته از تصاویری که موانعی در برابر چشم (نظیر عینک) برای آنها وجود دارند نیز مد نظر قرار داشته و در عین حال، جهت گیریهای مختلف نیز لحاظ شده و تصاویری که دارای زمینه پیچیدهتری نیز هستند مورد بررسی قرار خواهند گرفت.