ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه حسابداری
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات
قیمت
قیمت این مقاله: 58000 تومان (ایران ترجمه - Irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره | ۷۸ |
کد مقاله | ACC78 |
مترجم | گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی | ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی |
نام انگلیسی | Bayesian Multiple Change-Point Estimation andSegmentation |
تعداد صفحه به فارسی | ۴۱ |
تعداد صفحه به انگلیسی | ۱۶ |
کلمات کلیدی به فارسی | نقاط – تغییر چندگانه, قطعه بندی, تقریب تصادفی مونت کارلو |
کلمات کلیدی به انگلیسی | BIC, multiple change-points, segmentation, stochastic approximation Monte Carlo |
مرجع به فارسی | سیستم های کاربردی و روش های ارتباطاتی و آماریدپارتمان آمار، دانشگاه داک سانگ وومن، دپارتمان آمار اطلاعات، دانشگاه کره، کره جنوبی |
مرجع به انگلیسی | Communications for Statistical Applications and MethodsDepartment of Statistics, Duksung Women’s University; Department of Informational Statistics, Korea University |
کشور | کره جنوبی |
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی
چکیده
این مقاله نسبت به ارائه یک رویکرد تشخیص نقطه تغییر چندگانه بیزی اقدام می نماید که در آن قابلیت قطعه بندی و رده بندی آن دسته از مشاهداتی بوجود می آید که پس از گذشت یک مقطع زمانی خاص دیگر استطاعت پدیدار شدگی یا حاصل آمدن از یک جمعیت اولیه را نخواهند داشت. استنباط های حاصله بر مبنای نقاط تغییر چندگانه و با توجه به توالی متغیرهای تصادفی مدنظر می باشد که در آن توزیع احتمال تغییر می یابد. برآورد نقطه تغییر چندگانه بیزی از قابلیت دسته بندی هر مورد مشاهداتی در یک قطعه مشخص شده برخوردار می باشد. ما از یک توزیع ناقص پوآسون برای تعداد نقاط تغییر استفاده نموده و مشخصه های پیشین را در ارتباط با توزیع های خانواده به صورت نمایی را در نظر می گیریم. روش بیزی قابلیت ارائه دسته بندی غیرنظارتی متغیرها به صورت گسسته و پیوسته و همچنین بردارهای چند متغیره بر مبنای مدل های کلاس نهفته را دارد. بنابراین، راه حل نقاط ـ تغییر مترادف با بخش های تصادفی داده های مشاهده شده می باشد. ما رویه قطعه بندی را با داده های حقیقی مورد بررسی قرار می دهیم.
کلمات کلیدی: BIC، نقاط ـ تغییر چندگانه، قطعه بندی، تقریب تصادفی مونت کارلو
۱- مقدمه
در این مقاله توجه جدی جلب مدل های تصادفی در ارتباط با سیستم هایی شده است که در آن نیروهای خارجی سبب بروز یک تغییر فوری در خواص یا ویژگی های تصادفی در یک برهه از زمان در تاریخچه یک سیستم می شوند. چنین مدل هایی به نظر خود حاصل آمده از موقعیت های کنترل کیفیت می باشند که در آن فرآیند تشخیص و تغییر کیفیت قابل سنجش می باشد. دسته بندی غیرنظارتی داده های مشاهده شده را می توان به عنوان یک فرآیند یادگیری علمی در نظر گرفت که در آن یک ساختار مخفی مرتبط با مشاهدات را می بایست کشف نمود. روش های عددی ابتکاری برای دسته بندی به طور گسترده ای مورد بررسی قرار گرفته اند. با این وجود، علاقه فزاینده ای در ارتباط با رویکردهای مدل مبنا ایجاد شده است، چرا که محدودیت های محاسباتی دیگر به عنوان یک مسئله مهم بشمار نمی آیند. Corander و همکاران، (۲۰۰۹) یک روش مدل مبنای بیزی را برای دسته بندی غیرنظارتی بردارهای گسسته مقدار ارائه نمودند.
فرآیند تشخیص نقاط تغییر و قطعه بندی مشاهدات در محدوده گسترده ای از برنامه های کاربردی بکار گرفته می شود. بنابراین ویژگی مورد نظر ما در این مبحث دسته بندی رویدادها بر حسب توزیع می باشد. پس از تشخیص نقطه تغییر چندگانه بیزی، یک رویه دسته بندی را می توان با توجه به نقاط تغییر ارزیابی شده بکار گرفت. بر این مبنا، قطعه بندی را می توان از طریق تشخیص همزمان نقاط تغییر با ارزیابی نقطه تغییر حاصل آورد. در نتیجه، پارامترهای متناظر با این قطعه جدید را می توان به هنگامی ارزیابی نمود که یک تغییر جدید مورد شناسایی قرار گرفته باشد. یافتن تعداد قطعات با استفاده از این نقاط تغییر به عنوان یک مسئله چالش برانگیز آماری به شمار می آید چرا که بُعد آبجکت مورد نظر ثابت نمی باشد. قطعه بندی یا دسته بندی را می توان به مجموعه بزرگتری از داده ها نیز تعمیم داد. Wehrens و همکاران (۲۰۰۴) خوشه بندی سریع را برای مجموعه داده های بزرگ نظیر داده های تصویربرداری MRI پیشنهاد نموده اند. راهکارهای قطعه بندی هم اکنون در رشته های متعدد زیادی به طور فزاینده مورد استفاده قرار می گیرند و بر این مبنا لازم است تا قابلیت کاربرد ویژگی های ناهمگن در تحلیل داده ها را داشته باشیم.
در این مقاله، ما نسبت به اعمال آنالیز نقطه تغییر چندگانه بیزی جهت قطعه بندی اقدام می نماییم. این فرآیند با شناسایی مشاهدات پارتیشن های نقاط تغییر در قطعات مشخص و با توجه به پارامترهای توزیعی مختلف امکان پذیر می گردد. در بخش ۲، یک مدل نقطه تغییر چندگانه کلی تعریف می گردد و استنباط حاصله بیزی در این زمینه با توجه به برخی از توزیع های خانواده نمایی ارائه می شود. بخش ۳ به طور مختصر تشریح کننده الگوریتم SAMC بکار گرفته شده برای مسئله نقطه تغییر چندگانه می باشد. بخش ۴ ارائه دهنده برخی از نتایج عددی با داده های حقیقی برای ارزیابی و قطعه بندی نقطه تغییر چندگانه می باشد. در نهایت، بخش ۵ به نتیجه گیری این مقاله می پردازد.
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی
۲- مدل نقطه ـ تغییر چندگانه بیزی
شناسایی نقطه تغییر در تحلیل داده ها مهم تلقی می شود چرا که چنین موردی سبب تفکیک مشاهدات به قطعات مشخص شده می گردد. جهت حاصل آوردن ناهمگنی در داده ها، منطقی می باشد که در نظر بگیریم که کلاس های نهفته به گونه ای وجود دارند که هر کدام را می توان بر حسب مکانیزم تولید داده های مختلف توصیف نمود. این داده ها بر حسب پارامترهای توزیعی یکسانی در محدوده کلاس مشابه تشریح می گردند. بر این مبنا ویژگی خاص در خصوص استنباط زمانی یا موقعیتی در توالی مشخص شده را می بایست در نظر گرفت که در آن پروسه تغییر و ایجاد قطعه جدید رخ می دهد. این مشکل را می توان به طور کلی در ارتباط با ایده های تغییرات چندگانه در سیستم تعمیم داد. چنین مسایلی به هنگامی بروز می نمایند که توالی های مختلف سری های داده هایی که دارای پارامترهای مختلفی هستند توزیع های آماری مختلف با فرم کاربردی یکسانی را دنبال نمایند.
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی
۳- ارزیابی و دسته بندی نقطه تغییر چندگانه
۳ـ۱٫ بررسی الگوریتم SAMC
مسئله نقطه تغییر چندگانه به طور طبیعی در بردارنده پیچیدگی های محاسباتی در ارتباط با دسته بندی و تفکیک چند روشه داده ها می باشد. از آنجایی که تعداد نقاط تغییر شکل دهنده یک فضای پارامتر متغیر می باشند، در این مبحث از یک الگوریتم پیشرفته مونت کارلو استفاده می شود، SAMC (Liang و همکاران، ۲۰۰۷). ایده اصلی SAMC به شرح ذیل به صورت مختصر تشریح می شود.
۳ـ۲٫ کاربرد SAMC در تشخیص نقطه تغییر بیزی
الگوریتم SAMC برای مدل نقطه تغییر چندگانه بیزی به منظور حل مسئله انتخاب مدل بیزی بکار گرفته شد. برای تشخیص نقطه تغییر، حداکثر احتمال (MAP) و برآورد مرتبط x(k) به عنوان یک راه حل منطقی در نظر گرفته می شود. روش نمونه برداری SAMC نیز در این رابطه مشخص شده است. در ابتدا، تعداد نقاط تغییر بر مبنای این پیشنهاد ایجاد می شوند و متعاقباً موقعیت های نقاط تغییر انتخابی به صورت تصادفی بر حسب داده های Z حاصل می آیند. مرحله نمونه برداری SAMC برای ارزیابی MAP به شرح ذیل می باشد.
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی
۴- کاربردهای داده های حقیقی
ما نسبت به ارائه یک سری از برنامه های کاربردی روش خود برای مشکلات نقطه تغییر چندگانه و دسته بندی اتوماتیک اقدام می نماییم. هر بخش به صورت همگن در پارامترهای توزیعی پس از تشخیص نقطه تغییر باقی می ماند. ما یک آزمون مستقل مشاهداتی را در هر بخش با استفاده از آزمون Bartels (Bartels، ۱۹۸۲) برای داده های یک متغیره در نظر گرفته و به علاوه یک آزمون ارائه شده به وسیله Kojadinovic و Holmes (2009) برای داده های چند متغیره را نیز حاصل می آوریم. این روش ها در پاکت R مرتبط با lawstat و copula به ترتیب ارائه می شوند.
۴ـ۱٫ داده های نگار ـ چاه برای مدل نقطه تغییر نرمال
ما مسئله مرتبط جهت تشخیص نقاط تغییر را با توجه به اطلاعات نگار چاه در مبحث ORuanaidh و Fitzgerald (1996) ارائه می نماییم. این داده ها در حقیقت به عنوان برآوردهای سنجشی چهل پنجاه مورد حفر چاه از پاسخ های هسته ای ـ مغناطیسی سنگ های زیرزمینی به دست آمده اند. این داده ها جهت تفسیر ساختارهای ژئوفیزیکی سنگ های مجاور چاه بکار گرفته شده است، چرا که گوناگونی ها در میانگین بازتاب دهنده ویژگی های مرتبط با طبقه بندی پوسته یا قشر زمین می باشند. سیگنال اصلی تقریباً به صورت یک ثابت تکه ای در نظر گرفته شده است و هر بخش این ثابت متکی به یک نوع سنگ واحد می باشد که دارای خواص فیزیکی ثابتی است. نقاط تغییر در این سیگنال به هنگامی رخ می دهند که یک نوع سنگ جدید مشخص شده باشد.
۴ـ۲٫ بازه های زمانی برحسب روز بین بلایای متوالی معدن کاوی و داده های آن برای مدل نقطه تغییر نمایی
بازه های زمانی بر حسب روز بین بلایای معدن کاوی متوالی از سال ۱۸۷۵ الی ۱۹۵۱ مشخص کننده ۱۰۹ انفجار است که سبب مرگ و میر حداقل ۱۰ نفر از کارگران شده است. داده های حاصله از Maguire و همکاران (۱۹۵۲) به وسیله Cox و Lewis (1966) مورد آنالیز قرار گرفت. ذکر این نکته قابل توجه است که برخی از نقاط مربوط به الگوی این بلایا به وجود آمده ممکن است تغییر یابند. ما از مدل نقطه تغییر نمایی استفاده نمودیم چرا که زمان بین حوادث را می توان با توجه به یک توزیع نمایی مدل سازی نمود.
۴ـ۳٫ داده های نسبی قیمت ـ لگاریتمی هفتگی برای مدل نقطه تغییر دو جمله ای
داده های حاصله از مطالعه Hsu (1979) به صورت هفتگی در بردارنده ۱۶۱ مورد قیمت نسبی لگاریتمی (LPR) شرکت صنایع Dow Jones Industrial Average برای یک دوره مشخص شده از اول جولای ۱۹۷۱ الی دوم آگوست ۱۹۷۴ می باشد. بر این مبنا اجازه دهید تا Yi به عنوان LPR در هفته i در نظر گرفته شود و متعاقب آن یک توزیع را در نظر گیرید. مقدار µ می بایست از نقطه نظر عملی تحت معتدل ترین فرضیه های “بازاری کارآمد” صفر تلقی شود.
۴ـ۴٫ داده های حادثه معدن زغال سنگ بریتانیا برای مدل نقطه تغییر پوآسون
ما روش خود را بر مبنای داده های حادثه معدن زغال سنگ بریتانیا بر مبنای مباحث Maguire و همکاران (۱۹۵۲) ارائه می نماییم. Jarrett (1979) این آنالیز را با مجموعه های مشخص شده پیشین در مبحث Carlin و همکاران (۱۹۹۲) ارائه داده است. داده ها شامل ۱۱۲ مورد سالیانه از ۱۸۵۱ الی ۱۹۶۲ می باشند. Raftery و Akman (1986) نسبت به بررسی مجموعه های زمانی بین رخدادها به عنوان یک فرآیند پیوسته اقدام نموده و Carlin و همکاران (۱۹۹۲) ویژگی های مربوط به رخداد و داده های حاصله را نیز بررسی نمودند. ما در این مطالعه مدل نقطه تغییر پوآسون را برای این داده ها در نظر می گیریم.
۴ـ۵٫ داده های نیروگاه اروپا برای مدل نقطه تغییر نرمال دو متغیره
داده ها شامل ۵۶ مشاهده دو متغیره واحد از نیروگاه اروپایی می باشد که در آن اقدام به تولید شن یا ماسه با توجه به درصد یا ذرات آن (بر مبنای وزن) می گردد که به عنوان ذرات در سطح بزرگ و متوسط به شمار می آیند. Holmes و Mer gen (1993) اقدام به بررسی توزیع اندازه ذره این داده ها نمود. Sullivan و Woodall (2000) از یک نمودار کنترل اولیه جهت شناسایی تغییر در بردار اصلی ماتریس کوواریانس (یا در هر دو مورد) استفاده نمود. شکل ۵ نشان دهنده نقاط طراحی ترتیبی می باشد که بر مبنای ویژگی های خاص و بر حسب اندازه سورت یا دسته بندی شده اند. ذکر این نکته ضروری است که با تغییر مشاهده چند متغیره قابلیت تمایز اندازه های ذرات به وجود می آید. ما از مدل نقطه تغییر چندگانه برای توزیع نرمال چند متغیره استفاده می نماییم. بر این مبنا ما از مجموعه های یکسانی همانند مثال پیشین به استثنای ویژگی مشخص شده پیشین استفاده خواهیم نمود:
ارزیابی و قطعه بندی نقطه تغییر چندگانه بیزی