استنباط آماري مدل رگرسيوني با خطاهاي خودبازگشتي به روش لاسو- قسمت 18

براساس قضیه (2-1)، برآوردگری با نرخ سازگاری برای می‌باشد. از اینرو برای هر و داریم:

و

در نتیجه هم و هم در شرط ، جاییکه در بخش 2-6-2 از فصل دوم تعریف شده است، صدق می کند. در مقابل برای هر و ، قضیه (2-1) نتیجه می دهد که : و . بنابراین :

و

وقتیکه ، مخرج معادله‌های بالا میباشد و صورت آنها، به سمت بی‌نهایت میل میکنند. به عنوان یک نتیجه، و ، که نتیجه می‌دهد هر دو عبارت در شرط صدق میکنند ( در بخش 2-6-2 معرفی شد ). در مجموع پارامترهای تنظیم کننده معرفی شده و ، میتواند برآوردگر لاسو اصلاح شده را تولید ‌کنند که به طور مجانبی همانند برآوردگر پیشگو کارا می‌باشد.
در ادامه در فصل چهارم، با استفاده از الگوریتم ارائه شده در این فصل، برآوردگرهای لاسو سنتی و لاسو اصلاح شده را در دو مثال بدست آورده و عملکرد ایندو برآوردگر را مقایسه میکنیم.
فصل چهارم
مثالهای کاربردی و شبیهسازی
مقدمه:
در این فصل به مقایسه برآوردهای لاسو بدست آمده در فصل دوم پرداختهایم. ابتدا یک مثال شبیه سازی و سپس یک مثال واقعی ارائه میدهیم .
4-1-مثال شبیه سازی
در این بخش شبیه سازی مونت کارلو را برای ارزیابی عملکرد دو برآوردگر لاسو معرفی شده در فصل دوم برای مدلهای رگرسیونی با خطای به کار برده ایم. ملاک برتر بودن در این شبیه سازی معیارهای و می باشد. برای لاسو سنتی با استفاده از دیدگاه زو و هستی[54] (2005)، پارامترهای تنظیم کننده بهینه و را از شش نقطه انتخاب میکنیم و همچنین برای برآوردگر لاسو اصلاح شده، پارامتر تنظیم کننده بهینه را از شش نقطه انتخاب کردهایم. بعلاوه این الگوریتم برآوردیابی زمانی متوقف میشود که باشد که برآوردگر در -امین تکرار الگوریتم میباشد. زمانی که همگرایی انجام شد، هر برآورد پارامتری که قدرمطلق آن کمتر از باشد، به صفر انقباض داده میشود. مطالعات شبیه سازی در این زمینه نشان میدهد که این الگوریتم از سرعت همگرایی منطقی برخوردار می باشد.
دادهها را از مدل رگرسیونی با خطای زیر تولید کردهایم :
که در آن
متغیرهای تصادفی مستقل و هم توزیع نرمال استاندارد میباشند که . ضرایب رگرسیونی و خودبازگشتی و میباشند.
متغیرهای رگرسیونی مستقل با توزیع نرمال چندمتغیره و بردار میانگین میباشند، همچنین همبستگی بین و ، میباشد.
در این شبیه سازی سه اندازه نمونه و دو انحراف استاندارد و همچنین ضرایب همبستگی که به ترتیب نشان دهنده ضریب همبستگی قوی، متوسط و ضعیف بین متغیرهای رگرسیونی و تعداد تکرار 1000 را در نظر گرفتهایم. در این شبیه سازی برای هر 1000 بار تکرار، درصد متغیرهای رگرسیونی درست برآورد شده، بیش برآورد شده و کم برآورد شده و همچنین درصد مرتبههای خودبازگشتی درست برآورد شده، بیش برآورد شده و کم برآورد شده و درصد مدل صحیح شناسایی شده توسط برآوردگرهای لاسو محاسبه شده است.
درحالتیکه، جدول 4-1 نشان میدهد که لاسو سنتی عملکرد ضعیفی را برای اندازه نمونه و انحراف استانداردهای مختلف دارا میباشد. این بهدلیل وجود یک پارامتر تنظیم کننده ثابت برای تمامی ضرایب است. در نتیجه دارای بیش برازشی در هم انتخاب متغیر رگرسیونی و هم خودبازگشتی است. در حالیکه لاسو اصلاح شده با معیار(لاسو*-) عملکرد به مراتب بهتری نسبت به لاسو سنتی دارا میباشد. به علاوه لاسو اصلاح شده با معیار (لاسو*-) بهترین عملکرد را در شناسایی مدل صحیح با اندازه نمونه و انحراف استانداردهای مختلف دارا میباشد و با افزایش حجم نمونه، درصد مدل صحیح به %100 افزایش مییابد. در مجموع این شبیهسازی نشان میدهد که لاسو*-همزمان در انتخاب متغیر و برآورد ضرایب بهتر عمل میکند.
همچنین برای شناسایی مدل صحیح، دقت پیشبینی 4 نوع برآورد را با میانه میانگین مجذور خطا مقایسه کردیم. 10000 نمونه مستقل دیگر تولید کردهایم. جدول 1-4 نشان میدهد که لاسو- بدترین عملکرد و لاسو*– بهترین عملکرد را دارا میباشد.در شبیهسازی با و نتایجی شبیه به بدست میآید.

حتما بخوانید :   بررسي رابطه سرمایه اجتماعی با شهروندی دموکراتیک- قسمت 27

میانه میانگین مجذور خطا درست برازش شده مرتبه خود بازگشتی متغیر رگرسیونی