استنباط آماري مدل رگرسيوني با خطاهاي خودبازگشتي به روش لاسو- قسمت 9

اعتبار

آموزشی

آموزشی

برای امین قسمت (مثلاٌ سومین قسمت در شکل بالا)، مدل را به (برای ،
) قسمت دیگر از دادهها برازش میدهیم و خطای پیشبین از مدل برازش شده را وقتی امین قسمت از دادهها را پیشبینی میکنیم، محاسبه میکنیم. برای این عمل را انجام داده و برآورد از خطای پیشبین را بدست میآوریم. سپس برآورد CV از میانگین وزنی خطای پیشبین حاصل میشود.
بصورت دقیقتر فرض کنید :𝜅 که 𝜅 نشان میدهد که مشاهدهیiام بصورت تصادفی در کدام افراز قرار گرفته است. تابع برازش داده شدهای است که با حذف امین قسمت از مجموعهی دادهها محاسبه شده است. پس برآورد CVاز خطای پیشبین بصورت میانگین وزنی لایه است. اگر باشد، آنگاه CV، از حذف تکی مشاهدات حاصل میشود. در این مورد ، برای برازش مشاهدهی iام همهی دادهها به جز خود دادهی iام بکار میرود.
معمولاً را برابر با 5 یا 10 میگیریم.
در مجموعهای از مدلهای که بوسیلهی یک پارامتر تنظیم کنندهی 𝛼 اندیسگذاری شدهاند، از برازش مدل𝛼ام با حذف امین قسمت از مجموعهی دادهها محاسبه میشود. پس برای مجموعهای از این مدلها
=
تعریف میکنیم. 𝛼ای که را مینیمم کند، (پارامتر تنظیم کنندهی بهینه)
مینامیم. مدل نهایی است که به همهی دادهها برازش میشود.
 (هستی و همکاران[25](2008)- تیب شیرانی(1996)- افرون و تیب شیرانی[26](1993))
محاسبهی CVبسیار وقتگیر است به همین دلیل کراون و واهبا در سال 1979 از GCVبه عنوان جایگزینی برای CV استفاده کردند که به صورت زیر تعریف میشود:
که در آن ماتریس تصویر[27] از رابطهی بدست میآید . یکی از مزایای این معیار وابسته نبودن آن به پارامتر است.
فصل دوم
برآوردگرهای لاسو برای پارامترهای مدل رگرسیون خطی با خطاهای خودبازگشتی
مقدمه :
همان طور که می دانیم مدل رگرسیون خطی یک ابزار مهم آماري براي تجزیه و تحلیل ارتباط بین متغیرهاي پاسخ و رگرسیونی می باشد . یکی از فرضیات استاندارد موجود در این زمینه، استقلال بین مشاهدات مختلف است. اگرچه در زمان جمع آوري داده ها ممکن است همبستگی سریال مانند معنی داري، بین داده ها وجود داشته باشد. در اینگونه موارد اغلب مدل رگرسیونی با خطاهای سری زمانی در نظر گرفته می شود. در این فصل ابتدا به معرفی این گونه مدلها پرداخته و سپس به برآورد کمترین مربعات پارامترهای آن پرداخته و خواص مجانبی آنها را بیان میکنیم. سپس برآوردگرهای لاسو و لاسو اصلاح یافته این مدلها معرفی کرده و در پایان خواص مجانبی آنها را ارائه و اثبات میکنیم.
2-1-مدل رگرسیون خطی با خطای سری زمانی
یک کلاس مفید و بزرگ از مدلها برای توصیف داده های مربوط به فعالیت های اقتصادی، تجاری، محیطی و . . . ، مدلهای رگرسیونی با خطای سری زمانی میباشد. فرم کلی این مدلها به صورت زیر بیان میشود :

حتما بخوانید :
بررسي رابطه سرمایه اجتماعی با شهروندی دموکراتیک- قسمت 16

(2-1)

که در آن سری مورد علاقه ، یک سری زمانی غیر قابل مشاهده ، نشاندهنده یک بردار از متغیرهای ورودی ، برداری از پارامترها و نشاندهنده نوع تاثیر روی میباشدواضح است که مدلهای رگرسیون کلاسیک (خطی و غیر خطی) و سریهای زمانی، حالتهای خاصی از (2-1) میباشند.
اگر در مدل (2-1) قرار دهیم، در اینصورت این مدل را یک مدل خطی گوییم که در این پایاننامه چنین مدلی در نظر گرفته و مورد بررسی قرار میدهیم.
تاکنون مطالعات فراوانی روی مدل (2-1) انجام شده است، به ویژه برآوردیابی پارامترهای این مدل تحت فرض ایستایی میباشد. ازجمله دوربین[28] در سال 1960 یک روش دو مرحلهای را جهت یافتن برآوردهای مجانبا کارا در مدلهای خطی ارائه داد. هنان[29](1971)، خواص سازگاری برآوردهای کمترین مربعات وزنی پارامتر وقتیکه , غیرخطی باشد را ثابت کرد . پیرس[30] برآوردیابی از طریق روش کمترین مربعات وقتیکه مدل خطی بوده و از مدل خودبازگشتی میانگین متحرک پیروی کند را مورد بررسی قرار داد. فولر[31] در سال1976بعضی از خواص مدل (2-1) را مورد بررسی قرار داد.
در ادامه قصد داریم با استفاده از پیرس ، به بررسی برآوردهای کمترین مربعات مدلهای رگرسیون خطی با خطاهای خودبازگشتی–میانگین متحرک را مورد مطالعه قرار دهیم.
2-2-برآوردکمترین مربعات درمدل رگرسیونی باخطاهای خودبازگشتی میانگین متحرک
پیرس در سال مدل زیر را در نظر گرفت :

(2-2)