فایل دانشگاهی – کشف مدیریت سود با استفاده از شبکه عصبی مصنوعی- قسمت ۱۱

۳-۶ . فرآیند داده کاوی مطابق با استاندارد CRISP – DM

فرآیند CRISP–DM یک متدولوژی استاندارد داده کاوی می باشد که در اواخر سال ۱۹۹۶ توسط سه شرکت بزرگ دایملر کرایسلر (بنز)، SPSS و NCR ایجاد گردید. این متدولوژی یک مدل فرآیندی برای داده کاوی ارائه می دهد که مروری بر چرخه عمر هر پروژه داده کاوی بوده و شامل مراحل متناظر با پروژه، وظایف مربوطه و ارتباط بین این وظایف می باشد[۷۹]. چرخه عمر یک پروژه داده کاوی، شامل ۶ مرحله شناخت کسب و کار، شناخت داده ها، آماده سازی داده ها، مدل سازی، ارزیابی مدل و توسعه مدل بوده که در نمایه شماره ی ۳-۲ ارائه شده است. توالی این مراحل انعطاف پذیر می باشد و برگشت به مراحل قبلی و مسیر های آزاد بین مراحل گاهی مورد نیاز است. جهت پیکان هایی که در نمایه زیر مشاهده می گردد، بیان کننده مهمترین و تکراری ترین رابطه بین مراحل می باشد :
نمایه ی شماره ۳-۲: متدلوژی استاندارد CRISP-DM
داده ها
شناخت کسب و کار
شناخت داده ها
آماده سازی داده ها
مدل سازی
ارزیابی مدل
توسعه مدل
۳-۶-۱ . شناخت کسب و کار [۸۰]
شناخت کسب و کار (سیستم) به جهت مشخص شدن اهداف مسئله از اهمیت بسزایی برخوردار است. در این مرحله لازم است که اهداف تحقیق و نیازها از دیدگاه کسب و کار به طور مشخص تبیین شوند. توجه به این مرحله بسیار ضروری است و با شناخت کامل از اهداف می توان از قابلیت های داده کاوی بهترین استفاده را کرد و الگوریتم مناسب را انتخاب نمود. بنابراین، با توجه به اطلاعات تاریخی موجود از شرکت های بورسی، در این تحقیق سعی شده تا با استفاده از داده کاوی مدلی جهت پیش بینی مدیریت سود در شرکت های نمونه آماری تحقیق ارائه گردد. در این مرحله گام های زیر دنبال شده است(هان و کمبر، ۲۰۰۶) :
الف) تعیین اهداف کسب و کار(مفاهیم اولیه، اهداف و معیارهای موفقیت)
اصلی ترین هدف کسب و کار در این تحقیق، پیش بینی نوع مدیریت سود و تعیین متغیرهای تاثیرگذار بر آن با استفاده از اطلاعات مالی و غیر مالی سال های قبل است. تعیین مدیریت سود با استفاده از مدل جونز عملکری تعیین و به عنوان متغیر وابسته پژوهش حاضر انتخاب و به منظور آموزش و آزمون مدل طبقه بندی گردید.
ب) تعیین اهداف داده کاوی(اهداف داده کاوی و معیار موفقیت)
با توجه به طبقه بندی صورت گرفته برای متغیر هدف (مدیریت سود) می توان گفت که هدف داده کاوی این تحقیق، طبقه بندی از نوع یادگیری نظارت شده[۸۱] می باشد.
۳-۶-۲ . شناخت داده ها [۸۲]
در این مرحله مواردی از قبیل داده های مورد نیاز، موجود بودن، محرمانه بودن، چگونگی دسترسی و میزان سیستمی بودن داده ها بررسی می شود. تحلیل صحیح در این مرحله ممکن است به تجدید نظر در مرحله قبل(شناخت کسب و کار) بیانجامد. جمع آوری و آشنایی با داده ها، شناخت مسائل مربوط به کیفیت داده ها و مشاهده اطلاعات اولیه یا زیر مجموعه های داده ها که ممکن است برای آنالیز جالب باشند(با توجه به اهداف کسب و کار که در مرحله قبل مشخص شده است) از وظایف این مرحله است. در این مرحله گام های زیر دنبال شده است(هان و کمبر، ۲۰۰۶) :

حتما بخوانید :
دسترسی متن کامل - رابطه بین سبک های مقابله با استرس و خودکارآمدی عمومی با رضایت شغلی ...

الف) شناسایی و جمع آوری داده ها

در این مرحله ابتدا داده های مورد نیاز جهت محاسبه متغیرهای نهایی تحقیق شناسایی شده است. نهایتاً ۱۴ داده اولیه جهت محاسبه ۱۴ متغیر نهایی تحقیق شناسایی شد(نمایه ۳-۳). سپس با رجوع به منابع اطلاعاتی موجود مثل، نرم افزارهای ره آورد نوین و تدبیر پرداز و صورت های مالی حسابرسی شده شرکت های بورسی(منتشر شده توسط بورس)، ۱۴ داده شناسایی شده را برای شرکت های پذیرفته شده در بورس اوراق بهادار تهران(شامل ۱۷۹۳ شرکت – سال)، طی سال های ۱۳۸۴ الی ۱۳۹۱ جمع آوری و در فایل هایی با فرمت اکسل ذخیره نمودیم. جزئیات ۱۴ داده های اولیه جمع آوری شده در جدول زیر تشریح شده است:

نمایه ی شماره ۳-۳: داده های اولیه برای محاسبه متغیرها

 

ردیف نام داده ردیف نام داده
۱
دانلود کامل پایان نامه در سایت pifo.ir موجود است.