پایان نامه ها

پایان نامه ارشد رایگان درمورد بازیابی اطلاعات، جمع آوری اطلاعات، درون داده

دانلود پایان نامه

نیست لذا روش پالایش گروهی مبتنی بر آیتم مطرح گردید که در این روش علاوه بر تشابه میان کاربران، تشابه میان آیتم هایی که توسط کاربر مقصد امتیاز داده شدهاند با آیتمهای مشابه نیز، در نظر گرفته میشود. در عمل و تحقیقات انجام شده، ثابت شده است که این روش در سیستمهای توصیهگر برخط از سرعت بالاتری برخوردار است و در اکثر مواقع جواب بهینهتر و با خطای کمتری تولید میکند[29][22].
در این روش تشابه میان دو آیتم i و j در پس زمینه و از طریق فرمول پیرسون، مطابق فرمول شماره 4 محاسبه میگردد.
(4)

در این فرمول U مجموعه تمام کاربرانی می باشد که به هر دو آیتم i و j امتیاز دادهاند و ru,i بیانگر امتیاز کاربر u به آیتم i میباشد و r ̅_i بیانگر میانگین امتیازاتی است که توسط کاربران مجموعه U به آیتم i داده شده است. با توجه به تعاریف و مطالب فوق پیشبینی امتیاز کاربر a به آیتم i از طریق محاسبه میانگین وزنی و مطابق فرمول شماره 5 محاسبه میگردد.
(5)

در این فرمول K مجموعه آیتمهایی می باشد که بیشترین تشابه با آیتم i را دارند و توسط کاربر a به آنها امتیازی تعلق گرفته است. برای روش مبتنی بر آیتم نیز میتوان از روش کسینوسی مانند adjusted cosine similarity استفاده نمود که مقایسه دقیق و عملی میان انواع متدهای موجود در این زمینه، توسط برخی از محققان انجام و منتشر گردیده است[22].

2-2-1-2- امتیازدهی به صورت پیش فرض

یکی از روشهای حل مشکل محاسبه تشابه میان دو کاربر که دارای آیتمهای مشترک اندکی هستند، استفاده از یک مقدار امتیاز پیش فرض برای آیتمهایی می باشد که صراحتا توسط کاربران امتیازی به آنها داده نشده است، در این حالت از فرمول شماره 1 می توان جهت محاسبه میزان تشابه دو کاربر استفاده نمود. تحقیقات نشان داده است که در نظر گرفتن مقدار پیش فرض می تواند باعث بهبود نتایج گردد[21].

2-2-1-3- تشدید حالت(Case Amplification)

جهت اهمیت دادن به نظرات کاربرانی که دارای تشابه بیشتری با کاربر مقصد میباشند محققان ضریبی را تحت نام “تشدید حالت” تعریف نمودهاند که مقدار تشابه محاسبه شده از طریق فرمول شماره 2 را تغییر میدهد. در فرمول شماره 6 ، p فاکتور تشدید می باشد و مقدار آن بزرگتر مساوی 1 است.
(6)

روشها و متدهای بسیار زیاد دیگری نیز در زمینه بهبود روش کلی پالایش گروهی مطرح میباشد که در ذیل به صورت فهرست وار اسامی این روشها بیان میگردد و به دلیل خروج از محدوده تحقیق، جزئیات آنها بیان نمیگردد:
Significance Weighting[27]
Inverse User Frequency[21]
weighted majority prediction[30]
imputation-boosted CF[31]

2-2-2- پالایش گروهی مبتنی بر مدل(Model Based)

در این تکنیک به کمک تخمین پارامترهای مدل آماری که بر اساس نظرات کاربران ایجاد گردیده است، ارائه پیشنهاد به کاربران یا پیشبینی امتیازدهی کاربر مقصد به یک آیتم خاص صورت می پذیرد به عنوان مثال یکی از ابتداییترین روشها، روش تبدیل پالایش گروهی به یک مسئله “طبقهبندی44” میباشد. در این حالت یک “تمایز دهنده45” برای کاربر مقصد به صورتی ایجاد میگردد که در آن آیتمها به عنوان بردار معیارها روی کاربران تعریف و امتیازهای موجود به صورت برچسب کلاس در نظر گرفته میشود و به کمک تکنیکهای “کاهش بعد46” مشکل کمبود اطلاعات47 نیز برطرف میگردد. در سالهای اخیر تکنیکهای “فاکتور نهان48” و “مدل فاکتورگیری ماتریسی49 “به عنوان بهترین روشهای موجود در این زمینه شناخته و عرضه شدهاند[32].
بر خلاف مدلهای مبتنی بر حافظه که بر اساس تشابه میان کاربران یا آیتمها و اطلاعات آماری موجود، نسبت به تولید پیشنهاد، اقدام مینمایند تکنیکهای مبتنی بر مدل تشابه میان کاربران یا آیتمها را، نتیجه وجود یک ساختار سطح پایین نهفته درون دادهها میدانند. در این تحقیق سعی در استفاده از تکنیکهای مبتنی بر حافظه می باشد لذا از ارائه توضیحات بیشتر در این خصوص پرهیز شده است.

2-3- پالایش محتوایی (Content Based Filtering)

سیستمهای توصیهگر تولید شده با استفاده از تکنیکهای پالایش گروهی، تنها بر اساس ماتریس امتیازات کاربران به آیتمهای مختلف یا بر اساس یک مدل تولید شده از اطلاعات موجود، نسبت به محاسبه و ارائه پیشنهاد اقدام میکنند همچنین کاربران و آیتمها به صورت موجودیتهای مجزا در نظر گرفته میشوند و خصوصیات و مشخصههای کاربران و آیتمها تاثیری در نتیجه پیشنهادات نخواهند داشت در حالیکه با کسب اطلاعات بیشتر در خصوص یک کاربر و شناخت علایق و سلایق وی، می توان پیشنهادات دقیق تر و مناسبتری را به وی ارائه نمود[8] به عنوان مثال با داشتن اطلاعات در خصوص کارگردان یا سبک یک فیلم سینمایی میتوان پیشنهادات مناسبتری را به کاربر مقصد ارائه نمود[33]. این تکنیک که در آن با توجه به خصوصیات و علایق یک کاربر یا مشخصات و ویژگیهای یک آیتم و با توجه به محتوا و مفاهیم، پیشنهاداتی ارائه میگردد تحت عنوان “سیستمهای توصیهگر مبتنی بر محتوا” یا “پالایش محتوایی50” نامگذاری شدهاند.
تحقیقات بسیار زیادی در این زمینه، خصوصا در مورد پیشنهاد آیتمهایی که اطلاعات متنی بسیاری در مورد آنها موجود میباشد مانند کتابها، فیلمها و صفحات وب انجام گردیده است و به این مسئله از دیدگاه “بازیابی اطلاعات51” نگاه شده است و جمع آوری اطلاعات و محتوای مرتبط با ترجیحات و سلایق کاربر در قالب یک “پرسوجو52” بر روی اطلاعات مطرح میشود، به عنوان مثال کتابی که توسط کاربر مقصد امتیازی به آن داده نشده است بر اساس تشابه با پرسوجوی انجام شده امتی
از دهی میگردد[34].
به عنوان راه حل جایگزین روشهای بازیابی اطلاعات، می توان مسئله پیشنهاد دهی به کاربران را به عنوان یک مسئله دستهبندی در نظر گرفت که در آن محتوای هر آیتم به عنوان مشخصهها و معیارها مطرح میگردند و امتیاز داده شده توسط کاربر به هر کدام از آیتمها به عنوان برچسب کلاس بکار میرود. به عنوان مثال در سایتهای فروش کتاب میتوان از اطلاعات عنوان کتاب، نویسنده، ناشر، تعداد دفعات چاپ و غیره برای آموزش53 یک چند جملهای کلاسهبند بیزین ساده54 استفاده نمود[35] و امتیازات در بازه 1 تاk را مستقیما به k دسته نگاشت[33].
سایر الگوریتمهای دستهبندی مانند روش k نزدیکترین همسایه55، درختهای تصمیمگیری56 و شبکههای عصبی57 نیز برای تولید سیستمهای توصیهگر مبتنی بر محتوا مورد استفاده قرار میگیرند[36].

مطلب مشابه :  منابع مقاله با موضوعدرمان راه حل محور، مقابله با استرس

2-4- تکنیکهای ترکیبی

با ترکیب انواع روشها و تکنیکها میتوان مدلهای نوینی تولید نمود که دارای نقاط قوت روشهای ترکیب شده باشند و در مقابل دارای نقاط ضعف کمتری نسبت به هر یک از روشها باشند. روشهای متعدد و گوناگونی توسط محققان مطرح شده است که به عنوان سادهترین روش می توان روشهای پالایش گروهی و پالایش محتوایی را با یکدیگر ترکیب نمود و لیستهای پیشنهادی توسط هر کدام از روشها را با یکدیگر ترکیب نمود یا در روشی دیگر می توان به نتایج حاصل از دو روش وزن انتساب داد و به کمک میانگین وزنی نتایج را با یکدیگر ترکیب نمود[33].

2-5- سیستمهای توصیهگر مبتنی بر رابطه اعتماد میان کاربران

با ظهور شبکههای مبتنی بر اعتماد میان کاربران و با توجه به ویژگیها و خصوصیات اینگونه شبکهها، روشها و الگوریتمهای جدیدی در خصوص ایجاد و بهبود سیستمهای توصیهگر به نام روشهای مبتنی بر اعتماد مطرح گردید[10][15].
سیستمهای توصیهگر مبتنی بر اعتماد، سیستمهای توصیهگری هستند که اطلاعات ارزشمندی را به کاربران خود و بر اساس رابطه اعتماد ارائه مینمایند. اعتماد، در واقع اندازه میزان باور کاربران نسبت به یکدیگر است که بر اساس معیارهایی همچون توانایی، قدرت و خوبی افراد شکل میگیرد. رابطه اعتماد، لزوما یک رابطه دو طرفه نیست و در اکثر مواقع به صورت یک رابطه یک طرفه بیان میگردد که در آن به کاربری که به سایر کاربران اعتماد میکند “اعتماد کننده58” و فردی که در واقع مقصد و هدف رابطه اعتماد می باشد “مورداعتماد59” نامیده میشود.
مقوله اعتماد و اطمینان میان کاربران به دو صورت کلی “اعتماد آشکارا60” و “اعتماد ضمنی61” مطرح میباشد. اعتماد آشکارا، بیانگر وجود رابطه صریح اعتماد در میان خود کاربران و بر اساس نظرات ایشان میباشد. در اینگونه اعتماد، افراد و کاربران، خود مشخص میکنند که به چه افراد، گروه، سازمان یا کاربرانی اعتماد دارند و به نظرات، پیشنهادات یا آرای ایشان اطمینان دارند و نظرات آنها میتواند مبنا و پایه تصمیمگیری قرار گیرد در حالیکه در اعتماد ضمنی کاربران صراحتا رابطه اعتماد میان خود را بیان نمیکنند بلکه بر اساس پارهای از شواهد، مدارک و تشابهات، وجود رابطه اعتماد میان کاربران احساس میگردد. به عنوان نمونه، ارسال ایمیل میان دو کاربر، همکلاسی بودن دو فرد، جنسیت یکسان، شغل مشابه، عضویت در یک گروه مشترک، سطح سوادی و طبقاتی مشابه و مثالهایی از این دست، میتوانند بیانگر وجود یکی رابطه اعتماد ضمنی باشند.
در مورد اعتماد آشکارا نیز، دو مقوله ” اعتماد مستقیم62″ و ” اعتماد غیرمستقیم63″ مطرح میباشد. اعتماد مستقیم، در واقع توسط یک رابطه مستقیم فی مابین دو کاربر بیان میشود در حالیکه در اعتماد غیرمستقیم، بر اساس قانون تعدی و انتقال اعتماد، رابطه اعتماد میان دو کاربر غیر همسایه، شکل میگیرد. یکی از مسائل اصلی در سیستمهای مبتنی بر اطمینان چگونگی محاسبه اعتماد غیرمستقیم میباشد. دو رویکرد متفاوت برای محاسبه اعتماد غیرمستقیم مطرح میباشد که عبارتند از:
بر پایه مدل64 : در این روش یک مدل به همراه پارامترهایش برای محاسبه اعتماد غیرمستقیم آموزش میبیند[37][38].
بر پایه حافظه65 : در این روش از مدل استفاده نمیشود بلکه از روشهای اکتشاف66 و ابتکاری67 استفاده میگردد[15][39].
در این تحقیق رابطه اعتماد میان کاربران از نوع آشکارا در نظر گرفته میشود تا بتوان به نتایج دقیق و قابل اعتمادی دست یافت چرا که تعیین و میزان رابطه اعتماد ضمنی، خود به عنوان یکی از موضوعات تحقیق میتواند مطرح گردد.

مطلب مشابه :  پایان نامه با موضوعحسابداران، امور مالی، امور مالیاتی، استانداردهای حسابداری

2-5-1- چگونگی کارکرد سیستم توصیهگر مبتنی بر اعتماد

سیستمهای توصیهگر سنتی[6] پیشبینی نظر کاربر u در خصوص آیتم i را بر اساس امتیازات و نظرات کاربران مشابه محاسبه و بیان مینمایند. در این سیستمها یک همسایگی از کاربرانی که در خصوص آیتم i دارای نظر میباشند و از نظر پروفایل دارای شباهت با کاربر u می باشند جستجو میگردد و سپس از تجمیع نظرات ایشان، پیشبینی امتیاز نهایی صورت میپذیرد. در سیستمهای توصیهگر مبتنی بر اعتماد، بجای شباهت کاربران از شبکه اعتماد جهت یافتن همسایگان استفاده میگردد و برای پیشبینی امتیاز به یک آیتم خاص، ابتدا از همسایگان مستقیم در خصوص اینکه آیا آنها در مورد آیتم مورد نظر دارای امتیاز می باشند یا خیر، پرسش میشود و در صورتیکه امتیازی موجود باشد به عنوان جواب بازگردانده میشود و در غیر اینصورت به صورت بازگشتی، از همسایگان مستقیم خود این پرسش را مطرح میکنند و به این ترتیب شبکه اعتماد به جهت یافتن پاسخ، جستجو و پیمایش میشود.
همسایگی در یک سیستم توصیهگر مب
تنی بر اعتماد، به صورت مجموعهای از کاربران دارای نظر و امتیاز در خصوص یک آیتم خاص، مطرح میباشد که می توانند به صورت مستقیم یا غیر مستقیم مورد اعتماد کاربر مبدا قرار گیرند. امتیازات این کاربران به یک آیتم خاص، تجمیع میگردد تا نهایتا پیش بینی امتیاز نهایی صورت پذیرد.
کاوش و پیمایش شبکه اعتماد، لزوما باعث افزایش و بهبود دقت سیستم نمیگردد اما به زوجهای بیشتری می تواند پاسخ دهد که طبیعتا باعث افزایش و بهبود درصد پوشش میگردد. شکل 2-2 ساختار یک شبکه اعتماد و چگونگی عملکرد آنرا نمایش میدهد.

شکل 2-2 : نمایش یک شبکه اعتماد به همراه امتیازات بیان شده توسط کاربران در خصوص آیتمهای مختلف[20]

همان طور که در شکل فوق مشخص است شبکه اعتمادی میان کاربران وجود دارد که باعث ارتباط ایشان میگردد. در این شبکه کاربر مبدا u به دنبال پیش بینی امتیاز، برای آیتم هدف i (الماس سبز رنگ) میباشد که در این شبکه تنها تعداد اندکی از

دیدگاهتان را بنویسید