پایان نامه ها

پایان نامه ارشد رایگان درمورد سیستمهای مدیریت، رضایتمندی

میزان خطای RMSE کاهش و درصد پوشش به صورت همزمان افزایش یابد.
با حفظ میزان خطای RMSE درصد پوشش افزایش یابد.
با حفظ درصد پوشش میزان خطای RMSE کاهش یابد.
درصد پوشش برای کاربران تازه وارد افزایش یابد.
میزان خطای RMSE برای کاربران تازه وارد کاهش یابد.
در ادامه تکنیکها و متدهای مورد استفاده جهت بهبود و توسعه این مدل بیان میگردند و در فصل آینده نتایج حاصل از پیادهسازی و آزمایش هر یک از آنها با نتایج مدل پایه مورد مقایسه، ارزیابی و بحث و بررسی قرار میگیرد .
4-3-1- استفاده از فرمول jaccard جهت محاسبه تشابه آیتمها ضریب تشابه Jaccard که اولین بار توسط Paul Jaccard مطرح گردید[78], [79] معیاری جهت مقایسه تشابه و تفاوت مجموعه دادهها است و به صورت تقسیم اندازه مجموعه اشتراک دو مجموعه داده مانند A و B بر اندازه مجموعه اجتماع همان دو مجموعه مطابق فرمول زیر محاسبه میگردد.
(24)
J(A,B)=|A∩B|/|A∪B| همچنین برای اندازه گیری تفاوت و عدم تشابه دو مجموعه داده، فاصله Jaccard به صورت مکمل ضریب جاکارد تعریف و به صورت زیر بیان میگردد.
(25)
J_σ (A,B)=1-J(A,B)=(|A∪B|-|A∩B|)/|A∪B| با توجه به توضیحات بالا، ضریب تشابه جاکارد را میتوان جهت محاسبه تشابه آیتمها در یک سیستم توصیهگر و به جای فرمول پیرسون مورد استفاده قرارداد و نتایج حاصل از آنرا مورد ارزیابی و تجزیه و تحلیل قرار داد. فرمول جاکارد به صورت زیر جهت تشابه دو آیتم i و j تعریف میگردد.
(26)
J(i,j)=|UC_(i,j) |/(|UC_i |+|UC_j | ) در فرمول فوق UC_(i,j) مجموعه کاربرانی هستند که به صورت مشترک هم به آیتم i و هم به آیتم j امتیاز دادهاند و UC_i مجموعه کاربرانی هستند که تنها به آیتم i امتیاز دادهاند و UC_j مجموعه کاربرانی هستند که تنها به آیتم j امتیازی تخصیص دادهاند.
4-3-2- حذف میانگین از فرمول پیرسون یکی دیگر از مواردی که مورد بررسی و ارزیابی قرار میگیرد حذف میانگین از فرمول پیرسون است زیرا با توجه به این مطلب که امتیازات آیتمهای مختلف و به تبع آن میانگین آنها نیز در یک محدوده مشخص ]5,1[ قرار دارد، حذف میانگین، میتواند باعث بهبود سرعت و در برخی موارد باعث افزایش دقت و کاهش خطا نیز گردد[80]. فرمول تغییر یافته پیرسون جهت محاسبه ارتباط میان دو آیتم i و j در زیر بیان می گردد .
(27)
modified_corr(i,j)=(∑_(u∈UC_(i,j))▒〖(r_(u,i))(r_(u,j))〗)/√(∑_(u∈UC_(i,j))▒〖〖(r_(u,i))〗^2 ∑_(u∈UC_(i,j))▒〖(r_(u,j))〗^2 〗)
4-3-3- استفاده از تکنیک مبتنی بر آیتم خالص96 یکی دیگر از رویکردهایی که در محاسبه تشابه میان دو آیتم مطرح میباشد استفاده از تکنیک مبتنی بر آیتم خالص میباشد[22]. در این حالت تغییری در فرمول پیرسون بکار رفته در مدل TrustWalkerرخ میدهد و به جای میانگین امتیازات کاربر u∈UC_(i,j) که در فرمول شماره 16 مطرح گردیده است میانگین کل امتیازات آیتمهای i و j در سطح کلیه کاربران، مورد استفاده قرار می گیرد.
(28)
pure_corr(i,j)=(∑_(u∈UC_(i,j))▒〖(r_(u,i)-r ̅_i)(r_(u,j)-r ̅_j)〗)/√(∑_(u∈UC_(i,j))▒〖〖(r_(u,i)-r ̅_i)〗^2 ∑_(u∈UC_(i,j))▒〖(r_(u,j)-r ̅_j)〗^2 〗) در فرمول فوق r ̅_i و r ̅_j میانگین کل امتیازات تخصیص داده شده به آیتمهای i و j توسط کاربران نظر دهنده به آنها می باشد.
4-3-4- تعدیل و تفسیر نظرات کاربران97 در اکثر سیستمهای توصیهگر موجود، فرض بر این است که افراد و کاربران نظر دهنده دارای یک تفسیر مشترک و یکسان از محدوده امتیازات میباشند و در واقع تفسیر دو کاربر مختلف از یک امتیاز واحد، به عنوان مثال امتیاز 3 یکسان است و در ذهن هر دو کاربر مفهوم “متوسط” را تداعی میکند. بنابراین دو کاربر که برای یک آیتم، امتیازات متفاوتی را در نظر گرفتهاند دارای تفاوت عقیده میباشند در حالیکه در دنیای واقعی چنین نیست و لزوما تعریف میزان رضایتمندی یا عدم رضایت از یک موضوع یا یک محصول خاص در ذهن کاربران مختلف یکسان نیست و هر شخص با توجه به ذهنیات و درک خود، واژهها و درجه بندیهای سنجش محصولات را برای خود تعریف مینماید، بنابراین در دیدگاه یک کاربر امتیاز 4 به یک آیتم، بیانگر مفهوم “بسیار خوب” است در حالیکه در دیدگاه کاربر دیگر همین امتیاز ممکن است مفهوم “متوسط” را نشان دهد.
با توجه به مفاهیم و مطالب فوق به نظر میرسد باید یک مکانیزم دیگر نیز به یک سیستم توصیهگر اضافه گردد تا به کمک آن بتواند امتیازات دریافت شده از افراد و کاربران نظر دهنده را تعدیل و در یک تعریف واحد از امتیازات تفسیر نماید[81].
این ایده قبلا تنها در سیستمهای مدیریت اعتماد بکار برده شده است و به صورت فاصله معنایی میان یک امتیاز پیشبینی شده و نظر شخصی یک فرد بکار گرفته شده است[64]. بکار بردن مفهوم تفسیر و تعدیل نظرات کاربران در سیستمهای توصیهگر باعث بهبود و افزایش دقت نتایج پیشبینی و مطابقت بیشتر با میل کاربر مبدا خواهد بود. برای نشان دادن این مطلب مثالی بر روی مجموعه داده movielens98بیان میگردد. در این مجموعه داده دو کاربر فرضی u_1 و u_2 در نظر گرفته میشود و با کنترل پروفایل هریک از آنها مشخص میشود که کاربر u_1 به 135 آیتم و کاربر u_2 به 94 آیتم امتیاز داده است که از این تعداد، 22 آیتم به صورت مشترک توسط هر دو کاربر دارای امتیاز میباشند. به جهت سادگی فرض میشود که بهترین همسایه کاربر u_1 برای ارائه پیشنهاد به وی کاربر u_2 میباشد و برای تعیین امتیاز آیتمهای موجود در مجموعه مورد ارزیابی کاربر u_1، از نظرات موجود در پروفایل کاربر u_2 استفاده میگردد.
با فرض این مطلب که اندازه مجموعه تست کاربر u_1 د ارای 50 آیتم است اولین نکته قابل ملاحظه این است که تنها تعداد 18 عدد از آیتمهای مجموعه تست، درون پروفایل کاربر u_2 دارای مقدار میباشند بنابراین میتوان تنها امتیاز 18 آیتم از مجموعه تست را پیشبینی کرد. علاوه بر آن امتیاز 5 کاربر u_1 ممکن است برابر امتیاز 4 کاربر u_2 باشد و یا امتیاز 2 کاربر u_1 معادل امتیاز 1 کاربر u_2 باشد بنابراین بدون در نظرگرفتن تفسیر نظرات یکدیگر، میزان خطای موجود در نتایج حاصل بسیار زیاد خواهد بود.
برای نشان دادن تفاوت نظرات این دو کاربر میتوان از یک ماتریس دو بعدی که در جدول شماره 4-1 نشان داده شده است استفاده نمود. هر سلول در این ماتریس، نشان دهنده تعداد یک امتیاز خاص میباشد که توسط دو کاربر تخصیص داده شده است به عنوان مثال عنصر سطر سوم و ستون چهارم که دارای مقدار 3 است نشان دهنده این مطلب است که در خصوص 3 آیتم، کاربر u_1 امتیاز 3 را در نظر گرفته است اما در خصوص همان 3 آیتم کاربر u_2 امتیاز 4 را در نظر گرفته است .
جدول 4-1 : ماتریس پراکندگی نحوه امتیازدهی دو کاربر u_1 و u_2
کاربر
تعداد امتیازات u_2
تعداد امتیازات u_1
امتیاز
1
2
3
4
5 1
0
0
0
0
0 2
0
0
0
2
0 3
0
0
0
3
3 4
0
0
0
3
1 5
0
0
1
6
3 این جدول را می توان به یک جدول 5×3، مطابق جدول شماره 4-2 تبدیل نمود که نشان دهنده تجارب کاربر u_1 در مواجه با نظرات کاربر u_2 میباشد و همچنین با توجه به این جدول، کاربر u_1 این توانایی را پیدا میکند که چگونه نظرات کاربر u_2 را مطابق با نظرات خویش تفسیر و تعدیل نماید.
جدول 4-2 : تفسیر نظرات کاربر u_2
امتیازات
کمتر
برابر
بالاتر
تفسیر امتیازات u_2
1
0
0
0
1.00
2
0
0
0
2.00
3
0
0
1
4.00
4
5
3
6
4.07
5
4
3
0
4.43 تعدیل و تفسیر نظرات یک کاربر، از طریق محاسبه میانگین وزنی تجارب حاصل از نظرات وی میباشد به عنوان مثال زمانیکه کاربر u_1 امتیاز 5 را در خصوص یک آیتم از کاربر u_2 دریافت میکند با توجه به تجارب گذشته میداند که در 7 موردی که از کاربر u_2 امتیاز 5 را دریافت نموده است در 4 مورد آن نظر خودش اندکی کمتر از 5 بوده است در نتیجه کاربر u_1 امتیاز 5 کاربر u_2 را به 4.43 تفسیر مینماید که این امر در جدول فوق قابل مشاهده میباشد. مطالب فوق را در قالب فرمول زیر می توان بیان نمود:
(29)
Interpret(r)=(((r-1)×〖lower〗_r )+(r×〖same〗_r )+((r+1)×〖higher〗_r))/(〖lower〗_r+〖same〗_r+〖higher〗_r ) برای امتیاز بیان شده توسط یک کاربر که سوابق تاریخی از سایر نظرات وی در دست نیست، تفسیر و تعدیل نظر وی معادل همان امتیاز خواهد بود. تحقیقات گذشته در این خصوص نشان داده است که بکارگیری مکانیزم تعدیل و تفسیر نظرات افراد، میتواند باعث بهبود چشمگیر دقت و کاهش خطا گردد[81].
به جهت بهبود دقت و کاهش خطای مدل توسعه یافته TrustWalker نیز، سعی شده است تا مکانیزم تعدیل و تفسیر نظرات کاربران بکار گرفته شود و در پیاده سازی مدل جدید این امر صورت پذیرد که در فصل آینده نتیجه آزمایشات انجام پذیرفته و نتایج حاصل از آن ارائه میگردد.
4-3-5- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر در مدل TrustWalker مقدار رابطه اعتماد میان کاربران به صورت مقدار 1 یا 0 در نظر گرفته شده است که مقدار 1 بیانگر وجود اعتماد و مقدار 0 نشان دهنده عدم وجود اعتماد میان دو کاربر میباشد و با توجه به این مطلب که پیمایش شبکه و انتخاب تصادفی کاربران بر اساس مقدار رابطه اعتماد میان ایشان صورت میگیرد لذا در صورتیکه بتوان مقدار دقیق اعتماد را به صورت اعشاری و بر اساس یک فرمول مشخص محاسبه نمود میتوان دقت کلی مدل را افزایش داد. با در نظر گرفتن این مطلب، کاربرانی که از مقدار اعتماد بالاتری برخوردار باشند دارای احتمال بیشتری برای انتخاب در پیمایش تصادفی شبکه میباشند بنابراین نظرات ایشان میتواند تاثیر بیشتری بر روی نتایج کلی داشته باشد. محاسبه مقدار اعتماد میان دو کاربر به صورت اعشاری و در محدوده ]1,0[ با تفسیر دنیای واقعی رابطه اعتماد نیز رابطه معنایی مستقیمی دارد چرا که در دنیای واقعی نیز رابطه اعتماد میان افراد به صورت مطلق نیست، بلکه به صورت فازی و در یک محدوده بیان میگردد و اعتماد افراد به یکدیگر به صورت نسبی مطرح میشود.
با توجه به مطالب فوق و براساس نظرات پیشین دو کاربر در خصوص آیتمهای مشترک، میتوان اختلاف امتیازات ایشان در خصوص آیتمهای مشترک را اساس محاسبه اعتماد میان این دو کاربر در نظر گرفت. مطابق فرمولهای شماره 2 و 3 بیان شده در [81] و با توجه به مطلب فوق می توان برای محاسبه اعتماد میان دو کاربر u و v از فرمول زیر کمک گرفت.
(30)
Trust(u,v)=(∑_(i∈〖UC〗_(u,v))▒〖1-|r_iu-r_iv |/5〗)/|〖UC〗_(u,v) | در فرمول فوق 〖UC〗_(u,v) مجموعه آیتمهایی میباشد که مشترکا توسط دو کاربر u و v امتیاز داده شدهاند و هر دو کاربر در خصوص این آیتمها دارای نظر میباشند. r_iu و r_iv به ترتیب امتیاز کاربر u به آیتم i و امتیاز کاربر v به آیتم i میباشد. عدد 5 در مخرج کسر موجود نیز به دلیل محدوده امتیازات ]5,1[ می باشد.
با توجه به فرمول شماره 30، این نکته قابل ذکر است که هرچه اختلاف نظر دو کاربر در خصوص آیتمهای مشترک کمتر باشد باعث افزایش خطی میزان اعتماد میان ایشان و هرچه این اختلاف بیشتر باشد باعث کاهش خطی میزان اعتماد میان ایشان میگردد.
در این تحقیق به جهت سادگی از فرمول فوق برای محاسبه اعتم اد میان کاربران استفاده شده است در حالیکه میتوان از فرمولهای غیر خطی که روند تغییر میزان اعتماد را، نسبت به میزان اختلاف امتیازات دو کاربر به یک آیتم خاص را با دقت بالاتری نشان میدهند بهره جست یا می توان با توجه به سوابق نظرات کاربران، از الگوریتمهای یاد گیرنده برای محاسبه و پیشبینی میزان اعتماد دو کاربر به یکدیگر استفاده نمود .
نکته قابل ذکر این است که در این فرمول از تشابه امتیازات و نظرات کاربران در خصوص آیتمهای مشترک، میزان اعتماد محاسبه میگردد در حالیکه در دنیای واقعی، ممکن است میزان اعتماد میان افراد رابطه خاصی به نظرات مشترک ایشان نداشته باشد. این فرمول برای مجموعه دادههایی همانند movielens که کاربران آن حداقل به 20 فیلم]]>

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *