دفاعیه کارشناسی ارشد (برق و کامپیوتر) تشخیص تقلب در داده های بانکی با استفاده از روش های یادگیری ماشین

 | تاریخ ارسال: 1400/12/23 | 
دانشجو: خانم سیده خدیجه هاشمی
استاد راهنما: دکتر سیده لیلی میرطاهری
زمان: سه شنبه ۲۴ اسفند ماه ۱۴۰۰ ساعت: ۱۷:۰۰

لینک ورود به جلسه
چکیده:
امروزه بانکداری یک بخش مهم و حیاتی در امور روزمره است. با پیشرفت تکنولوژی و با توجه به افزایش خدمات در زمینه تجارت الکترونیک، استفاده از کارت اعتباری به یکی از محبوب ترین روش های پرداخت تبدیل شده است. 
با معرفی خدمات نوین در بانکداری الکترونیکی، علاوه بر افزایش حجم تراکنش ها، افزایش قابل توجه در تعداد تقلب ها رخ می دهد که منجر به هزینه های هنگفتی در حوزه ی تراکنش های بانکی می شود.  از این رو تشخیص فعالیت های جعلی برای کنترل این هزینه ها بسیار ضروری و مهم می باشد. 
از آنجا که داده های بانکی دارای حجم زیادی هستند، استفاده از تکنیک های داده کاوی و الگوریتم های طبقه بندی برای تحلیل داده ها مورد استفاده قرار می گیرند. تشخیص تقلب در بانکداری یک مسئله طبقه بندی دوتایی است، که درآن داده ها به دو دسته مشروع و تقلبی تقسیم بندی می شوند. با توجه به اینکه تعداد داده های تقلبی به نسبت داده های مشروع، کم می باشد، استفاده از روش های متعادل سازی داده برای بهبود عملکرد سیستم استفاده می شود، در این پروژه استفاده از وزن دهی به داده ها به منظور کنترل وزن تراکنشات تقلبی و مشروع مورد توجه قرار گرفته است. و همچنین از روش اعتبارسنجی متقابل ۵ برابری برای ارزیابی نتایج استفاده شده است. بهینه سازی بیزین برای تنظیم هوشمند و سریع هایپر پارامترها در سه الگوریتم یادگیری ماشین کت بوست و ماشین تقویت گرادیان سبک و ایکس جی بوست بکار گرفته شده و همچنین از روش یادگیری جمعی رأی اکثریت برای ترکیب این الگوریتم ها استفاده شده است که در نهایت با ترکیب دو مورد ماشین تقویت گرادیان و ایکس جی بوست به بهترین معیار سطح زیر منحنی ۰.۹۵=  AUC و صحت ۰.۷۹ و فراخوانی ۰.۸۰ و میزان ۱F ۰.۷۹ و ضریب همبستگی متیوز ۰.۷۹ رسیدیم. همچنین به کمک یادگیری عمیق و با کمک بهینه سازی بیزین برای تنظیم هایپر پارامترهای آن به معیار مساحت زیر منحنی ۰.۹۵= AUC و صحت ۰.۷۸ و فراخوانی ۰.۸۱ و میزان ۱F ۰.۸۰ و ضریب همبستگی متیوز ۰.۸۰ دست یافتیم.
کلمات کلیدی: داده کاوی، یادگیری ماشین، داده های نامتعادل، یادگیری جمعی، هایپر پارامتر، بهینه سازی بیزین، یادگیری عمیق 



CAPTCHA

دفعات مشاهده: 248 بار   |   دفعات چاپ: 14 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر