دفاعیه کارشناسی ارشد (برق و کامپیوتر) ارزیابی کیفیت ویدیوی بدون مرجع با استفاده از شبکه های عصبی ژرف

 | تاریخ ارسال: 1401/6/18 | 
دانشجو: آقای امیرحسین بختیاری
استاد راهنما: دکتر آزاده منصوری
زمان: دوشنبه ۲۸ شهریور ماه ۱۴۰۱ ساعت: ۱۵:۰۰
مکان: تهران سالن سمینار دانشکده فنی و مهندسی
چکیده
هدف روش‌های ارزیابی کیفیت ویدیوی کور (BVQA) ارزیابی کیفیت ادراکی یک ویدیوی تخریب ‌شده بدون هیچ گونه اطلاعات قبلی در مورد مرجع آن است. تاکنون چندین روش مبتنی بر شبکه های ژرف معرفی شده اند. این روش‌ها اغلب ویژگی‌های به‌ دست‌ آمده برای هر فریم را به روش‌های مختلف برای تولید یک نمایش ویدیویی و ارزیابی کیفیت ترکیب می‌کنند، ویژگی هایی که عمدتا از آخرین لایه های پیچشی شبکه گرفته می شوند و به صورت کلاسیک در روش‌ها و شبکه های مختلف مورد استفاده قرار می گیرند. در این پایان نامه، ما یک رویکرد جدید را برای به دست آوردن ویژگی‌های ژرف سطح فریم به منظور ارزیابی کیفیت ویدیو معرفی می‌کنیم. جهت انجام این کار، روابط نقشه‌ ویژگی های ژرف و به بیان دیگر شباهت میان آن ها را به عنوان اطلاعاتی مفید برای ارزیابی کیفیت ویدیو بررسی می کنیم. در واقع، Gram Matrix تولید شده در هر لایه را به عنوان ویژگی های با کیفیت بالاتر که با استفاده از شبکه های از پیش آموزش دیده شده به دست آمده است، مورد تجزیه و تحلیل قرار می دهیم. روابط ویژگی‌های ژرف را می توان مشابه ماتریس کوواریانس در نظر گرفت که نشان دهنده همبستگی بین نقشه ویژگی های مختلف است. در واقع این همبستگی ها اطلاعات ساختاری مرتبط با بافت و رنگ هر فریم را منعکس می کنند. در نهایت پس از استخراج و ادغام ویژگی‌ها، از رگرسیون بردار پشتیبان (SVR) به منظور ارائه نمره کیفیت بهره می گیریم. نتایج تجربی اثربخشی ویژگی های پیشنهادی را نشان می دهد که منجر به ارائه عملکردی قابل قبول نسبت به پیشرفته ترین روش ها در مجموعه داده های رایج به لحاظ همبستگی با سیستم رتبه بندی انسانی و تعمیم پذیری می شود.
کلیدواژه‌ها: Gram Matrix؛ ارزیابی کیفیت ویدیو بدون مرجع؛ شبکه عصبی پیچشی، همبستگی نقشه های ویژگی





CAPTCHA

دفعات مشاهده: 357 بار   |   دفعات چاپ: 48 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر