دانشجو: آقای امیرحسین بختیاری
استاد راهنما: دکتر آزاده منصوری
زمان: دوشنبه ۲۸ شهریور ماه ۱۴۰۱ ساعت: ۱۵:۰۰
مکان: تهران سالن سمینار دانشکده فنی و مهندسی
چکیده
هدف روشهای ارزیابی کیفیت ویدیوی کور (BVQA) ارزیابی کیفیت ادراکی یک ویدیوی تخریب شده بدون هیچ گونه اطلاعات قبلی در مورد مرجع آن است. تاکنون چندین روش مبتنی بر شبکه های ژرف معرفی شده اند. این روشها اغلب ویژگیهای به دست آمده برای هر فریم را به روشهای مختلف برای تولید یک نمایش ویدیویی و ارزیابی کیفیت ترکیب میکنند، ویژگی هایی که عمدتا از آخرین لایه های پیچشی شبکه گرفته می شوند و به صورت کلاسیک در روشها و شبکه های مختلف مورد استفاده قرار می گیرند. در این پایان نامه، ما یک رویکرد جدید را برای به دست آوردن ویژگیهای ژرف سطح فریم به منظور ارزیابی کیفیت ویدیو معرفی میکنیم. جهت انجام این کار، روابط نقشه ویژگی های ژرف و به بیان دیگر شباهت میان آن ها را به عنوان اطلاعاتی مفید برای ارزیابی کیفیت ویدیو بررسی می کنیم. در واقع، Gram Matrix تولید شده در هر لایه را به عنوان ویژگی های با کیفیت بالاتر که با استفاده از شبکه های از پیش آموزش دیده شده به دست آمده است، مورد تجزیه و تحلیل قرار می دهیم. روابط ویژگیهای ژرف را می توان مشابه ماتریس کوواریانس در نظر گرفت که نشان دهنده همبستگی بین نقشه ویژگی های مختلف است. در واقع این همبستگی ها اطلاعات ساختاری مرتبط با بافت و رنگ هر فریم را منعکس می کنند. در نهایت پس از استخراج و ادغام ویژگیها، از رگرسیون بردار پشتیبان (SVR) به منظور ارائه نمره کیفیت بهره می گیریم. نتایج تجربی اثربخشی ویژگی های پیشنهادی را نشان می دهد که منجر به ارائه عملکردی قابل قبول نسبت به پیشرفته ترین روش ها در مجموعه داده های رایج به لحاظ همبستگی با سیستم رتبه بندی انسانی و تعمیم پذیری می شود.
کلیدواژهها: Gram Matrix؛ ارزیابی کیفیت ویدیو بدون مرجع؛ شبکه عصبی پیچشی، همبستگی نقشه های ویژگی
دفعات مشاهده: 650 بار |
دفعات چاپ: 131 بار |
دفعات ارسال به دیگران: 0 بار |
0 نظر