حسگرهای فراطیفی اطلاعات طیفی فراوان را با صدها باند مستمر طیفی را فراهم می کنند و تصویرسازی فراطیفی جمع آوری شده را می تواند برای انجام طبقه بندی بهتر استفاده کرد از طریق تصویرسازی چند طیفی سنتی قابل انجام نیست. در طی چند دهه گذشته، روش های شناخت الگوی بدیع به صورت گسترده برای وظایف پردازش تصویر راه دور استفاده شده اند مانند طبقه بندی نظارتی، طبقه بندی بدون نظارت، استخراج مشخصه، شناسایی هدف و شناسایی تغییر. ماشین های بردار پشتیبانی (SVM)، به عنوان یکی از مرکزهای تحقیقاتیِ یادگیری ماشینی، توجه بیشتری را در تشخیص راه دور به خود جلب کرده است.
SVM دارای مزایایی مانند پیش نیازهای سخت برای دانش قبلی و نمونه های آموزش، تناسب با داده های بُعد بالا و قدرت بیشتر با نویز. اگرچه، اغلب برای یک طبقه بند SVM سنتی سخت است که عملکرد رضایت بخش را در طبقه بندی تصاویر ابرطیفی ارائه کند. مخصوصا، برای تصویر ابر طیفی بُعد بالا با تعداد محدود نمونه های آموزشی، دقت طبقه بندی معمولا به شدت کاهش پیدا می کند که به دلیل پدیده هیوز می باشد. علاوه بر این، تصویرسازی ابرطیفی معمولا از نظر مجموعه های آموزشی نقصان دارد چون مجموعه نمونه معمولا شامل کار میدانی گسترده و زمان بر است.
یک راه حل پیشرفته مرتبط برای این چالش طبقه بندی معرفی یادگیری نیمه نظارتی (SSL) است. SSL از تعداد زیادی از داده های بدون برچسب به همراه داده های برچسب دار موجود استفاده می کند تا طبقه بندهایی را ایجاد کند که ممکن است قویتر از معمولا باشند. SSL همچنین نیازمند تلاش انسانی کمتر در جمع آوری نمونه است لذا اهمیت زیادی در کاربردهای عملی دارد. تحقیقات بر روی SLL شاهد توسعه سریع در چند سال اخیر است و برخی روش های رایج نیز پیشنهاد شده اند مانند مدل های ترکیبی زایا، مدل های خود یادگیری، مدل های یادگیری چند دیدگاهی، ماشین های تحلیل پشتیبانی وارسان (TSSVM) و روش های مبتنی بر گراف.
به طور خاص، SVM نیمه نظارتی (S3VM)با موفقیت برای طبقه بندی تصویر تشخیص از راه دور استفاده شده است. مارکونیچی یک S3VM ترکیبی بدیع را برای طبقه بندی طیفی – فضایی تصاویر ابرطیفی معرفی کرد که می تواند به شدت دقت طبقه بندی را در قیاس با SMVهای نظارتی و S3VM پیشرونده بهبود بخشد.
مونوز – ماری یک الگوریتم را برای اصلاح کرنل OC – SVM پیشنهاد کردند با مدلسازی توزیع حاشیه ای داده ها با داده های گراف لاپلاز. گو با موفقیت از SVM لاپلازی برای طبقه بندی تصاویر ابرطیفی مورد استفاده قرار گرفت. یک رویکرد بدیع برای یادگیری نیمه نظارتی که از روش های یادگیری فعال جاری برای چهارچوب خود یادگیری استفاده می کند، توسط دوپیو و همکاران (2013) ارائه شد.
روش های SSL فوق الذکر عملکرد طبقه بندی را با استراتژی های مختلف بهبود می بخشند. اگرچه، چون تعدادی از نمونه های آموزشی افزایش پیدا می کنند، بهره گیری صحیح از همه نمونه های آموزشی توسط طبقه بند ممکن است نامتعادل و غیرقابل تحمل باشد چون مسائل رایانشی وجود دارند. همچنین، اگر یک نمونه با برچسب اشتباه به آموزش اضافه شود، ممکن است دقت طبقه بندی را کاهش دهد. لذا، یک الگوریتم نیمه نظارتی باید طراحی شود که از نظر محاسباتی کارآمد باشد و عملکرد طبقه بندی را بالا ببرد و لذا حقیقتا نمونه های اضافی را بهبود بخشد.
در این مقاله، ما امکان پذیری اطلاعات فضایی سازوار درون الگوی SSL را ارزیابی می کنیم که در آن S2SVMSE خود نمونه های بدون برچسب دقیق را برای آموزش انتخاب می کند. این مورد از اطلاعات فضایی در انتخاب نمونه های آموزشی بدون برچسب جدید استفاده می کند و دسته های طبقه بند را ایجاد می کند.
فرض بر این است که نمونه ها در یک بخش فضایی همگن بیشتر احتمال دارد که به یک طبقه تعلق داشته باشند که به تولید یک نقشه طبقه بندی دقیق و نرم کمک می کند؛ در این بین، نمونه ها در همان بخش نیز تغییرات درون طبقه ای را نشان می دهند که می تواند برای آموزش طبقه بند مفید باشد. تا بدین جا، مطالعات اندکی که از اطلاعات فضایی برای نمونه های بدون برچسب استفاده کرده باشند در ادبیات تحقیق گزارش شده اند.
شی و همکاران یک الگوریتم کاهش بُعد نیمه نظارتی را پیشنهاد کردند که در آن نمونه های بدون برچسب براساس نتایج تقسیم بندی چندسطحی و t معیار شباهت همسایه نزدیک از نظر طیفی انتخاب شدند و این امر بیان می کند که تعداد همسایه های t کنترل کننده دقت اندازه گیری شباهت است لذا آنها توصیه کردند که یک t بزرگتر برای کم کردن محدودیت استفاده شود.
اگرچه نمی تواند به صورت کامل با نمونه های برچسب دار محدود یا اندک عمل کند، لذا همسایه نزدیکترین – آلفا – یک پیشنهاد شد تا اندازه گیری شباهت را انجام دهد، زمانی که نمونه های برچسب دار بسیار محدود هستند. در این کار، الگوریتم میانگین تغییر برای تقسیم تصویر و استخراج مشخصه فضایی استفاده شد و یک الگوریتم محدود قوی به نام آلفا-یک-نزدیکترین همسایه برای یکپارچگی اطلاعات فضایی استفاده شد زمانی که نمونه های آموزش جدید انتخاب می شوند.
این مقاله به صورت زیر مرتب شده است. در بخش 2، تقسیم بندی مبتنی بر میانگین تغییر به صورت خلاصه بازبینی می شود و سپس رویکرد پیشنهادی معرفی می شود. بخش 3 نشان دهنده نتایج آزمایشی است. در نهایت، بخش 4 نتیجه گیری می کند.