گراف همکاری برای تقسیم‌بندی مجموعه ویژگی‌ها در طبقه بندی داده‌ها

تعداد بازدید:۷۷

پروژه گراف همکاری مربوط به یک روش جدید برای تقسیم بندی ویژگی‌ها در طبقهبندی داده‌ها است. در یادگیری ماشین، داده‌ها میتوانند به دسته‌های مختلفی برای طبقه‌بندی تقسیم شده و ویژگی‌های مختلفی از داده‌ها بهعنوان ورودی برای مدل‌های یادگیری ماشین استخراج شوند. با این حال، داشتن تعداد زیادی ویژگی می‌تواند طبقه­بندها را دچار مشکل کند که به نفرین بعدیت شناخته میشود، بنابراین تقسیم ویژگی­ها به دسته‌های کوچکتر یکی از رویکردهای حل این مشکل است.

در این پروژه، یک گراف همکاری برای تقسیم بندی ویژگی‌ها به کار می‌رود. در این روش، هر گره به یک ویژگی نسبت داده می‌شود و هر لبه نشان دهنده رابطه همکاری بین دو ویژگی است. با اعمال روش تشخیص انجمن روی گراف همکاری، ویژگیها دستهبندی میشوند. سپس برای هر دسته یک طبقهبند آموزش داده شده و نتیجه طبقهبندی نهایی با تجمع طبقهبندهای هر دسته به‌دست میآید.

با استفاده از این روش، مساله نفرین بعدیت حلشده، دقت و سرعت فرآیند طبقهبندی بهبود می‌یابد. در این پروژه از چندین مجموعه داده مختلف، از جمله داده‌های واقعی و ساختگی با بعد بالا، برای آموزش و آزمایش این روش استفاده شدهاست. نتایج نشانمی‌دهد که استفاده از گراف همکاری می‌تواند دقت و سرعت فرآیند طبقه‌بندی را بهبود بخشید و مساله نفرین بعدیت را حل کند.

در ادامه به بررسی بیشتر این پروژه می‌پردازیم. در بخش مقدمه، نیاز به کاهش بعد ویژگی‌ها در طبقه‌بندی داده‌ها بررسی شدهاست و روش‌های مختلفی برای این کار معرفی شدهاست. سپس، گراف همکاری برای تقسیم بندی ویژگی‌ها معرفی شده و نحوه کار آنها توضیح داده می‌شود. همچنین در بخش­های کارهای مرتبط، روش‌های دیگری برای تقسیم بندی ویژگی‌ها معرفی شده و با روش پیشنهادی مقایسه شده‌اند.

در بخش روش پیشنهادی، جزئیات بیشتری در مورد گراف همکاری برای تقسیمبندی ویژگی‌ها آورده شدهاست. در بخش آزمایش‌ها، نتایج روی داده‌های مختلف بررسی گردیده است. نتایج نشان می‌دهند که استفاده از گراف همکاری می‌تواند دقت و سرعت فرآیند طبقه‌بندی را بهبود بخشید و مساله نفرین بعدیت را حل کند.

در بخش نتیجه‌گیری، مزایای استفاده از گراف همکاری برای تقسیم بندی ویژگی‌ها در طبقه‌بندی داده‌ها بررسی شده است. همچنین، پیشنهاداتی برای کارهای آتی در این زمینه ارائه گردیده است.

 

تیم پروژه: خلیل طاهری، دکتر هادی مرادی، دکتر مصطفی توسلی پور

 

مراکز همکار: 

 

مقالات مرتبط: 

  • Khalil Taheri, Hadi Moradi, and Mostafa Tavassolipour. "Collaboration graph for feature set partitioning in data classification." Expert Systems with Applications 213 (2023): 118988.