بخشی از متن فایل word ارائه يک روش دسته بندي متون با تکنيک کاهش ويژگي فيلتري و يادگيري ماشين :
سال انتشار : 1394
نام کنفرانس یا همایش : کنفرانس بين المللي يافته هاي نوين پژوهشي درمهندسي برق و علوم کامپيوتر
تعداد صفحات :10
چکیده مقاله:
پایگاه داده های متنی با توجه به افزایش میزان اطلاعات موجود در فرم الکترونیکی، مانند نشریات الکترونیکی، انواع مختلف مدارک الکترونیکی، پست الکترونیکی و شبکه جهانی وب به سرعت در حال رشد میباشند .یکی از مهم ترین تکنیک های متن کاوی، دسته بندی متون است .متن کاوی را میتوان به عنوان متدها و الگوریتمهایی از فیلدهای یادگیری ماشین و آماری برای متنها با هدف پیدا کردن الگوهای مفید در نظر گرفت .در این تحقیق الگوریتم انتخاب ویژگی فیلتری بهره اطلاعات مورد استفاده قرار گرفته است .این مقاله روشی برای دسته بندی متون پیشنهاد شده است که در آن ابتدا یک دسته بند ماشین بردار پشتیبان ، بیز ساده و درخت تصمیم با تعداد کمی نمونه برچسب دار ساخته می شود، سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری بر اساس عدم اطمینان به همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها ، به صورت هدفمند نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند