بخشی از متن فایل word ارائه يک روش هوشمند مبتني برويژگيهاي آماري به منظور استخراج کلمات و عبارات کليدي ازمتن :
سال انتشار : 1394
نام کنفرانس یا همایش : کنفرانس بين المللي يافته هاي نوين پژوهشي درمهندسي برق و علوم کامپيوتر
تعداد صفحات :13
چکیده مقاله:
ازاختراع خط تاکنون نوشتار دارای جایگاه ویژه ی برای ثبت و انتقال اطلاعات درمیان انسانها بوده است امروزه با ورود ماشین ها و سیستم های پردازش متن بخش وسیعی ازاین نوشتارها درقالب دیجیتال ذخیره شده است حجم عمده ی ازاین نوشتارهای دیجیتال ساخت یافته نیستند برای استفاده بهتر و بهینه ازاین گونه نوشتارها توسط سیستم ها و ماشین ها نیاز به روشهای برای ایجادساختار یاایجادفراداده های برای این نوشتارها می باشد دراین پژوهش روشی جدید بااستفاده ازویژگی های اماری و برداررخداد کلمه درهرمتن برای استخراج کلمات کلیدی ارایه میدهیم اینروش برروی متن منفرد و بدون درنظر گرفتن دامنه موضوعی متون ا جرا میشود این پیاده سازی با مجموعه داده SemEval-2010 Task که دارای 284 متن ازمقالات استخراج شده ازکتابخانه ی دیجیتال acm و سه دسته کلمه ی کلیدی مشخص شده توسط نویسنده مشخص شده توسط خواننده و ترکیب این دو به عنوان جواب هرمقاله است و معیارهای بازیابی و دقت برای کل مجموعه داده محاسبه میشود