متن قرآن کریم خصوصیت های منحصر به فردی از نظر چگالی موضوعی مفهومی و دانه بندی در مقایسه با سایر متون دارد. یکی از نکات مهم در این زمینه لزوم مرجع یابی ضمیر است که به افزایش دقت نتایج جستجو کمک شایانی می نماید. هدف استفاده از دسته بندی خودکار متن ATC که یکی از شاخه های متن کاوی است به نحوی است که باعث بهبود جستجو در نرم افزارهای قرآنی شود. در این مقاله پس از تحلیل متن قرآن کریم و مقایسه آن با سایر متون روشی ارائه شده است که با توجه به خصوصیات متن قرآن کریم قادر است آیات را ابتدا درون موضوعاتی از پیش تعریف شده دسته بندی کند سپس آیات همه سوره ها با توجه به وزن کلمات آن برای هر موضوع درون دسته ها طبقه بندی می کند. در این زمینه از ارتباط موضوعات و مفاهیم مختلف برای دسته بندی به مدد جسته و فرآیند دسته بندی را بهبود می دهد. در پایان با توجه به وزن کلمات هر آیه برای هر موضوع میزان ارتباط آن آیه با موضوع محاسبه شده و دسته آیه مشخص می شود. الگوریتم ارائه شده مبتنی بر TFIDF بوده و پارامترهای موثر نظیر ضریب تفکیک متن به نحوی تنظیم شده است که خصوصیات قرآن کریم را در نظر بگیرد. روش پیشنهادی در قالب یک نرم افزار نمونه جستجوی موضوعی قرآن کریم پیاده سازی شده است.
کلمات کلیدی: متن کاوی، دسته بندی خودکار متن، جستجو، قرآن کریم، نرم افزار قرآنی
تعداد مشاهده: 3375 مشاهده
کد فایل:7277
انتشار در:۱۳۹۸/۲/۲۶
حجم فایل ها:3.8 مگابایت
تعداد صفحات: 12
زبان: فارسی
سال انتشار: 1388
محل انتشار: سومین کنفرانس داده کاوی
فرمت: (PDF) غیر قابل ویرایش
منابع و مآخذ: دارد
جدول و نمودار: دارد
عکس و تصویر: دارد
مقاله درباره هوش مصنوعی
قیمت : 50,000 تومان
توضیحات بیشتر دریافت فایل
ترجمه مقاله الگوریتم لانه مورچگان مبتنی بر استراتژی تعادل بار در رایانش ابری
قیمت : 30,000 تومان
ترجمه مقاله انگلیسی استراتژی هوشمند زمانبندی وظیفه برای تعادل بار در محاسبات ابری
قیمت : 33,000 تومان
ترجمه مقاله ارزیابی کاربرد پذیری تکنولوژی های وب معنایی
قیمت : 40,000 تومان
ترجمه مقاله ارزیابی عملکرد متریک های مسیریابی IBETX بر روی پروتکل های مسیریابی DSDV در شبکه
قیمت : 45,000 تومان
مقاله آشنایی با لینوکس و طریقه نصب دو نسخه مختلف بر روی ماشین مجازی
قیمت : 5,000 تومان
مقاله بررسی انواع موتورهای جستجو ، قوانین و الگوریتم های آن ها
قیمت : 2,500 تومان
مقاله تاثیر خصوصیات فایل شاخص بر دقت بازیابی اطلاعات