سید مصطفی فخر احمد

نمایش ۱ تا ۱۰ مورد از کل ۱۰ مورد.

۱.

روند رشد رویکرد تحلیل چهریزه ای در سازماندهی دانش: مروری صد ساله(مقاله علمی وزارت علوم)

نویسنده: عبدالحسین فرج پهلو فریده عصاره سید مصطفی فخر احمد لیلا دهقانی

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۴ بهار ۱۳۹۸ شماره ۳ (پیاپی ۹۷) 1235-1264

کلید واژه ها: سازماندهی دانش بازیابی اطلاعات چهریزه تحلیل چهریزه ای مرور سیستماتیک

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۶۰۴ تعداد دانلود : ۴۵۴

رویکرد تحلیل چهریزه ای از اوایل قرن بیستم تاکنون روند رشد مستمری داشته است. هدف این مقاله مرور سیستماتیک پژوهش ها و مستندات طرح های سازماندهی چهریزه ای و نیز تقسیم بندی موضوعی و زمانی این مطالعات است. با مرور صورت گرفته، روند رشد و توسعه کاربردهای این رویکرد در ابزارهای سازماندهی و بازیابی اطلاعات شناسایی و پیشنهاداتی برای پژوهشگران آینده ارائه گردید. برای این منظور در گام اول، جست وجوی جامع در منابع و بررسی اولیه اسناد؛ در گام دوم، طبقه بندی و پالایش اسناد؛ و در گام سوم، طبقه بندی زمانی و موضوعی اسناد و تحلیل متون و شناسایی شکاف های موجود و در نهایت، پیشنهاداتی برای پوشش این شکاف ها صورت گرفت. حاصل تلاش های انجام شده قبلی، توسعه رده بندی های چهریزه ای، اصطلاحنامه ها و سرعنوان های چهریزه ای و نظام های بازیابی اطلاعات چهریزه ای بود که به طوری گسترده تا دهه 1990 میلادی ادامه داشت؛ اما بعد از آن با توسعه سیستم های کامپیوتری و وب، چهریزه ها نقش دیگری در بازیابی اطلاعات در پایگاه داده بر عهده گرفتند. در این دوره مجموعه ای از مدل ها، فراداده های چهریزه ای، رابط های کاربری چهریزه ای و آنتولوژی های چهریزه ای شکل گرفت و نرم افزارهای متعددی در این زمینه توسعه یافت. رویکرد تحلیل چهریزه ای از حدود اوایل قرن بیستم تا سال 1990 میلادی بر مبنای نظام منطقی (پیشینی) طبقه بندی علوم پیش رفته است. اما از آن سال به بعد، به دلیل گسترش توانایی های کامپیوتری و رشد نیازهای کاربران، دیدگاه منطقی جای خود را به دیدگاه محاسباتی و کاربرمدار (پسینی) سپرد. ایجاد ساختار چهریزه ها در محیط وب معنایی و ایجاد استانداردهای جدید، بهره برداری از روش های مؤثرتر درک رفتار کاربران و توجه به توسعه و تحول تاریخی علم، شکاف هایی است که هنوز نیاز به مطالعه و بررسی بیشتر دارد. پوشش این شکاف ها، تأثیر پایدار فرایند تحلیل چهریزه در آینده را نوید می دهد.

۲.

استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهش های صورت گرفته)(مقاله علمی وزارت علوم)

نویسنده: عاطفه کلانتری عبدالرسول جوکار سید مصطفی فخر احمد جواد عباسپور هاجر ستوده مسعود مرتضوی نصرآباد امیر جوادی زهرا پوربهمن

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۶ زمستان ۱۳۹۹ شماره ۲ (پیاپی ۱۰۴) 563-592

کلید واژه ها: استخراج کلمات کلیدی استخراج عبارات کلیدی پردازش زبان طبیعی زبان فارسی بررسی مروری

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۵۵۰ تعداد دانلود : ۴۳۸

استخراج کلمات/ عبارات کلیدی متن، پیش نیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان می دهد، تلاش های انگشت شماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورت گرفته است. لذا، این مقاله، با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی و به طور خاص استخراج کلمات/ عبارات کلیدی از متون فارسی، به مرور خلاصه ای از مقالات فارسی و انگلیسی منتشر شده در این حوزه که از متون فارسی برای آزمودن ایده هایشان استفاده کرده اند ، می پردازد؛ سپس هر مقاله را از نظر روش شناسی، نحوه اجرا و پیاده سا زی، روش ارزیابی و معیارهای آن مورد تعمق قرار داده و به چالش می کشد . در مجموع 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداخته اند . روش بیشتر این مقالات، استفاده از اطلاعات آماری و زبان شناختی بوده است. اکثر این مقالات یا در روش شناسی انتخاب شده ایراد دارند و یا نویسندگان نتوانسته اند ایده پیشنهادی شان را به وضوح برای خواننده تبیین نمایند. در بسیاری از مقالات، از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است . در مجموع، به جز 3 مقاله که روش اجرا شده را به نحو نسبتاً قابل قبولی گزارش کرده اند ، سایر مقالات قابلیت تکرار پذیری و تعمیم ندارند. لذا نمی توان از آن ها به عنوان معیار پایه ای برای ارزیابی سیستم های آینده استفاده کرد یا از ایده مطرح شده در آن ها با اطمینان در ساخت و توسعه نرم افزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود .

۳.

خودکارسازی پیشنهاد داور برای دست نوشته ها: مرور نظام مند متون پژوهشی(مقاله علمی وزارت علوم)

نویسنده: سمیه پاک نهاد عبدالرسول جوکار مهدیه میرزابیگی هاجر ستوده سید مصطفی فخر احمد

منبع: تحقیقات اطلاع رسانی و کتابخانه های عمومی دوره ۲۵ پاییز ۱۳۹۸ شماره ۳ (پیاپی ۹۸) 457-482

کلید واژه ها: پیشنهاد داور سامانۀ خبره یابی مرور نظام مند

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۵۴۰ تعداد دانلود : ۳۹۶

هدف: در این پژوهش با مرور نظام مند پژوهش های حوزۀ خودکارسازی پیشنهاد داور برای مقالات در سامانۀ مجلات علمی به شناسایی وضعیت پژوهش های این حوزه ازنظر انواع شواهد خبرگی، انواع مدل های بازیابی مورداستفاده، شکاف پژوهشی موجود پرداخته شده، و درپایان پیشنهادهایی برای پژوهش های آتی ارائه شده است. روش : در پژوهش حاضر، از چارچوب مطالعۀ نظام مند کیچن هام و چارترز (2007) استفاده شده است. جستجو در پایگاه های اطلاعات علمی فارسی و انگلیسی با کلیدواژه های مرتبط انجام و تعداد 50 منبع به زبان انگلیسی در بازۀ زمانی 1992 تا 2018 یافت شد. پس از اعمال پالایش اولیۀ معیارهای ورود و خروج از مطالعه و کنترل توسط متخصصان، تعداد 43 منبع انگلیسی برای ورود به مرور نظام مند انتخاب شدند. سپس با طراحی کاربرگی، استخراج اطلاعات از منابع صورت گرفت. یافته ها: مرور پژوهش ها نشان داد شواهد خبرگی نامزد در مطالعات حوزۀ خودکارسازی پیشنهاد داور برای مقالات ، شامل چهار منبع «اطلاعات خود-توصیفی نامزد داوری» (5 پژوهش)، «مستندات ایجادشده توسط نامزد داوری» (26 پژوهش)، «شبکه های همکاری و روابط علمی نامزد داوری» (2 پژوهش)، و «منابع ترکیبی» (7 پژوهش) هستند و روش روابط علمی و منابع ترکیبی نسبت به دو روش دیگر متأخرتر هستند. همچنین، مدل های بازیابی اطلاعات مورداستفاده در سامانه های خبره یابی داور شامل مدل بولی، مدل بولی بسط یافته، مدل فازی، مدل برداری، مدل احتمالاتی، نمایه سازی معنای نهان، مدل تخصیص معنای نهان و مدل نویسنده- موضوع هستند. شکاف های پژوهشی موجود در این حوزه نیز «عدم توجه به طراحی سامانۀ خبره یابی داور در نشریات و کنفرانس های داخلی»، «عدم توجه به منابع دانشی» و «عدم توجه به دیدگاه کاربران در طراحی سامانه های موجود» است. اصالت/ارزش: با مرور پژوهش های حوزۀ خودکارسازی پیشنهاد داور، یافته های این حوزه ازنظر شواهد خبرگی داوری و مدل های به کاررفته دسته بندی و خلاصه شد. این پژوهش تصویری کلی نسبت به آنچه انجام شده و آنچه بهتر است در طراحی سامانه های بعدی درنظر گرفته شود به پژوهشگران ارائه می دهد.

۴.

بافتار استنادهای مقاله های علم اطلاعات(مقاله علمی وزارت علوم)

نویسنده: پگاه تاجر سید مصطفی فخر احمد عبدالرسول جوکار علیرضا خرمایی هاجر ستوده

منبع: مطالعات ملی کتابداری و سازماندهی اطلاعات دوره ۳۰ پاییز ۱۳۹۸ شماره ۳ (پیاپی ۱۱۹) 24 - 44

کلید واژه ها: طبقه بندی استناد تحلیل فراگفتار تحلیل بافتار استناد علم اطلاعات الگوی هایلند

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۵۲۷ تعداد دانلود : ۴۵۶

هدف : شناسایی، طبقه بندی، و تحلیل بافتارهای استنادی مقالات علم اطلاعات و انواع استنادها با رویکرد فراگفتار هایلند. روش شناسی : این پژوهش در دو مرحله «شناسایی طبقه استناد» (Jurgens et al., 2016) و «تحلیل مبتنی بر فراگفتار کارکرد شناسایی شده» (Hyland, 2005) انجام شده است. 164 بافتار استنادی مقالات استناد کننده به 10 مقاله به زبان انگلیسی (مجموعاً شامل 656 جمله استنادی صریح و ضمنی) بررسی شده است. یافته ها : استنادها از نظر فراگفتار در 2 طبقه اصلی استناد های «تعاملی- هدایتی» و «تعاملی- مشارکتی» با 4 طبقه فرعی در سطح دوم، 14 طبقه فرعی تر در سطح سوم و 23 طبقه فرعی تر در سطح چهارم دسته بندی شد. استنادهای شناسایی شده بیشتر از نوع تعاملی- هدایتی بود و نه تعاملی- مشارکتی. طبقات درک شده نیز بیشتر توصیفی بودند و نه تحلیلی و نقدگونه. نتیجه گیری: شباهت طبقه بندی استنادهای این مطالعه با طرح های موجود تا سطح سوم است و اغلب نیز با طبقات استنادهای تعاملی- هدایتی اشتراکاتی دارند. به نظر می رسد انواع استنادهای تعاملی- مشارکتی شناسایی شده بتواند در پالایش بافتارهای استنادی در سامانه های بازیابی اطلاعات متون علمی و در ارزیابی کیفی تأثیرگذاری پژوهش ها یاری رسان باشد.

۵.

سنجش شباهت نظرات داوری آزاد و محتوای مقالات علمی به روش پردازش زبان طبیعی(مقاله علمی وزارت علوم)

نویسنده: کیانوش رشیدی هاجر ستوده مهدیه میرزابیگی سید مصطفی فخر احمد

منبع: مطالعات ملی کتابداری و سازماندهی اطلاعات دوره ۳۱ تابستان ۱۳۹۹ شماره ۲ (پیاپی ۱۲۲) 86 - 103

کلید واژه ها: نظرات کاربران داوری آزاد پردازش زبان طبیعی شباهت منحنی تحلیل عملکرد سامانه

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۴۹۷ تعداد دانلود : ۵۴۱

هدف : شناسایی قابلیت داوری های آزاد در بازشناخت مقالات پزشکی براساس شباهت آنها به مقالات مربوط. روش شناسی: آزمونی متشکل از 2212 مقاله اف هزار ریسرچ و نظر ات داوری آنها ساخته شد. 100 مقاله به عنوان مدرک پایه به صورت تصادفی انتخاب شد. شباهت نظرات داوری و محتواهای مدارک براساس سنجه شباهت کسینوسی مقادیر <span lang="X-NONE" dir="LTR">TF-IDF در سطح تک واژه ها و دوواژه ها محاسبه شد. شباهت محتوا و نظرات با تحلیل همبستگی اسپیرمن تحلیل شد. صحت پیش بینی شباهت محتوای مقالات براساس شباهت نظرات دریافت شده به کمک منحنی مشخصه عملکرد سامانه آزمون شد. یافته ها : توان نظرات داوران در بازشناخت مقالات مشابه تأیید شد. میان محتوا و نظرات، همبستگی معنادار وجود دارد. منحنی های تحلیل عملکرد سامانه نیز نشان داد شباهت نظرات داوری، خواه در سطح تک واژه ها و خواه دوواژه ای ها توانایی شناسایی مقالات با محتوای مشابه را دارد. نتیجه گیری : اعتبار نظرات داوران ریشه در توان تخصصی و شناختی آنان دارد. بنابراین، نظرات می توانند در شبکه مدارک، در زمره منابع مرتبط اثربخش در بازشناخت مدارک به شمار آیند. این یافته راه را برای پژوهش در کاربرد نظرات کاربران در حوزه های بازیابی، ارزیابی، یا طبقه بندی متون هموار می کند که شباهت محتوایی در آنها اهمیت دارد.

۶.

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال یاب رایسست: مطالعه موردی حوزه فنی و مهندسی(مقاله علمی وزارت علوم)

نویسنده: نرجس ورع مهدیه میرزابیگی هاجر ستوده سید مصطفی فخر احمد نیلوفر مظفری

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۷ تابستان ۱۴۰۱ شماره ۴ (پیاپی ۱۱۰) ۱۳۱۸-۱۲۹۳

کلید واژه ها: اثربخشی سامانه پیشنهاددهنده نشریه کمبود داده پراکندگی داده سامانه ژورنال یاب رایسست

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۴۲۳ تعداد دانلود : ۱۵۴

عوامل متعددی از مجموعه عناصر تشکیل دهنده سامانه های پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است. بدین منظور بیش از ۱۵۰۰۰ مقاله از نشریه های فنی و مهندسی در بازه زمانی ۱۳۹۲ تا ۱۳۹۶ از وب سایت نشریه ها گرداوری شد. در مرحله بعد عناصر متنی این مقاله ها شامل عنوان، چکیده و واژه های کلیدی استخراج، نرمال سازی و پردازش شد و پایگاه داده پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله های گردآوری شده، با استفاده از فرمول کوکران تعداد ۴۰۰ مقاله پایه که پیش از این در نشریه های مرتبط با موضوع منتشر شده بودند، به روش تصادفی- تناسبی، انتخاب شد. عنوان و چکیده این مقاله ها، به منظور دریافت نشریه های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به عنوان پرسمان وارد سامانه شد. سپس نتایج پیشنهادی در هر مرحله در قالب فایل اکسل ذخیره گردید. در نهایت میزان اثربخشی نتایج سامانه در هر مرحله، به روش اعتبارسنجی یک طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده ها نشان داد در وضعیت موجود، نشریه هدف تنها در ۲۶ درصد از پرسمان ها در ۳ رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی سازی، نرمال سازی و پردازش داده ها اثربخشی نتایج در ۳ رتبه نخست به میزان ۱۵ درصد افزایش یافت. اما همچنان در بیش از ۳۰ درصد پرسمان ها، نشریه هدف در رتبه ۱۰ و بالاتر پیشنهاد شده بود. بنابراین در مرحله بعد به منظور بهبود چالش پراکندگی، دسته بندی موضوعی داده ها انجام و افزایش ۳۰ درصدی اثربخشی نتایج نسبت به مرحله پیشین در ۳ رتبه نخست حاصل گردید. بر این اساس یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست می گردد، کمبود و پراکندگی داده ها است؛ که با غنی سازی پایگاه داده، بهبود فرآیند پردازش و دسته بندی موضوعی داده ها می توان به میزان قابل توجهی با این دو چالش مقابله و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.

۷.

تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصه سازی خودکار استناد مدار: پیشنهاد طرح حاشیه نویسی بافتارهای استنادی(مقاله علمی وزارت علوم)

نویسنده: پگاه تاجر عبدالرسول جوکار سید مصطفی فخر احمد هاجر ستوده علیرضا خرمایی

منبع: کتابداری و اطلاع رسانی دوره بیست و دوم پاییز ۱۳۹۸ شماره ۳ (پیاپی ۸۷) 91 - 111

کلید واژه ها: فراگفتمان هایلند بافتارهای استنادی خلاصه سازی استنادمدار طرح حاشیه نویسی متون علمی

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۳۴۰ تعداد دانلود : ۳۴۴

هدف: هدف مقاله حاضر، تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصه سازی خودکار استنادمدار متون علمی و پیشنهاد یک طرح حاشیه نویسی فراگفتمان مدار برای بافتارهای استنادی به منظور به کار گیری در خلاصه سازی استنادمدار می باشد. روش شناسی: روش شناسی این پژوهش از نوع کتابخانه ای است و پاسخ دهی به سؤالات پژوهش، از طریق مطالعه و تحلیل منابع مربوط به الگوی فراگفتمان هایلند، خلاصه سازی خودکار متون علمی، تحلیل بافتارهای استناد و طبقه بندی کارکردهای استناددهی انجام شده است. یافته ها: فراگفتمان تعاملی هایلند برای نشان دادن چشم انداز نویسنده نسبت به اطلاعات گزاره ای و خواننده به کار می رود، از ابزارهای زبانی مناسب ژانر نقد بهره می برد و برای تحلیل بافتارهای استنادی مناسب است. بنابراین، طرح حاشیه نویسی فراگفتمان مدار بافتارهای استنادی بر اساس تردیدنما، یقین نما، نگرش نما، خوداظهارها و دخیل سازها که از مؤلفه های اصلی فراگفتمان تعاملی - مشارکتی هایلند هستند، پیشنهاد شد. این طرح شامل 70 طبقه می باشد. نتیجه گیری: از فراگفتمان تعاملی هایلند می توان برای ساخت پیکره مناسب جهت خلاصه سازی خودکار استنادمدار بهره گرفت و مراحل ایجاد رده بند های مورد نیاز فرآیند خلاصه سازی، پالایش بافتارهای استنادی و انتخاب جملات برای درج در خلاصه نهایی را بر اساس آن انجام داد. حاشیه نویسی پیکره ها عموماً بر اساس یک طرح حاشیه نویسی انجام می شود. بنابراین، طرح پیشنهاد شده می تواند مفید واقع شود. با توجه به این که طرح حاشیه نویسی پیشنهاد شده مبتنی بر نظریات موجود است، لازم است در به کارگیری آن، از حاشیه نویسان خواسته شود تا در حین برچسب زنی، هر برچسب دیگری غیر از موارد مطرح شده در طرح را که به ذهنشان می رسد با ذکر دلیل، یادداشت نمایند تا در صورت احراز توافق مطلوب به طرح اضافه گردد.

۸.

ارائه روشی نوین برای استخراج خودکار چهریزه ها در جستجوهای چهریزه ای (مورد مطالعه: حوزه زنان و زایمان)(مقاله علمی وزارت علوم)

نویسنده: عبدالحسین فرج پهلو فریده عصاره سید مصطفی فخر احمد لیلا دهقانی

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۷ بهار ۱۴۰۱ شماره ۳ (پیاپی ۱۰۹) ۸۳۸-۸۰۷

کلید واژه ها: بازیابی اطلاعات چهریزه جستجوی چهریزه ای استخراج خودکار چهریزه.

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۲۸۸ تعداد دانلود : ۱۴۳

هدف این پژوهش ابداع و معرفی الگوریتمی نو برای استخراج چهریزه هاست که امکان شناسایی تجربی چهریزه ها را با کمک پشتوانه انتشاراتی فراهم می کند. الگوریتم پیشنهادی بر مبنای دو ایده شکل گرفته است: ایده اول اینکه چهریزه در بافت بروز پیدا می کند. بنابراین، برای تشخیص چهریزه در یک بدنه متنی بایستی بافت یا بستر آن مورد بررسی قرار گیرد و ایده دوم این است که چهریزه نقطه تمرکز در یک درخت واژگانی است که نه بسیار عام و نه بسیار خاص است. در حوزه پزشکی، دامنه زنان و زایمان به عنوان بستر آزمون انتخاب گردید. سه پیکره متنی از درون پشتوانه انتشاراتی انتخاب شد. پیکره بستر، از چکیده و عنوان مجموعه مقالات موجود در ۲۰ مجله برتر حوزه انتخاب شد که در برگیرنده ۱۶۷۰۷۱ سند بود. پیکره دوم، پیکره منشأ بود که ۲۰۰۰ مقاله به صورت تصادفی از پیکره بستر انتخاب شد. پیکره سوم، پیکره واژگانی است که با استفاده از یک سرویس تحت وب و معیار رتبه بندی واژگان LIDF-value استخراج گردید. خروجی حاصل دربرگیرنده ۵۱۴ واژه بود. واژگان تکراری حذف شدند و سرانجام، ۴۸۰ واژه مهم شناسایی شد. سپس، واژگان در پیکره بستر با کمک مجموعه راهنما یعنی «مش» بسط داده شد و پس از آن، بر اساس دو شرط انتقال مبتنی بر تکرار یعنی بیشتر بودن اسناد مرتبط با واژه در بستر نسبت به منشأ و انتقال مبتنی بر رتبه یعنی رشد رتبه موجود واژه در پیکره بستر نسبت به منشأ که نشان دهنده عام شدن واژه است، چهریزه های کاندید استخراج شدند. سرانجام، با استفاده از سه قاعده اخص بودن، جایگزنی و اعم بودن، چهریزه های شناسایی شده اصلاح و نام گذاری شدند. در نهایت، ۲۶ چهریزه به عنوان چهریزه های حوزه زنان و زایمان شناسایی شدند. با مقایسه الگوریتم پیشنهادی با دیگر الگوریتم ها مشخص شد که ایجاد سه افراز (افراز منشأ و بدنه متنی و افراز برای شناسایی واژگان مهم) و مقایسه رفتار واژه در آن ها و سپس، ایجاد درخت بر اساس چهریزه های کاندید، یعنی ترکیب رویکرد آماری و هرس درخت می تواند نتایج مناسب تری نسبت به رویکرد صرفاً آماری یا هرس درخت داشته است. همچنین، مقایسه چهریزه های خروجی از الگوریتم و چهریزه های سنتی در این زمینه نشان داد که چهریزه های خروجی الگوریتم، خرد تر و برای مرور در ابزارهای بازیابی اطلاعات مفید تر هستند. همچنین، در این پژوهش مشخص شد که چهریزه های دامنه تخصصی از چهریزه های عمومی در حوزه پزشکی متفاوت است و مستقل از آن ها قابل شناسایی و تعریف است، اما نمی توان نتایج را به تمامی دامنه های پزشکی تعمیم داد و نیاز است که پژوهش هایی در دیگر حوزه ها صورت گیرد.

۹.

تحلیل سنجه های استنادمحور برای تعیین میزان ربط مقاله ها(مقاله علمی وزارت علوم)

نویسنده: مرضیه گل تاجی جواد عباسپور عبدالرسول جوکار سید مصطفی فخر احمد علیرضا نیک سرشت

منبع: مطالعات ملی کتابداری و سازماندهی اطلاعات دوره ۳۲ پاییز ۱۴۰۰ شماره ۳ (پیاپی ۱۲۷) 56 - 76

کلید واژه ها: ربط مقاله ها هم استنادی زوج کتاب شناختی امسلر پیج رنک هیتس سنجه های استنادمحور

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۲۴۸ تعداد دانلود : ۱۴۰

هدف: شناخت توانایی سنجه های استنادمحور (هم استنادی، زوج کتاب شناختی، امسلر، پیج رنک و هیتس(اعتبار و کانون)) برای تعیین میزان ربط مقاله ها با یکدیگر. روش: پژوهش حاضر از نظر هدف، کاربردی و از لحاظ شیوه گردآوری داده ها، پژوهشی توصیفی از نوع همبستگی است. جامعه آماری، مجموعه مقالات موجود در زیرمجموعه دسترسی آزاد پاب مد سنترال مجموعه آزمون سایترک بود که بر اساس سه سنجه هم استنادی، زوج کتاب شناختی و امسلر با سایر مقالات رابطه استنادی داشتند. از میان 26262 مقاله، 30 مقاله به عنوان مقالات پایه انتخاب شد و مقالات مرتبط با هر یک از آن ها بر اساس سنجه ربط مش بازیابی گردید؛ هر یک از سنجه های استنادمحور متغیر مستقل و سنجه ربط مش متغیر وابسته بود. با استفاده از نرم افزار شبیه ساز ومپ سرور و پی.اچ.پی.مای ادمین یک پایگاه مای. اس. کیو.ال ایجاد شد؛ سپس، با مطالعه کلیه کدهای مورد نیاز از بسته کد منبع سایترک، کدهای لازم با اعمال تغییرات ضروری، اجرا و نتایج حاصل در پایگاه مای. اس. کیو.ال وارد شد. با نوشتن پرس وجو به زبان اس. کیو.ال، شبکه استنادی مجموعه به صورت کامل استخراج شد سپس با کدنویسی به زبان پایتون اعداد مربوط به پیج رنک و هیتس (اعتبار و کانون) به صورت جداگانه محاسبه گردید. یافته ها: نتایج نشان داد تمامی شش سنجه در سطح یک صدم همبستگی معنادار و مثبت با میزان ربط مقاله ها داشت؛ به عبارت دیگر، با افزایش مقادیر هریک از سنجه ها، درجه ربط مقاله ها نیز افزایش یافت. بیشترین میزان همبستگی مربوط به سنجه امسلر و پس از آن، زوج کتاب شناختی بود. پس از سنجه ها ی امسلر و زوج کتاب شناختی، بیشترین همبستگی میان متغیر هیتس(اعتبار) با ربط مقاله ها بود. متغیر پیج رنک در مرتبه چهارم قرار داشت؛ در نهایت، کم ترین میزان همبستگی با ربط مقاله ها، مربوط به سنجه های هم استنادی و هیتس( کانون) بود؛ بنابراین، از میان سنجه های استنادی بررسی شده در این پژوهش، سنجه های امسلر، زوج کتاب شناختی، هیتس(اعتبار) و پیج رنک بیش از سایر سنجه ها از پتانسیل لازم برای تعیین میزان ربط مقاله ها برخوردار بودند. نتیجه گیری: بر اساس یافته های پژوهش می توان گفت سنجه های استنادمحور مطالعه شده قادرند درجه ربط مقاله ها را برآورد کنند و در بافتارهای مختلف بازیابی اطلاعات شامل موتورهای جست وجو، پایگاه های اطلاعاتی و استنادی، سامانه های پیشنهاددهنده و حتی کتابخانه های دیجیتالی برای دسترسی به مقالات مرتبط، پیشنهاد مقالات مشابه و رتبه بندی نتایج بازیابی کاربرد داشته باشند؛ همچنین، لازم است به سنجه امسلر که نسبت به دو سنجه سنتی هم استنادی و زوج کتاب شناختی، در سامانه های اطلاعاتی کمتر استفاده شده است، بیش از پیش توجه شود؛ از طرفی، علیرغم اینکه سنجه هم استنادی در برخی از پایگاه ها و سامانه های بازیابی اطلاعات بین المللی( مانند ساینس دایرکت و سایت سیر) برای بازیابی مدارک مرتبط و پیشنهاد مدارک مشابه استفاده می شود در مقایسه با سایر سنجه ها از کارایی کمتری برخودار است.

۱۰.

ارتقا و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با به کارگیری ویژگی های خط فارسی و الگوریتم انتقال فضا(مقاله علمی وزارت علوم)

نویسنده: آرش زارعیان طیبه موسوی میانگاه بلقیس روشن سید مصطفی فخر احمد

منبع: جستارهای زبانی دوره چهاردهم خرداد و تیر ۱۴۰۲ شماره ۲ (پیاپی ۷۴) ۴۰۰-۳۶۳

تعداد بازدید : ۶۱ تعداد دانلود : ۷۰

از آنجا که فن آوری بازشناسی نوری حروف اصالتاً بر پایه ویژگی های خطی لاتین بنا شده است، تقریباً کلیه الگوریتم ها و مراحل مورد استفاده در نظام های رایج بازشناسی حروف فارسی نیز بر اساس همان ساختار و ویژگی های خطوط لاتین گسترش یافته اند. بکارگیری ابزار و ویژگی های خطوط لاتین در طراحی نظام های فارسی محور، نه تنها در نهایت به انجام بازشناسی صحیح حروف فارسی منجر نگردیده است، بلکه باعث سردرگمی همزمان نرم افزار و کاربر فارسی زبان نیز شده است. از اینرو، در اینجا، پس از مقدمه ای کوتاه پیرامون اهمیت خط و زبان در حوزه فن آوری اطلاعات به سیر تحول خط فارسی در دوره های مختلف و شرح ویژگی های این خط و تفاوت های آن با خطوط دیگر پرداخته شده است و عناصر شکلی این خط، با توجه به کاربرد و اهمیت آنها در تعامل کاربر با نرم افزارهای بازشناسی نوری متون فارسی، طیقه بندی گردیده است. در این بخش، با توصیف و تحلیل مراحل بازشناسی حروف بر اساس ویژگی های خط فارسی و شرح تفاوتهای آن با گونه های لاتین محور موجود، چهره ای متفاوت از دستگاه خط فارسی به هنگام کار با رایانه ها و به ویژه در سیستم های بازشناسی نوری حروف عرضه می شود بطوری که مخاطب عملاً قابلیت و ظرفیت های دستگاه خط فارسی در هماوردی با دستگاه ساده خط لاتین را مشاهده خواهد نمود. با اتکا به همین ویژگی ها، در جهت ارتقاء و اصلاح الگوریتم های رایج در بازشناسی نوری حروف فارسی، تسهیل بکارگیری الگوها، و تعدیل حجم پایگاه داده ها، از فرایند انتقال هندسی فضای دو بعدی به تک بعدی نیز بهره جسته ایم.

سید مصطفی فخر احمد

مطالب
ترتیب بر اساس: جدیدترین پربازدید‌ترین

روند رشد رویکرد تحلیل چهریزه ای در سازماندهی دانش: مروری صد ساله(مقاله علمی وزارت علوم)

استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهش های صورت گرفته)(مقاله علمی وزارت علوم)

خودکارسازی پیشنهاد داور برای دست نوشته ها: مرور نظام مند متون پژوهشی(مقاله علمی وزارت علوم)

بافتار استنادهای مقاله های علم اطلاعات(مقاله علمی وزارت علوم)

سنجش شباهت نظرات داوری آزاد و محتوای مقالات علمی به روش پردازش زبان طبیعی(مقاله علمی وزارت علوم)

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال یاب رایسست: مطالعه موردی حوزه فنی و مهندسی(مقاله علمی وزارت علوم)

تحلیل کاربرد الگوی فراگفتمان هایلند در خلاصه سازی خودکار استناد مدار: پیشنهاد طرح حاشیه نویسی بافتارهای استنادی(مقاله علمی وزارت علوم)

ارائه روشی نوین برای استخراج خودکار چهریزه ها در جستجوهای چهریزه ای (مورد مطالعه: حوزه زنان و زایمان)(مقاله علمی وزارت علوم)

تحلیل سنجه های استنادمحور برای تعیین میزان ربط مقاله ها(مقاله علمی وزارت علوم)

ارتقا و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با به کارگیری ویژگی های خط فارسی و الگوریتم انتقال فضا(مقاله علمی وزارت علوم)

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

سید مصطفی فخر احمد

مطالب ترتیب بر اساس: جدیدترینپربازدید‌ترین

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

مطالب
ترتیب بر اساس: جدیدترین پربازدید‌ترین