نمایه سازی ماشینی

قرن حاضر را عصر انفجار اطلاعات نامیده اند. عصری که با افزایش سریع تعداد مدارک و توسعه رشته های علمی مواجه هستیم. عصری که گردآوری، ذخیره ، بازیابی و اشاعه اطلاعات به شدت تغییر یافته است. رشد و فزونی دستاوردهای علمی و فنی و افزایش متون و مدارک پژوهشی و کاهش زمان جهت بازیابی اطلاعات مورد نظر و دستیابی به مطالب روزآمدتر اهمیت نمایه سازی را روشن تر می سازد و این امر در راستای بهبود ارائه خدمات به کاربراست. درواقع نمایه سازی حلقه ارتباطی میان تولید کننده و مصرف کننده اطلاعات ، درجهت دستیابی آسان و سریع به دانش مورد نیاز کاربردی وسیع و اهمیتی ویژه می یابد.در دانشنامه کتابداری واطلاع رسانی نمایه چنین تعریف شده است: صورتی از موضوعها و واژه های مهم ودیگر مطالب یک یا چند کتاب با ارجاع به صفحاتی که این مطالب در آنها آمده است.(۳) راولی نمایه را یک رشته محلهای دستیابی سازمان یافته که استفاده کننده را از اطلاعات معلوم به اطلاعات اضافی ناشناخته راهنمایی می کند تعریف می کند.(۲) نمایه عبارتست از مجموعه شناسه های الفبایی یا نظام یافته ای که کاربر رابه جایگاه اطلاعات درون مدرک هدایت می کند.

فرایند تهیه نمایه برای یک اثر یا تحلیل محتوای اطلاعاتی یک اثر به منظوراستخراج نمایه واژه ها با شیوه ای نظام مندو موثر را نمایه سازی گویند. نمایه سازی ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از روشهای گوناگون به منظور سازمان دادن اطلاعات به قصد سهولت بازیابی می باشد. نمایه سازی یکی از رهیافت های سازماندهی مواد در علم کتابداری واطلاع رسانی است که از دهه ۵۰ و ۶۰ میلادی قرن جاری روشهای آن تکامل یافته است . با حضور کامپیوتر روش های نمایه سازی دچار تحول گردیده و در حال حاضر نمایه سازی های از طریق کامپیوتر و نرم افزارهای توسعه یافته در این زمینه انجام می شود که به آن نمایه سازی ماشینی گویند. به طور کلی کاربرد کامپیوتر درنمایه سازی را به دو دسته تقسیم می کنند: نمایه سازی رایانه ای و نمایه سازی با کمک رایانه.

نمایه سازی رایانه ای:

تعریف نمایه سازی ماشینی: نمایه سازی کامپیوتری، رایانه ای ، ماشینی و خودکار همگی با هم مترادفند و بجای یکدیگر به کار می روند و تعریف آنها عبارتست از انتخاب واژه های کلیدی یک اثر بوسیله روش های ماشینی به منظور گسترش شناسه های نمایه با استفاده از کامپیوتر برای بیرون آوردن ونشان دادن واژه های نمایه بدون دخالت انسان در حالی که یک بار برنامه و سیاست کارآن به ماشین داده شده است.(۳)انجام کلیه مراحل نمایه سازی کتاب اعم از انتخاب واستخراج اصطلاحات نمایه ای ازمتن ، مدخل آرایی و ارائه جاینماهای هر مدخل و چاپ نمایه توسط رایانه وبدون دخالت انسان را نمایه سازی رایانه ای گویند.(۷)

نمایه سازی مراحل کنترل اصطلاحات تخصصی، تعین توصیفگرها و هماهنگی بین این توصیفگرها راداراست. هنگامیکه توصیفگرها توسط نمایه ساز انتخاب می شوند از نمایه سازی دستی سخن به میان می آید و اگر این کار را کامپیوتر انجام دهد، نمایه سازی خودکار یا ماشینی نامیده می شود. جهت استفاده از روش نمایه سازی ماشینی داده ها باید به صورت ماشین خوان درآیند. اینکه واژگان از کدام محدوده متن انتخاب شوند به نرم افزار به کارگرفته شده بستگی دارد.(۸)در این نوع نمایه سازی همه امور از انتخاب کلید واژه، شماره گذاری ، ترتیب بندی و غیره توسط کامپیوتر انجام می گیرد. کامپیوتر مفاهیم مهم را که بارها تکرار شده اند و جزو کلمات غیر موضوعی زبان نیستند، به علاوه اسمهای اشخاص، مکانها وغیره رابه عنوان کلید واژه در نظر می گیرد.کامپیوتر مفاهیم مهم را توسط یک نرم افزار به نام نرم افزار بسامدی استخراج می کند. مثلایک مفهوم که در ذیل یک بخش ازمتن بارها تکرارشده باشند، محتملا کلید وا ژه است، مگر آن که جزو واژگان غیر موضوعی باشد. واژگان غیر موضوعی مانند(است، که ، را و...) توسط یک فهرست به نام فهرست ایستی مشخص و نادیده گرفته می شود. قسمت دیگر نرم افزار یک دادگان حاوی اسمهای خاص است. نرم افزار با استفاده از این دادگان ، اسمهای خاص متن را تشخیص می دهد و به عنوان کلید واژه در نظر می گیرد.نمایه سازانی که با اصول تحلیل و طراحی سیستم و برنامه سازی کاربردی آشنایی دارند، می توانند در زمینه کامپیوتری سازی نمایه سازی موثر باشند.

طرح های موفقی که دراجرای نمایه سازی ماشینی ارائه گردیده عبارتند از:

کتابخانه ملی پزشکی در آمریکا.AIMS طرح که توسط زیمنس اجراشد.COPSY و طرح LISA طرح طرح دانشکده پزشکی هاروارد: سیستمی برای یکی سیستم بازیابی هوشمند اطلاعات در مدارک بیولوژی و پزشکی بر پایه روش های آماری و زبان شناختی.

نمایه سازی رایانه ای عمدتا به دوشیوه زیرا نجام می شود:

الف) حفظ اصطلاح:

این شیوه توسط دکتر سوزان آرتاندی در سال ۱۹۶۳ به کار گرفته شد. در نمایه سازی به شیوه حفظ اصطلاح یک تعریف عملیاتی از اصطلاحات نمایه ای لازم و ضروری است تا رایانه بتواند راهنمایی برای انتخاب موضوعهای مدرک تهیه کند، علاوه براین باید برنامه یا مجموعه برنامه های سازگار با این شیوه ساخته شود. در نظام حفظ اصطلاح سیاهه یا فهرستی به رایانه داده می شود که حاوی کلمات کلیدی است و به نظام گفته می شود، هریک از کلمات این لیست را که درمتن بود ،حفظ کند و آنرا به عنوان اصطلاح نمایه ای انتخاب کند. دراین روش استفاده از اصطلاحات از پیش انتخاب شده راهنمای خوب ومفیدی است و امکان انتخاب واژه های استفاده شده به وسیله مولف مدرک را فراهم می کند. نقطه ضعف این روش این است که تضمینی وجود ندارد تا تمامی مفاهیم موضوعات جدید ومهم نمایه سازی شوند.

ب) حذف اصطلاح:

درشیوه حذف اصطلاح یک سیاهه بازدارنده به رایانه داده می شود که کلمات فهرست را هرکجا که بودحذف کند و بقیه را به عنوان کلید واژه انتخاب نماید.نمایه سازی کوئیک و کواک از نوع حذف اصطلاح هستند. در این شیوه آنچه راکه نباید کلیدواژه تلقی شود، حذف می شود.

نمایه سازی کوئیک:

در نمایه سازی کوئیک که همان نمایه درون بافتی است تمام کلمه های موجود درعناوین مدارک راکه توسط برنامه ای به کامپیوتر داده شده ، با سیاهه ای ازواژه های غیرمجاز(واژه های غیرموضوعی که درفهرست ایستی یا بازدارنده قرار می گیردتا درردیف الفبایی خود به عنوان سرشناسه قرار نگیرد) دربرنامه کامپیوتر مطابقت داده می شود.کلمه هایی که درسیاهه واژه های غیرمجاز وجودندارد، بطورخودکارکلیدواژه محسوب می شود. مدخلی که باهریک از این کلیدواژه هادرست می شودبه صورتی است که این واژه را دردرون بافت خود ، یعنی همراه با بقیه کلمه های آن عنوان ، درشکل و نظم طبیعی اش نشان می دهد. این بافت شامل همه واژه ها از جمله واژه های غیر مجاز نیز می شود و به این ترتیب گرچه واژه های غیرمجاز در نمایه نامه مدخل قرار نمیگیرد، اماهمراه با سایر کلمات عنوان، درمدخل می آید تا محیط کلیدواژه و معناومفهوم آن را دقیقتر آشکار سازد و ارتباط میان کلیدواژه های عنوان را بهتر نمایش دهد. به این ترتیب بی درنگ دریافته می شود که عنوان مربوط با نیاز مراجعه کننده مناسبت داردیانه.برون داد رایانه ای می تواند به صورت چاپی دردسترس مراجعان قرارگیرد. (۱)

هرخط نمایه درون بافتی معمولا شامل سه بخش است: کلیدواژه یا مدخل، بافت(متن) ونشانه بازیابی(جاینما). نمایه واژه ها به صورت ستونی درمرکز یا سمت چپ صفحه ویاسمت راست آن(درفارسی) به ترتیب الفبایی می آیدو با همین کلمه هاست که جوینده ، جستجوی خود رادرنمایه آغاز می کند.برای مشخص کردن پایان عنوان، درهرنمایه از علامت قراردادی خاصی نظیرعلامت جمع یا مساوی و یاخط اریب(اسلش/) وغیره استفاده می شود تاجستجوگر بتواند به سهولت ابتدای عنوان را پیدا کرده و عنوان را درشکل طبیعی خود به سرعت مرورکند. از مزایای این نمایه سرعت وسهولت آن می باشد، درضمن به متخصص نمایه سازی نیازی نداردزیرا که با وجود فهرست بازدارنده این کار را کامپیوتر انجام می دهد. ازطرفی کلمه کلیدی درمتن عبارت مورد جستجو قرار دارد و این مسئله به جستجو گر کمک شایانی می کند.

نمایه کواک:

نمایه کواک همان نمایه برون بافتی است. این نمایه برای رهایی از مسائل و مشکلات ناشی از ضرورت کوتاه کردن عنوان و نیز به منظور ساده ساختن خواندن مدخلها طراحی شده است. دراین نمایه هرکلیدواژه به ترتیب از عنوان خود خارج شده و مقدم برسایر اجزای عنوان قرارمی گیرد.سپس عنوان مدرک به ترتیب طبیعی خود و به طور کامل درزیر این واژه یا به دنبال آن می آید. به این ترتیب برای هر واژه مهم یک مدخل ساخته می شود.دراین نمایه نیز کلمات مجاز درمتن عنوان وجود دارد وکلید واژه قرار نمی گیرد.(۱)

نمایه گردان و نمایه چرخشی نمایه هایی هستند که هم خانواده نمایه کوئیک و کوواک می باشند وشرح آنها آورده می شود.

نمایه گردان :

شیوه ای ازنمایه سازی که درآن واژه های مهم عنوان ،مقدمه ، عناوین فصلها، بخشها، چکیده و نتیجه گیری انتخاب می شود و به عنوان شناسه درنظر گرفته می شود.این شیوه اکنون به صورت ماشینی انجام می شود. بدین نحو که واژه های انتخاب شده به منظور الفبایی شدن درمرکز گذاشته می شود و بقیه عبارت در دوطرف آن قرار می گیرد. این شیوه بیشتر برای مدارک فنی استفاده می شود. (۳)

نمایه گردشی :

نمایه ای از مجموعه مدارک ومنابع کتابخانه که برحسب رده بندی چهریزه ای تنظیم شده باشدو درآن شناسه ها برحسب همه کلمات برگزیده و عبارات مهم ، خواه مستقیم یامقلوب انتخاب می شوند و بقیه عناصر که معنی جمله را تکمیل می کنند پشت آن می آید این نمایه شبیه کشف الآیات و کشف الابیات است. (۳)

نمایه سازی با کمک رایانه

دراین نظام نخست نمایه ساز با دقت متن را می خواند، شناسه های موضوعی را انتخاب و علامت گذاری می کند و نمایه دستنویس تهیه می کند. آن گاه اپراتورمدخلها را براساس نمایه دستنویس از طریق صفحه کلید وارد رایانه می کند. بعداز ورود ، رایانه مدخلها را بر اساس نظم خاصی مرتب می کند، توصیفگرها را زیر شنا سه ها می برد، جاینماهای هرمدخل را با هم ادغام می کندو بعد یک نمایه الفبایی ارائه می دهد. در این برنامه هر اصطلاح نمایه ای همراه جاینماهای آن وارد می شودو اگر توصیفگرداشته باشد، پس از شناسه این توصیفگر با یک ممیز آورده می شود. رایانه نیز پس از بررسی مدخل ها بر اساس برنامه از پیش طراحی شده آن مداخل را تنظیم می کند. این نوع نمایه سازی با دوروش متفاوت انجام می شود:

۱) نمایه سازی در محیط گرافیکی (نمایه سازی درون کاشتی)

امروزه بیشتر نرم افزارها در محیط جی. یو. آی یعنی با رابط گرافیکی کار می کنند. Graphic User Interface (GUI)

کاربا این روش به صورت زیراست:

نمایه سازیا ویراستار، پس از اتمام صفحه آرایی و مشخص شدن شماره صفحه های کتاب ، صفحه ها را ازصفحه نمایش کامپیوتر مرور می کندوکلیدواژه ها یا کلمات و عبارتهای مهم را انتخاب می کند. این عبارت انتخاب شده از نظر سیستم یک کلیدواژه محسوب می گردد. نمایه ساز همزمان با انتخاب کردن این کلید واژه ها باید یک پنجره واژه پرداز مستقل دیگر را باز می کندو مدخلهای ارجاعی را که درمورد برخی مدخلها پیش می آیند به طور دستی تحریر می نماید. نتیجه این کار یک فایل فرعی نیز به دست می آید. نمایه ساز فایل اصلی مدخلها وفایل فرعی را ادغام و توسط یک برنامه ترتیب بندی مناسب الفبایی می کند. نمایه ساز این مداخل الفبایی شده را مطالعه می کندو هرگاه به فرایند تبدیل با کاما نیاز باشد فرایند به طوردستی در فایل انجام می دهد سپس برنامه الفبایی کننده شماره صفحه ها را به طور صعودی مرتب می کند. .

۲) نمایه سازی در محیط دستوری ( نمایه سازی فرمانی)

این نرم افزار در محیط سی. ال. آی یعنی با رابط دستوری (فرمانی) کار می کنند: Command Line Interface

کار با این روش مانند سیستم عامل چنین است:

نمایه ساز پس از اتمام صفحه آرایی و مشخص شدن شماره های صفه های کتاب ، صفحه ها را در صفحه نمایش کامپیوتر مطالعه می کندو کلیدواژه ها را بادونماد کاملا استثنایی چپ و راست که در مشابه آن درمتن وجود نداشته باشد، علامت گذاری می کند(مثلا کلیدواژه درون سه کروشه قرار می گیردیا...) که این هم نوعی انتخاب کلیدواژه است. سپس نمایه ساز در همان فایل ارجاعات مورد نظر تحریر می کند. پی از اتمام علامت گذاری با کروشه ها وارجاعات و تبدیلها یک ابزار نرم افزار می تواند کل نمایه را تهیه و الفبایی کند. اگر نرم افزاردارای امکانات نمایه سازی نباشد ویراستار می تواند یک برنامه بسیار ساده (مثلا به زبان بیسیک بنویسد) که فهرست کلیدواژه های علامت گذاری شده و شماره صفحه های آنها را استخراج کندویک برنامه یا ابزار ساده دیگر نمایه را ترتیب بندی و مرتب کند. بنابراین نمایه کتاب نمی تواند به صورت کاملا رایانه ای ساخته شود و رایانه فقط قادر است مدخلها را ذخیره و به منظور اصلاحات به سرعت بازیابی کند. پس رایانه نمیتواند جایگزین نمایه ساز شود. برنامه رایانه ای مدخلها را الفبایی می کندومانع دوباره کاری مدخلها می شودوارجاعهای دوسویه را کنترل ونمایه راچاپ می کند.روشهای نمایه سازی کتاب با کمک رایانه دارای مزایای سرعت ورود اصطلاحات نمایه ای، ظرفیت ذخیره سازی بالا ، سهولت اصلاح ، حروفچینی وتایپ، ویرایش و چاپ نمایه هستندواز لحاظ اقتصادی مقرون به صرفه می باشند.(۷)

تجهیزات لازم برای نمایه سازی ماشینی:

تمامی روشهای نمایه سازی ماشینی می کوشند مراحل فراهم آوری اطلاعات و سازماندهی توصیفگرهای یک مدرک را به صورت کامل خودکار سازی نمایند. نمایه سازی ماشینی به دو صورت انجام می پذیرد و هرکدام تجهیزات خاص خودرا می طلبد:

۱) تجهیزات لازم نمایه سازی ماشینی مدرک. برای آنکه توصیفگرها ازدرون متن استخراج شوند.به عبارت دیگر وارونه سازی متن انجام میگیرد.(روش استخراجی) هنگام وارونه سازی متن از میان مدارک فقط واژگان سیاهه بازدارنده استخراج می شوند وکنارگداشته می شوند. مابقی به عنوان واژه های نشان دهنده محتوای مدرک بصورت مقلوب ذخیره می شوند. بنابراین مراحل لازم برای وارونه سازی به این شرح می باشدکه اولا تولید داده های وارونه شده بوسیله استخراج همه مفاهیم ازمدرک با اشاره به شماره مدرک صورت می گیردو ثانیا مفاهیمی از داده ها نمایه که درسیاهه بازدارنده نیز وجوددارد، حذف می شوند.

۲) تجهیزات مربوط به مفاهیم . دراین روش یک بانک واژگان وجوددارد که نوعی واژه نامه می باشد. (روش استنادی)

روش های نمایه سازی ماشینی

الف. روش های زبان شناختی: این روشها می کوشند با کمک تحلیل های شکل شناسی و ساختار نحوی و معنایی مدرک توصیفگرها را استخراج نمایند. که این روشها به سه دسته تقسیم میگردد:

ـ تجزیه و تحلیل ریخت شناسی که برمبنای ریشه لغات عمل می کند.

کلمات بدون بار معنایی موجود در سیاهه بازدارنده را حذف می کند.

شکل های دستوری صرف کلمه را به یک شکل می آورد.

ضمایر را براساس اسامی مربوط به آنها مرتب می کند.

ـ تجزیه و تحلیل نحوی که درسطح جملات امکانپذیر است و برمبنای علامتهای نحو لغات انجام می شود.

ـ تجزیه و تحلیل معنا شناختی که درسطح مدارک مشترک در یک پایگاه صورت می گیرد . ارتباطات معنایی موجود در یک مدرک شناسایی می شوند تا متون مشترک بتوانند به صورت واحدهای هم معنی تجزیه شوند.

ب. روش های آماری: مشخص می کندکه معنی هرمفهوم منفرد در مدرک با حضور آن در جایگاههای مختلف مدرک ارتباط تنگاتنگ دارد. بنابراین لغات درون متن شمارش می شوندو ارتباط آنها ارزش گذاری می شود. هدف آمارگیری از اطلاعات آن است که لغات دارای بارمعنایی در مدرک به عنوان توصیفگر انتخاب شوند. روش های آماری عملا برای بالابردن جامعیت به کار گرفته می شوند. درحالیکه روشهای زبان شناختی در جهت بهبود مانعیت کاردارند.

ج. روش های مبتنی براحتمالات: در این روشها تئوری احتمالات برای مدل سازی ریاضی مراحل بازیابی به کارگرفته می شود. درحالیکه در توزیع آماری اصطلاحات یک مدرک مورد استفاده قرار می گیرد.این روش با عملیات ریاضی مفروضات ساده و مطمئنی را ارائه می دهد. فرض برآن است که مدارک براساس میزان ربط درهنگام بازیابی مورد ارزیابی قرارمی گیرند.

متغیرهای مداخله گر در نمایه سازی ماشینی( مشکلاتی که حین نمایه سازی ماشینی با آن مواجه هستیم) :

چند زبانه مجموعه مدارک

عدم محدودیت درموضوعات و عناوین و رشته ها

سطح غیر تخصصی زبان مدرک

مدارک بسیار قدیمی با لغات منسوخ موجود درآنها

مراحل نمایه سازی کامپیوتری :

ذخیره اطلاعات

تشخیص اطلاعات

تفکیک اطلاعات به پاره های اطلاعاتی

مقایسه پاره های اطلاعاتی

طبقه بندی

انتخاب

درنمایه سازی ماشینی اساس کار ذخیره اطلاعات به صورت الکترونیکی و تشخیص اطلاعات بسته به توانایی سیستم جهت این تشخیص و سپس تفکیک به پاره های اطلاعاتی توسط کامپیوتر می باشد.

منظور از ذخیره اطلاعات به صورت الکترونیکی ، ذخیره اطلاعات بخشی ازمدرک است که جهت نمایه سازی ازآن استفاده می شودو شامل عنوان یا چکیده یا فهرست مندرجات یا حتی کل مدرک می باشد.

منظور از تشخیص اطلاعات، تشخیص کلمات وجملاتی است که به صورت الکترونیکی ذخیره شده است و بستگی به توانایی سیستم از لحاظ سخت افزاری و نرم افزاری دارد.

منظور از تفکیک اطلاعات به پاره های اطلاعاتی این است که کل اطلاعات یک مدرک که ذخیره شده است به جملات یا کلمات شکسته شود.

منظور از مقایسه پاره های اطلاعاتی همان مقایسه جملات یا کلماتی است که در مراحل قبل شکسته شده است.

منظور از طبقه بندی پاره های اطلاعاتی ، اولویت بندی پاره های اطلاعاتی برحسب نیاز و با توجه به برنامه ای است که قبلا به سیستم داده شده است.

انتخاب آخرین مرحله است که پس از اولویت بندی پاره های اطلاعاتی آن دسته از اصطلاحاتی که در اولویت قرارگرفته اند به عنوان توصیفگرانتخاب می شوند و اصطلاحات نامناسب حذف می شوند.

نمایه سازی خودکار درمحیط وب:

وب به عنوان یکی از جذاب ترین بخش های اینترنت کاربردهای فراوانی دارد ومجموعه ای است از صفحات به هم پیوسته که حاوی اطلاعات مفیدی درزمینه های موضوعی متفاوت است. همه دلایل مربوط به چرایی سازماندهی اطلاعات در محیط چاپی با شدت بیشتری درمحیط الکترونیک صادق است.چرا که امروزه میلیونها نفر نیازهای خودرا ازطریق وب مرتفع می سازند.درحال حاضر موتورهای کاوش وب راتحت ضابطه درآورنده اندو با نمایه سازی صفحات ، پاسخی برای پرس وجوی کاربران فراهم می آورند. نحوه سازماندهی اطلاعات بازتاب مستقیمی درنحوه بازیابی (رتبه بندی ونمایش) نتایج دارد. موتورهای کاوش هریک با الگوریتمها و سیاستهای متفاوتی به مقوله نمایه سازی می نگرند.تفاوت درنتایج بازیابی شده در موتورهای کاوش مختلف نشان بارزی از وجود تفاوت درالگوریتمهای نمایه سازی آنهاست. سازماندهی وسپس ذخیره مناسب اطلاعات به بازیابی نتایج مرتبط ومناسب خواهدانجامید.

نمایه سازی بایکی از دوروش دستی وخودکار انجام می گیرد. در محیط وب به دلیل حجم وسیع اطلاعات منتشر شده عملا نمی توان به شیوه های دستی متوسل شد. بنابراین نمایه سازی دروب به صورت خودکار وتوسط موتورهای کاوش انجام می شود. موتورهای کاوش پایگاههای اطلاعاتی قابل جستجویی هستند که از طریق برنامه های کامپیوتری به شناسایی ونمایه سازی خودکار صفحات وب می پردازند. موتورهای کاوش برنامه های خودکاری هستند که هیچ گونه وابستگی به نیروی انسانی ندارند.

رویکردهای نمایه سازی خودکار دروب:

دربیانی کلی می توان گفت که تاکنون درحوزه ذخیره وفن آوری اطلاعات در وب شاهد رویکردهای نمایه سازی گوناگونی چون محتوامحتوری و معنا محوری بوده ایم که شرح آنها آورده خواهد شد.

۱) محتوا محوری:

اغلب موتورهای کاوش حاضر از روش نمایه ساز ی برمبنای کلیدواژه های متن استفاده می کنند.دراین شکل فرایند نمایه سازی سه مرحله خواهد داشت : شکستن کلمات، تعدیل وحذف کلمات غیرموضوعی، استفاده از الگوریتم ریشه ساز جهت تولید ریشه های مفاهیم. درمرحله شکستن کلمات، داده هایی که به صورت رشته ای از کاراکترها هستندمورد بررسی قرار گرفته وحدود کلمات وفاصله میان آنها مشخص می گردد. درمرحله تعدیل کلمات مزاحم، بزرگ نویسی ، نقطه گذاری ومواردی از این دست مدیریت می شود. کلمات مزاحم درنمایه سازی کلماتی هستند که بار معنایی خاصی ندارند و تنها برای ایجاد پیوستگی و ارتباط در جمله ها به کار می روند. بعد از این مرحله از الگوریتمی جهت تولید ریشه ها و مفاهیم استفاده می شود.

۲) معنا محوری:

درحال حاضر اغلب موتورهای کاوش رویکردی مکانیکی دارندو به مفاهیم ، الگوها وکلیدهایی که به فهم مفاهیم می انجامد توجهی ندارند. دراین ابزارها، جست و جوی واقعی صرفابر مبنای کلیدواژه هاست. استفاده از فهرست مترادفها وبهره گیری از جست وجوی فازی از راهبردهای مطرح شده جهت رفع مشکلات جست وجوی کلید واژه ای است. روشی که دراینجا مطرح است بهره گیری از نمایه سازی معنایی پنهان جهت بهبود مانعیت، جامعیت ورتبه بندی نتایج کاوش است.نمایه سازی معنایی پنهان به کاربران این اجازه را میدهد که جست وجوی خودرا به مفاهیم و نه فقط کلید واژه ها محدود کنند.درزمینه نمایه سازی خودکار دروب حرکتهای جاری به سمت بهره گیری ازداده های ساختار یافته وتحقق وب معنایی است ، اما این حرکتها به طورکامل به انجام نرسیده است و هنوز مشکلات حل نشده فراوانی در این مسیر وجوددارد. بی گمان کتابداران واطلاع رسانان به عنوان متولیان سازماندهی دانش بشر ، می توانند دراین زمینه نقش موثری ایفا کنند. بدیهی است دراین راستا کتابدار باید خودرا به دانش وفناوریهای نوین اطلاعاتی مجهز نماید تابتواند وظیفه نمایه سازی وذخیره سازی اطلاعات را انجام دهد.

نتیجه گیری :

نمایه سازی یکی از سریعترین روشهای بازیابی اطلاعات محتوای مدارک است و با توجه به افزایش روزبه روز مدارک و توسعه رشته های علمی ضروری به نظر می رسد. نمایه سازی ماشینی از انواع نمایه سازی است که هماهنگی و یکدستی درنمایه سازی را به دنبال دارد. دراین روش انتخاب واژه های کلیدی توسط ماشین انجام می گیرد. البته این درحالی است که یک بار سیاست کار آن به ماشین داده شده است. دراین روش انتخاب کلیدواژه ها، کنترل اصطلاحات تخصصی و هماهنگی بین آنها توسط ماشین انجام می گیرد. عمدتا نمایه سازی ماشینی به دوروش رایانه ای و با کمک رایانه انجام می گیرد. روش رایانه ای داراری انواع حذف اصطلاح و حفظ اصطلاح است که نمایه کوئیک و کوواک از نوع حذف اصطلاح هستند. نمایه سازی با کمک رایانه درمحیط گرافیکی و دستوری انجام می گیرد. درصورت استفاده از هر کدام از روش ها نیاز به نرم افزار هایی داریم که دراین زمینه راهگشا باشند. می توان از رویکردهای نمایه سازی خودکار درمحیط وب نیز استفاده نمود که این مسئله نیز درراستای دستیابی به هدف اصلی نمایه سازی که همان سازماندهی اطلاعات به قصد سهولت بازیابی است، می باشد


مطالب مشابه :


مراحل ساخت طلا

افق فردا - مراحل ساخت طلا - دست در دست هم دهیم به مهر میهن خویش را کنیم آباد




ماشین‌سازی اراک به جمع صنایع باشگاه‌دار می‌پیوندد ‌

پايگاه خبري تحليلي خبر مركزي - ماشینسازی اراک به جمع صنایع باشگاه‌دار می‌پیوندد ‌ - یک




لیست فیلم های صنعتی-فنی

نماشي مراحل و خطوط توليد 3 فیلم در مورد ماشین آلات پلاستیک سازی و چاپ روی




نمایه سازی ماشینی

مراحل نمایه سازی دراین روش انتخاب واژه های کلیدی توسط ماشین انجام می گیرد.




مراحل ساخت شیشه:

صنعت شیشه سازی و صنعت نفت - مراحل ساخت شیشه: خروج از کوره با ماشین کشش از میان دیبتوز بصورت




ماشین های آماده سازی زمین

ماشین های آماده سازی مراحل مختلف عمليات در كشاورزي : 1- خاك ورزي يا آماده كردن زمين .




پروژه مالی دوره کاردانی - شرکت ماشین سازی و سیم و کابل سازی حسا

مراحل ساخت ماشین سیم وكابل سازی ; بخش اول : ساخت شاسی ; نام دستگاههای خط تولید ماشین سازی ;




نمایه سازی ماشینی

اطلاعـــــات خلاصـــــــــه - نمایه سازی ماشینی - ارائه ی مطالب در زمینه کتابداری و اطلاع




بزرگ ترین پل قوسی خاورمیانه بر روی سد کارون 4

و تمامی مراحل طراحی و اجرای زیرسازه و روسازه و نصب آن به دست متخصصان ماشین سازی




برچسب :