مراحل ایجاد فراداده OLAC - آموزش

مراحل ایجاد فراداده OLAC

مراحل ایجاد فراداده OLAC

مراحل ایجاد فراداده OLAC

How to create OLAC metadata

اکثر محققان در حال ساخت متادیتا هستند، حتی اگر در ساخت متادیتای ساختار یافته مهارت نداشته باشند. واین نیاز به درک پارامترهای مهم مورد نیاز برای توصیف یک منبع و سپس ضبط کردن این پارامترها به صورت استاندارد دارد. ایجاد یک لیست از منابع در انتهای یک کتاب یا مقاله نیازمند دانش پایه ای از متادیتاست. همچنین، بیشتر آرشیوهایی که به خوبی مدیریت شده اند، ابرداده خود را جمع آوری کرده و آن را به شکل ساختاری ذخیره کرده اند، که بیشتر به طور معمول در پایگاه داده است.

یکی از اهداف اصلی OLAC، ایجاد یک روش استاندارد برای مستند سازی منابع زبانی برای کمک به مکان و کشف آنها است. مهم این است که OLAC قصد ندارد دیکته کند که چگونه محققان باید ابرداده خود را طراحی کنند. در عوض، آن را به دنبال ایجاد یک توافق بر مبنای جامعه در مورد ابرداده زبانی است. همچنین، حتی یک آرشیو سازگار با OLAC می تواند ابرداده خود را در فرمت غیر OLAC ذخیره کند. چنین منابعی به سادگی با "انتقال " خود به ابرداده OLAC به منظور استفاده گسترده تر در دسترس میباشند.

یک نمونه ی فنی برای انتقال متادیتا از یک فرمت به یک دیگر، نقشه برداری است. بسیاری از آرشیوها یا متادیتای غیر OLAC ایجاد شده اند یا دلایل خوبی برای تمایل به انجام این کار دارند. با این حال، به طور عمده، ابرداده خود را به الگوریتم OLAC تبدیل خواهند کرد، از آنجا که ابرداده OLAC از توصیف گرهای بسیار معمولی مانند «خالق»، «موضوع» و «قالب» استفاده می کند. از آنجا که متادیتای OLAC به طور خاص برای منابع تحقیق طراحی شده است، همچنین شامل چند توصیفگر مانند "موضوع تحقیق " است که ارزش خاصی برای محققان دارد.

یک مثال برای نشان دادن چگونگی کارکرد نقشه برداری از قالب فراداده خاص به استاندارد OLAC کمک خواهد کرد. رکورد زیر از پایگاه داده های متادیتی داخلی برای Dictionary Online Dictionary Bantu گرفته شده است.

این رکورد حاوی طیفی از اطلاعات است، و همه اینها به احتمال زیاد برای زبان شناسان برای مکان و کشف منابع هم اهمیت دارد. زبان Gevove از منافع واضح است و نام خالق اطلاعات نیز نسبتا مهم است. پارامترهای دیگر مانند "وضعیت Recon" (به معنی بازسازی مجدد واژگان در مورد منابع) احتمالا برای محقق عمومی کمتر اهمیت دارد (هرچند ممکن است برای اقلیت آنها اهمیت داشته باشد).

اطلاعات موجود در رکورد فوق داده فوق توسط نویسنده این مقاله به شکل زیر به ابرداده OLAC نقشه برداری شده است:

اولین نکته در مورد نقشه برداری از متادیتای داخل CBOLD برای الگوریتم های OLAC این است که اطلاعات از بین می رود - برای مثال، در نسخه OLAC هیچ اشاره ای به "وضعیت Recon" وجود ندارد. الگوریتم استاندارد OLAC حاوی فیلد "وضعیت Recon وضعیت" نیست زیرا این ویژگی برای منابع زبان عمومی بیش از حد مشخص است. ترجمه از یک قالب متادیتای خاص به یک عمومی تر اغلب شامل از دست دادن برخی اطلاعات است. این به طور کلی یک مشکل نیست، مگر اینکه به طور قابل ملاحظه ای مانع مکان و کشف منابع شود.

ممکن است اطلاعاتی از قبیل "وضعیت Recon" را در الگوریتم OLAC شامل شود، زیرا استاندارد OLAC انعطاف پذیر است. به عنوان مثال، اگرچه فیلد '' Recon status '' را تعریف نمی کند، یک فیلد توضیح تعریف می کند، جایی که هر اطلاعاتی که متعلق به یک فیلد دیگر نیست، می تواند قرار گیرد.

این نگاشت نادرستی از Metadata داخلی CBOLD برای الگوریتم های OLAC یک نقطه مهم را نشان می دهد: فراداده ایده آل شامل تمام اطلاعاتی است که ممکن است در مورد یک منبع داشته باشد. با این حال، OLAC این را اجرا نمی کند. در عوض، آن را به خالق می گذارد تا تصمیم بگیرد که چه اطلاعاتی را در ابرداده قرار دهد. ابرداده استاندارد OLAC باید یک ساختار خاص داشته باشد و از پارامترهای توصیفی تعریف شده OLAC استفاده کند، اما ایجاد کننده متادیتا در غیر اینصورت انعطاف پذیری زیادی دارد.

اگر یک توصیه عمومی برای ایجاد ابرداده وجود داشته باشد، این است که به نیازهای کاربر بالقوه آن فکر کنید. این مشکل می تواند دشوار باشد، زیرا دشوار است دقیقا چه کسی باید از منبع خود استفاده کند. از دیدگاه OLAC، با این حال، معمولا ارزشمند است.

7. نحوه توزیع ابرداده

بسیاری از آرشیوها در حال حاضر شیوه های توزیع ابرداده خود را، بیشتر به طور معمول از طریق نوع دسترسی آنلاین به پایگاه داده خود، طراحی کرده اند. برای مثال، کنسرسیوم اطلاعات زبانی، دارای فهرست آنلاین است که اجازه دسترسی به ابرداده های خود را می دهد.

دسترسی آنلاین آرشیو توسط مدیریت بایگانی قطعا بسیار ارزشمند است، اما مشکل این است که کاربر باید از بایگانی در وهله اول به منظور یافتن منابع در آن بایگانی اطلاع داشته باشد. در حالت ایده آل، ابردادهای از تمام آرشیوهای زبانشناختی میتوانند به صورت متمرکز دسترسی پیدا کرده و جستجو شوند به طوری که زبان شناس در مورد آرشیو مربوطه برای تعیین منابع مفید استفاده نکند - این نیاز به یک سیستم عمومی از توزیع فراداده دارد. که در مورد نوعی از زبان شناسان ارزشمند باشد و معیارهای جستجو را برای استفاده از آن تعیین کنید.

استاندارد ابرداده OLAC به طور خاص برای توزیع عمومی ابرداده زبانی امکان پذیر است. این استاندارد فراداده، اولین قدم برای ایجاد موتورهای جستجو است که به طور خاص برای نیازهای محققان زبان طراحی شده است. راه های مختلفی برای توزیع ابرداده OLAC وجود دارد، بعضی از آنها ساده تر از دیگران هستند. این روش ها در سند پیاده سازی FAQ شرح داده شده است.

موتورهای جستجو با استفاده از متادیتای OLAC در حال حاضر موجود هستند، مهمترین آنها یکی از میزبان های لیست LINGUIST در http://www.linguistlist.org/olac/ است. ارزش این موتورهای جستجو تا حد زیادی وابسته به ابرداده هایی است که در دسترس آنها قرار دارد. محققان بیشتری که متادیتای استاندارد OLAC را ایجاد می کنند، برای همه محققان راحت تر خواهد بود برای پیدا کردن داده هایی که نیاز دارند.

8. مراحل بعدی و منابع بیشتر

در آنجا، شما می توانید مستندات برای آخرین استانداردهای ابرداده OLAC را پیدا کنید. این استانداردهای مبتنی بر جامعه است. بنابراین، نظرات و پیشنهادات برای بهبود آنها می تواند توسط هر کسی که قصد استفاده از استانداردهای OLAC را داشته باشد، ساخته شود.

 

 

دیدگاه خود را بیان کنید

تمامی حقوق برای شرکت فناوری اطلاعات گیلاس خندان محفوظ است