DAC logo link

Recommendations

فهرسة المواقع العربية وتصنيفها آلياً

فهرسة المواقع العربية وتصنيفها آلياً

المؤتمر: 

المؤتمر الأول

تأليف: 

م.محمد حجازي

نوع الوثيقة: 

ورقة علمية

الكلمات المفتاحية

الفهرسة، التصنيف، التصنيف الآلي، فهرس الوب، الترتيب

Keywords

Indexing, Classification, Automatic Classification, Web Directory, Ranking

مقدمة

بعد اختراع الوب في أوائل التسعينات على يد السيد تيم بيرنرز ليي (Tim Berners-Lee) والازدياد الكبير الذي حصل في عدد المواقع الإلكترونية حول العالم، بدأت تظهر الحاجة الملحة لوجود طريقة تسهل الوصول إلى هذه المواقع بحسب تصنيفاتها أو المجالات التي تقع ضمنها، فظهرت فهارس الوب (web directory) التي قدمت حلاً مناسباً لهذه المشكلة من خلال فهرسة المواقع وتصنيفها ومن ثم السماح للمستخدمين باستعراض أسمائها بحسب التصنيف أو المجال المطلوب.

فهرسة وتصنيف المواقع آلياً

إن عملية فهرسة وتصنيف مواقع الوب يدوياً تحتاج إلى جهد بشري كبير لاسيما وأن هذه المواقع تزداد باضطراد وتتغير بشكل مستمر، ولذا ظهرت طرق وخوارزميات مختلفة للقيام بهذه المهمة دون تدخل الانسان إلا أن نتائجها الفعلية لم تكن بالمستوى المأمول، لذلك لم يكن هناد بد من دمج الطريقتين معاً بحيث تكون عملية التصنيف آلية ويمكن تدقيقها وتعديلها في أي وقت من قبل الإنسان.

فهرسة وتصنيف المواقع العربية

ظهرت عدد خدمات ومواقع تهتم بفهرسة وتصنيف المواقع العربية على الوب مؤخراً، لكن العيب الأكبر فيها أنها ما زالت تعتمد على الإضافة والتصنيف اليدويين من قبل المستخدمين، ما جعل هذه الفهارس قاصرة ولا تغطي إلا الجزء اليسير من المواقع العربية وهي تلك التي قام أصحابها بإضافتها إلى هذه الفهارس بأنفسهم، لتبقى الكثير من المواقع العربية في شتى المجالات خارج نطاق التصنيف والفهرسة وبعيدة عن أعين هذه الخدمات.

لذلك ظهرت الحاجة إلى وجود نظام يقوم باستكشاف المواقع العربية في الوب على اختلاف اختصاصاتها ومن ثم فهرستها وتصنيفها آلياً لتكون متاحة للمستخدم العربي ضمن فهرس واحد يشمل جميع هذه المواقع مع الحرص على التحديث المستمر لهذا الفهرس، فكانت فكرة نظام "دليل" لفهرسة وتصنيف المواقع العربية آلياً.

نظام "دليل" لفهرسة وتصنيف المواقع العربية آلياً

فكرة نظام "دليل" تقوم على الاستكشاف الآلي للمواقع العربية ومن ثم فهرستها وتصنيفها آلياً وبعد ذلك تقديم خدمات مختلفة على الفهرس الناتج لهذه المواقع.

يقسم نظام "دليل" إلى ثلاثة أقسام رئيسة:

  1. قسم استكشاف المواقع العربية: ويتضمن العمليات اللازمة لاستكشاف المواقع على الانترنت والانتقال بينها (Web crawler) ومن ثم التحديد الآلي للمواقع العربية وإهمال المواقع الأخرى، خرج هذا القسم هو قائمة بعناوين المواقع العربية والارتباطات التي بينها.
  2. قسم فهرسة وتصنيف المواقع العربية: ويتضمن العمليات اللازمة لفهرسة المواقع العربية الناتجة من القسم الأول وتصنيف محتوياتها آلياً ضمن عدة مستويات من التصنيف على أكثر من مستوى جزئي ضمن كل موقع.
  3. قسم الخدمات النهائية: ويتضمن عدة خدمات أساسية منها:
  1. خدمة الاستعراض: تتيح للمستخدم استعراض المواقع التي تقع ضمن كل تصنيف في الفهرس الرئيس.
  2. خدمة البحث: تتيح للمستخدم البحث عن المواقع ضمن تصنيف واحد أو أكثر يحدده المستخدم، كما يمكن لاحقاً تطوير هذه الخدمة بحيث تشمل البحث ضمن محتويات المواقع أيضاً.
  3. خدمة الترتيب: وتقدم قائمة المواقع ضمن كل تصنيف بحسب ترتيب صلتها بهذا التصنيف وشهرتها.

تحديات بناء نظام "دليل"

من المتوقع مواجهة بعض التحديات في تطبيق نظام "دليل"، وبشكل رئيس كونه يختص بالمواقع العربية، إذا أن التصنيف الآلي للمواقع العربية يقتضي وجود خوارزميات وطرق تحليلية متقدمة خاصة باللغة العربية وهو ما ليس متوفراً فعلياً، ولذلك سنكون بحاجة إلى جهد كبير للتعويض عن هذه النقص الحاصل وإنجاز النظام بأفضل وجه ممكن.

المزيد في المرفق...

المرفقالحجم
Microsoft Office document icon Daleel Paper.doc155 KB

إضافة تعليق جديد

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.