Question Answering Transformer Model for Arabic Language

dc.contributor.authorHanine, Horra
dc.contributor.authorWiam, Ghilani
dc.date.accessioned2023-09-11T10:16:23Z
dc.date.available2023-09-11T10:16:23Z
dc.date.issued2023-06-07
dc.descriptionmémoire master informatuqueen_US
dc.description.abstractاللغة العربية هي سادس لغة طبيعية الكثر انتشارا في العالم مع أكثر من 350 مليون ناطقا بها. غالبية النصوصفي البيانات العربية غير منظمة وموزعة عبر النترنت. يمكن أن تسفر بيانات النصهذه عن معرفة مفيدة إذا تم الحصول عليها وتجميعها وتنسيقها وتحليلها بشكل صحيح. في هذا العمل، قمنا باستخراج وتنسيق البيانات في الفقه والسيرة من مصادر مختلفة لنشاء مجموعة بيانات )الجابة على السئلة في الفقه والسيرة( مع 550 ساال باللغة العربية. وهو الول من نوعه. بعد ذلك ، قمنا بتدريب ثلثة نماذج من عائلة بيرت )بيرت ، ديستيلبرت ، و إلكترا( على مجموعة البيانات باستخدام مكتبة المحولت البسيطة. مقاييس التقييم المستخدمة كانت)صحيحة وغير صحيحة ومتشابهة( ،حيث كانت النتيجة المتحصلعليها من اجل نماذج بيرت، ديستيلبيرت والكترا جيدة نسبيا.Arabic is the 6th most wide-spread natural language in the world with more than 350 million native speakers. The majority of text in Arabic data is unstructured and dispersed across the internet. This text data can yield helpful knowledge if it is properly obtained, aggregated, formatted, and analyzed. In this work, we extracted and formatted data in Fiqh and Syrah from different resources to create QAFS (Question Answering in Fiqh and Syrah) dataset with 550 questions in the Arabic language. Which is the first of its kind. Later, we trained three BERT models family (BERT, DistilBERT, and ELECTRA) on QAFSv1 using simple transformers library. The evaluation metrics used were (correct, incorrect, and similar). Finally, we obtained relatively good results for BERT & DistilBERT, and ELECTRA.en_US
dc.identifier.urihttp://dspace.univ-eloued.dz/handle/123456789/28108
dc.language.isoenen_US
dc.publisheruniversity of eloued جامعة الواديen_US
dc.relation.ispartofseriesm005;
dc.subjectمحولت ، اللغة العربية ، الجابة على السئلة ، مجموعة البيانات.en_US
dc.subjectTransformer, Arabic Language, Question Answering, Dataset.en_US
dc.titleQuestion Answering Transformer Model for Arabic Languageen_US
dc.typeMasteren_US

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Question Answering Transformer Model (2).pdf
Size:
1019.93 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: