An Intelligent Approach for the Detection of Extremism through Social Networks

No Thumbnail Available

Date

2023-02-02

Journal Title

Journal ISSN

Volume Title

Publisher

Universty of Eloued جامعة الشهيد حمة لخضر بالوادي

Abstract

Résumé : فرنسية أو انجلزية Extremism in its many forms is a growing threat worldwide and a threat to public safety and national security. The most prominent form is extremism in the religious text. Religious texts are among the essential parts of a people's cultural heritage and often influence societies greatly. Unfortunately, misconceptions and misconceptions can radicalize some religious fanatics and fanatics. Modern social networks allow people to express themselves, share their opinions, and show their affiliations and beliefs on many topics. Creates data in many forms, such as images, videos, and text. We used supervised machine learning (ML) to classify and analyze the textual data set of extremism from social networks at three levels for its pre-processing and text feature extraction. In this thesis, we focus on three types of classification: extremist text classification, extremist text type classification, and religious extremist text classification. During our work, we compare and discuss the results of sixteen (16) Machine Learning classifiers to classify a text data set for extremism after pre-processing. The first model achieved (97 %) accuracy, the second model achieved (93.6 %) accuracy, and the third model achieved (93.77 %) accuracy. L'extrémisme sous ses nombreuses formes est une menace croissante dans le monde entier et une menace pour la sécurité publique et la sécurité nationale. La forme la plus importante est l'extrémisme dans le texte religieux. Les textes religieux font partie des éléments les plus importants du patrimoine culturel d'un peuple et influencent souvent considérablement les sociétés. Malheureusement, les idées fausses et les idées fausses peuvent radicaliser certains fanatiques et fanatiques religieux. Les réseaux sociaux modernes offrent une plate-forme permettant aux gens de s'exprimer, de partager leurs opinions et de montrer leurs affiliations et leurs croyances sur de nombreux sujets. Cela crée des données sous de nombreuses formes telles que des images, des vidéos et du texte. Nous avons utilisé l'apprentissage automatique supervisé (ML) pour classer et analyser l'ensemble de données textuelles de l'extrémisme des réseaux sociaux à trois niveaux pour son prétraitement et l'extraction des caractéristiques du texte. Dans cette thèse, nous nous concentrons sur trois types de classification : la classification des textes extrémistes, la classification des types de textes extrémistes et la classification des textes extrémistes religieux. Au cours de notre travail, nous comparons et discutons les résultats de seize (16) classificateurs d'apprentissage automatique pour classer un ensemble de données textuelles pour l'extrémisme après prétraitement. Le premier modèle a atteint une précision (97 %), le deuxième modèle a atteint une précision (93,6 %) et le troisième modèle a atteint une précision (93,77 %). الملخص: يمثل التطرف بأشكاله العديدة تـهديدًا متزايدًا في جميع أنحاء العالم ويمثل تـهديدًا للسلامة العامة والأمن القومي. وأبرز أشكال التطرف هو التطرف في النص الديني. تعتبر النصوص الدينية من أهم أجزاء تراث الثقافات لدى الشعوب، وغالبًا ما تؤثر على المجتمعات بشكل كبير؛ لسوء الحظ، يمكن للمفاهيم الخاطئة المظللة أن تجعل بعض المتعصبين والمتطرفين الدينيين متطرفين. توفر الشبكات الاجتماعية الحديثة منصة للأشخاص للتعبير عن أنفسهم ومشاركة آرائهم وإظهار انتماءاتهم ومعتقداتـهم في العديد من الموضوعات. يؤدي هذا إلى إنشاء بيانات بأشكال عديدة مثل الصور ومقاطع الفيديو والنص. استخدمنا التعلم الآلي الخاضع للإشراف (ML) لتصنيف وتحليل مجموعة البيانات النصية من الشبكات الاجتماعية على ثلاثة مستويات للمعالجة المسبقة لها واستخراج ميزات النص. في هذه الأطروحة، نركز على ثلاثة أنواع من التصنيف: تصنيف النص المتطرف، تصنيف نوع النص المتطرف وتصنيف النص الديني المتطرف. خلال عملنا نقارن ستة عشر (16) مصنفًا للتعلم الآلي لتصنيف مجموعة بيانات نصية من الشبكات الاجتماعية بعد المعالجة المسبقة. حقق النموذج الأول (97٪) دقة، النموذج الثاني (93.6٪)، والنموذج الثالث (93.33٪).

Description

أطروحة دكتوراه تخصص الذكاء الإصطناعي في العلوم الدقيقة

Keywords

Social Networks، Machine Learning، Natural Language Processing، Extremism، Features، Text Mining، Religions، Classification, الشبكات الاجتماعية، التعلم الآلي، معالجة اللغة الطبيعية، النص المتطرف، الملامح، التنقيب عن النصوص، الأديان، التصنيف، التطرف.

Citation