Structures de données complexes et distribuées dédiées à la fouille de données

No Thumbnail Available

Date

2023-02-02

Journal Title

Journal ISSN

Volume Title

Publisher

Universty of Eloued جامعة الشهيد حمة لخضرالوادي

Abstract

Résumé : فرنسية أو انجلزية The processing of large, complex and distributed datasets needs to minimize the waste of network resources and maximize interaction with a user. Where to find the use of the targeted application in the field of decision support or data analysis. On the other hand, the more complex multi-criteria query Skyline used in many applications requiring multi-criteria decisions to identify the best results based on user preferences or conditions. In this context, this thesis presents the proposal of two distinct approaches located within the framework of optimizing the time to extract information and increased the accuracy of selecting this information in a large, heterogeneous and distributed database. In the first approach, a multi-agent system has been proposed which consists of five agents, such that each agent manages a system component which ensures the division of system tasks between the agents. As part of data analysis, we have proposed a database of results that makes it possible to minimize the amount of data in the search engine for association rules using the Pasquier method, which divides the rule generators into two bases: generic base for exact association rules and informative base for approximate association rules. The second proposal presents a new approach for selecting the best elements applied according to user preferences as part of the treatment of the multi criterion problem. This approach is based on the proposal of a Skyline query algorithm (Dynamic join Skyline) in a complex environment through the use of IOT options and has been applied in the context of booking travel services. A series of experiments have been carried out and it gives much better results. الملخص: تحتاج معالجة مجموعات البيانات الكبيرة والمعقدة والموزعة إلى تقليل هدر موارد الشبكة وتعظيم التفاعل مع المستخدم. أين يمكن العثور على استخدام التطبيق المستهدف في مجال دعم القرار أو تحليل البيانات. من ناحية أخرى ، فإن أفق الاستعلام متعدد المعايير الأكثر تعقيدا المستخدم في العديد من التطبيقات التي تتطلب قرارات متعددة المعايير لتحديد أفضل النتائج بناء على تفضيلات المستخدم أو شروطه. في هذا السياق ، تقدم هذه الأطروحة اقتراح نهجين متميزين يقعان في إطار الاستفادة المثلى من الوقت لاستخراج المعلومات وزيادة دقة اختيار هذه المعلومات في قاعدة بيانات كبيرة وغير متجانسة وموزعة. في النهج الأول ، تم اقتراح نظام متعدد الوكلاء يتكون من خمسة وكلاء ، بحيث يدير كل وكيل مكون نظام يضمن تقسيم مهام النظام بين الوكلاء. كجزء من تحليل البيانات, لقد اقترحنا قاعدة بيانات للنتائج تجعل من الممكن تقليل كمية البيانات في محرك البحث لقواعد الارتباط باستخدام طريقة باسكوير, الذي يقسم مولدات القواعد إلى قاعدتين: قاعدة عامة لقواعد الارتباط الدقيقة وقاعدة إعلامية لقواعد الارتباط التقريبية. ويقدم الاقتراح الثاني نهجا جديدا لاختيار أفضل العناصر المطبقة وفقا لتفضيلات المستخدم كجزء من معالجة مشكلة المعايير المتعددة. ويستند هذا النهج على اقتراح خوارزمية الاستعلام أفق (ديناميكية الانضمام أفق) في بيئة معقدة من خلال استخدام خيارات تقنيات عمليات وتم تطبيقها في سياق حجز خدمات السفر. تم إجراء سلسلة من التجارب وتعطي نتائج أفضل بكثير.

Description

أطروحة دكتوراه تخصص:إعلام آلي في العلوم الدقيقة

Keywords

Data mining, distributed systems, IOT, Skyline algorithms, Complex system, Frequent closed itemset, Data base heterogenic, Multicriteria decision, استخراج البيانات ، الأنظمة الموزعة ، أنترنت الاشياء، خوارزمية الأفق ، النظام المعقد ، مجموعة العناصر المغلقة المتكررة، قواعد البيانات المختلفة، القرار متعدد المعايير.

Citation