Development of a data compression method by merging data blocks

No Thumbnail Available

Date

2025-06-17

Journal Title

Journal ISSN

Volume Title

Publisher

Université of eloued جامعة الوادي

Abstract

The digital world has witnessed a massive growth in data volume, creating a need for efficient techniques for storing and transmitting information. Due to limited resources, data compression techniques have been proposed to reduce the amount of data stored or transmitted. Data compression concepts contribute to the optimization of storage space and communication bandwidth, which has led to the development of numerous approaches from various perspectives. This work focuses on the implementation of a lossless data compression method based on data block merging to improve compression ratios. The method merges the contents of two data blocks to achieve a better compression ratio. The proposed approach was tested on the Prague Corpus dataset, which includes various file types such as databases, software scripts, and medical images. The results showed significant improvements in compression ratios at the block level, but recorded negative values at the file level, highlighting the need for preprocessing algorithms before implementing the merging process. This study opens new avenues for improving data compression in practical applications, with the potential to expand the use of artificial intelligence techniques to achieve higher compression ratios in the future. Le monde numérique a connu une croissance considérable du volume de données, créant un besoin de technologies efficaces pour stocker et transmettre des informations. En raison de ressources limitées, des techniques de compression de données ont été proposées pour réduire la taille des données stockées ou transmises. Les concepts de compression de données contribuent à améliorer l’utilisation de l’espace de stockage et de la bande passante de communication, ce qui a conduit au développement de nombreuses méthodes sous plusieurs angles. Ce travail se concentre sur la mise en oeuvre d’une méthode de compression de données sans perte basée sur la fusion de blocs de données pour améliorer le taux de compression. La méthode combine le contenu de deux blocs de données pour obtenir un meilleur taux de compression. L’approche proposée a été testée sur un ensemble de données : Prague Corpus, qui comprend différents types de fichiers tels que des bases de données, des scripts logiciels et des images médicales. Les résultats ont montré une bonne amélioration des taux de compression au niveau du bloc, mais ont enregistré des valeurs négatives au niveau du fichier, soulignant la nécessité d’algorithmes de prétraitement avant d’effectuer le processus de fusion. Cette étude ouvre de nouveaux horizons pour améliorer la compression des données dans les applications pratiques, avec le potentiel d’étendre l’utilisation des techniques d’intelligence artificielle pour atteindre des taux de compression plus élevés à l’avenir.

Description

MASTER Mathematics and Computer Science

Keywords

Data compression, Redundancy reduction, Compression algorithms, Compression datasets., Compression de données, Réduction de redondance, Algorithmes de compression, ensembles de données de compression.

Citation

Bouhafs, Rokia. Bouzidi, Abir. Development of a data compression method by merging data blocks. Mathematics and Computer Science .2025. Department of Computer Science. Université of eloued