La détection de textes d'images de scènes naturelles à l'aide de l’apprentissage profond

Abstract

La détection et la reconnaissance de texte est un champ d’étude qui a longtemps intéressé la communauté des chercheurs. Le problème de la détection et de la reconnaissance d'un texte a de nombreuses solutions en utilisant différentes techniques. L'une des solutions utilisées et développées récemment est l'utilisation de l’apprentissage profond (Deep Learning) qui est un type d'intelligence artificielle dérivé de l’apprentissage automatique (Machine Learning) où la machine est capable d'apprendre par elle-même, il a permis d'obtenir d'excellents résultats et une grande précision dans plusieurs champ de la vision par ordinateur. Le Deep Learning s'appuie sur un réseau de neurones artificiels s'inspirant du cerveau humain Ce réseau est composé de dizaines voire de centaines de « couches » de neurones, chacune recevant et interprétant les informations de la couche précédente. Dans ce travail, nous avons effectué la détection de texte dans les images de scènes naturelles en utilisant des méthodes de traitement d'images basées sur le réseau de neurones convolutifs (CNN: Convolutional neural network ), la méthode proposée s’appuie sur le principe de la segmentation sémantique afin de localiser les régions de l’image contenant du texte dans une scène naturelle, où le texte peut être dans différentes langues, couleurs, polices, tailles, orientations et formes.Text detection and recognition is an active research area that has attracted increasing attention in the research community of computer vision. The problem of text detection and recognition has manysolutions using different techniques. Deep Learning is a type of artificial intelligence technique derived from machine learning approaches where the machine is able to learn by itself. Exploring the powerful Deep Learning technology is one of recently solutions used and developed in computer vision which has achieved excellent results and high precision. Deep Learning based on artificial neurons network inspired by the structure and function of human brain. This network consists of multi-layer networks of neurons, each one receiving and interpreting information from the previous layer. In this work, we performed text detection in images of natural scenes using image processing methods based on Convolutional Neural Network (CNN), the proposed method relies on the principle of semantic segmentation in order to localize the region of scene text with different languages,colors, fonts, including various shapes, scales, and multi-oriented text.

Description

mémoire master inforamtique

Keywords

Localisation de Texte, Apprentissage profond, Réseau de neurones convolutifs, Détectionde texte de scène, Segmentation sémantique., Text Localization, Deep Learning, Convolutional Neural Network, Scene Text Detection, Semantic Segmentation.

Citation

universite of el oued