Accélération d’extraction des lignes du texte à base des modèles de cross résolution à deux niveaux
Loading...
Date
2018-06
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
University of Eloued جامعة الوادي
Abstract
نتيجة التطور التكنولوجي السريع في حياتنا اليومية أصبح التعرف الضوئي على الكلمات OCRمطلوبا أكثر في شتى المجالات. و إلى يومنا هذا مازالت هذه الأنظمة قيد التطوير و بشكل خاص أنظمة تجزئة اسطر النص. بحيث تم خلال السنوات الأخيرة إجراء العديد من البحوث و الدراسات بهدف تحسين طرق استخراج خطوط النص من ناحية السرعة و معدل الكشف . لكن جميع هذه الطرق في الغالب تستخدم صور ذات كثافة عالية تتراوح مابين إلى 150 إلى 300 dpi و ذلك يؤثر سلبا من ناحية السرعة على هذه العملية.
في أعمال سابقة , تم اقتراح تقنية تسمح بتسريع عملية استخراج الأسطر عن طريق نموذج الدقات المتعارضة الذي يقوم على فكرة تحجيم الصور و ذلك بهدف ربح الوقت أثناء تطبيق هذه العملية.
يقوم عملنا على نفس فكرة العمل السابق، و هي أن عملية تحديد مواقع الأسطر لا تتطلب دقة كبيرة مقارنتا مع العمليات الأخرى مثل تجزئة الكلمات أو الحروف. بحيث تعتبر الأسطر كوحدة قابلة للتصغير بدون التأثير على الدقة على عكس وحدات أخرى اصغر مثل الكلمات أو الحروف التي إذا تم تصغيرها فستؤثر بشكل مباشر و سلبي على عملية التعرف.
في هذا العمل, قمنا بشكل عام بإجراء تحسينات شاملة على العمل السابق و ذلك بالتحسين في عملية التصغير عن طريق الاعتماد في التصغير في هذه المرة على كل من عرض الخط و طول الأسطر عوض عن عرض الخط فقط مما سمح بالتسريع أكثر و زيادة معدل الكشف. كذلك تم إضافة طرق أكثر للاستخراج الأسطر و التحسين فيها من حيث الدقة.
تسمح طريقتنا بالحصول على نتائج أفضل من ناحية السرعة و معدل الكشف, و قد تم إثبات هذا عن طريق النتائج التجريبية المتحصل عليها باستعمال سبع طرق لاستخراج الأسطر. تم تجربة كل من هذه الطرق على قاعدتي بيانات اثنتين عوض عن واحدة, الأولى خاصة بالغة العربية و أما الثانية فتخص اللغة الإنجليزية.
En raison de l'évolution technologique rapide dans nos vies quotidiennes, Les systèmes OCR sont de plus en plus demandé/requis dans divers domaines. À ce jour, ces systèmes sont encore en développement, en particulier les méthodes de segmentation des lignes de texte. Ces dernières années, de nombreuses recherches et études ont été menées dans le but d'améliorer les méthodes de segmentation des lignes de texte en termes de vitesse et de taux de détection. Cependant, toutes ces méthodes utilisent souvent des images haute densité allant de 150 à 300 dpi, ce qui a un impact négatif sur la vitesse de ce processus.
Dans un travail précédent, une technique a été proposée pour accélérer le processus d'extraction des lignes de texte en utilisant des modèles de résolution croisée (XRM: Cross-Resolution Model), basés sur l'idée de réduction d'échelle d'image, afin de gagner du temps lors de l'exécution de ce processus. Notre travail est basé sur la même idée du travail précédent, qui est basée sur le fait que le processus de segmentation de texte en lignes ne nécessite pas une image haute résolution par rapport à d'autres processus tels que la segmentation des mots ou des lettres. Les lignes sont considérées comme une unité qui peut être redimensionnée sans affecter la précision contrairement aux unités plus petites comme les mots ou les lettres, qui si elles sont redimensionnées, affecteront négativement le processus de reconnaissance. Généralement, nous avons apporté d'importantes améliorations au travail précédent en améliorant le processus de redimensionnement qui est maintenant basé sur la taille du stylo et la hauteur des lignes au lieu de la taille du stylo uniquement. En outre, plus de méthodes de segmentation de lignes de texte ont été ajoutées, et leur précision a été améliorée.
Notre méthode permet de meilleurs résultats en termes de vitesse et de taux de détection, ce qui a été prouvé par les résultats expérimentaux obtenus en utilisant sept méthodes de segmentation. Chacune de ces méthodes a été testée sur deux bases de données, la première en arabe KHATT et la seconde en anglais IAM.
Description
memoire master inforamtique
Keywords
التعرف على الكلمات OCR , تجزئة النص الى اسطر, تحجيم, تسريع, OCR, Segmentation de texte en lignes, Redimensionnement, Accélérer