5 services OCR en ligne gratuits testés et révisés

Vous avez un document PDF(PDF document) ou une image que vous souhaitez convertir en texte ? Récemment, quelqu'un m'a envoyé un document par courrier que je devais modifier et renvoyer avec des corrections. La personne n'a pas pu localiser une copie numérique, j'ai donc été chargé de mettre tout ce texte au format numérique.

Il n'y avait aucun moyen que je passe des heures à tout retaper, alors j'ai fini par prendre une belle photo de haute qualité du document, puis j'ai brûlé mon chemin à travers un tas de services OCR en ligne pour voir lequel me donnerait le meilleur résultats.

Dans cet article, je vais passer en revue quelques-uns de mes sites préférés pour l' OCR qui sont gratuits. Il convient de noter que la plupart de ces sites fournissent un service gratuit de base, puis proposent des options payantes si vous souhaitez des fonctionnalités supplémentaires telles que des images plus grandes, des documents PDF de plusieurs pages , différentes langues de saisie, etc.

Il est également bon de savoir à l'avance que la plupart de ces services ne pourront pas correspondre au formatage de votre document d'origine. Ce sont principalement pour extraire du texte et c'est tout. Si vous avez besoin que tout soit dans une mise en page ou un format(layout or format) spécifique , vous devrez le faire manuellement une fois que vous aurez obtenu tout le texte de l' OCR .

De plus, les meilleurs résultats pour obtenir le texte proviendront de documents avec une résolution de 200 à 400 DPI(DPI resolution) . Si vous avez une image à faible DPI(DPI image) , les résultats ne seront pas aussi bons.

Enfin, il y avait beaucoup de sites que j'ai testés qui ne fonctionnaient(t work) tout simplement pas . Si vous effectuez une reconnaissance optique des caractères en ligne gratuite sur Google ,(OCR) vous verrez un tas de sites, mais plusieurs des sites figurant dans les 10 premiers résultats n'ont même pas terminé la conversion. Certains expiraient, d'autres donnaient des erreurs et certains restaient bloqués sur la page "conversion", donc je n'ai même pas pris la peine de mentionner ces sites.

Pour chaque site, j'ai testé deux documents pour voir à quel point le résultat serait bon. Pour mes tests, j'ai simplement utilisé mon iPhone 5S pour prendre une photo des deux documents, puis je les ai téléchargés directement sur les sites Web pour les convertir.

Au cas où vous voudriez voir à quoi ressemblaient les images que j'ai utilisées pour mon test, je les ai jointes ici : Test1 et Test2 . Notez qu'il ne s'agit pas des versions pleine résolution des images prises à partir du téléphone. J'ai utilisé l'image en pleine résolution(resolution image) lors du téléchargement sur les sites.

OCR en ligne

OnlineOCR.net est un site propre et simple qui a donné de très bons résultats lors de mon test. La principale chose que j'aime, c'est qu'il n'y a pas des tonnes de publicités partout, ce qui est généralement le cas avec ce type de sites de services de niche .(niche service)

ROC en ligne gratuit

Pour commencer, sélectionnez votre fichier et attendez(file and wait till) la fin du téléchargement. La taille maximale de téléchargement pour ce site est de 100 Mo. Si vous vous inscrivez pour un compte gratuit, vous bénéficiez de quelques fonctionnalités supplémentaires telles qu'une plus grande taille de téléchargement, des PDF(PDFs) de plusieurs pages , différentes langues de saisie, plus de conversions par heure, etc.

Ensuite, choisissez votre langue d'entrée(input language) , puis choisissez le format de sortie(output format) . Vous pouvez choisir entre Word , Excel ou Texte brut(Plain Text) . Cliquez sur(Click) le bouton Convertir(Convert) et vous verrez le texte affiché en bas dans une boîte avec un lien de téléchargement(download link) .

sortie ROC

Si tout ce que vous voulez, c'est le texte, copiez-le et collez(copy and paste) -le simplement à partir de la boîte. Cependant, je vous suggère de télécharger le document Word(Word document) car il fait un travail étonnamment efficace en conservant la mise en page du document original.

Par exemple, lorsque j'ai ouvert le document Word(Word document) pour mon deuxième test, j'ai été surpris de constater que le document comprenait un tableau à trois colonnes, tout comme dans l'image.

sortie OCR en ligne

De tous les sites, celui-ci était de loin le meilleur. Cela vaut vraiment la peine de s'inscrire si vous avez besoin de faire beaucoup de conversions.

Pour être complet, je vais également créer un lien vers les fichiers de sortie créés par chaque service afin que vous puissiez voir les résultats par vous-même. Voici les résultats d ' OnlineOCR : Test1 Doc et Test2 Doc(Test1 Doc and Test2 Doc) .

Notez que lors de l'ouverture de ces documents Word sur votre ordinateur, vous recevrez un message dans Word indiquant qu'il provient d' Internet et que l'édition(Internet and editing) a été désactivée. C'est parfaitement acceptable car Word ne(Word doesn) fait pas confiance aux documents provenant d' Internet et vous n'avez vraiment pas besoin d'activer l'édition si vous souhaitez simplement afficher le document.

i2OCR

Un autre site qui a donné de très bons résultats était i2OCR . Le processus est très similaire : choisissez votre langue, votre fichier, puis appuyez sur Extraire le texte(Extract Text) .

i2ocr

Vous devrez attendre une minute ou deux ici car ce site prend un peu plus de temps. De plus, à l' étape 2(Step 2) , assurez-vous que votre image s'affiche à l'endroit dans l'aperçu, sinon vous obtiendrez un tas de charabia en sortie. Pour une raison quelconque, les images de mon iPhone s'affichaient en mode portrait(portrait mode) sur mon ordinateur, mais en paysage lorsque j'ai téléchargé sur ce site.

sortie i2ocr

J'ai dû ouvrir manuellement l'image dans une application de retouche photo, la faire pivoter de 90 degrés, puis la faire pivoter en mode portrait, puis l'enregistrer à nouveau. Une fois(Once) terminé, faites défiler vers le bas et il vous montrera un aperçu du texte avec un bouton de téléchargement(download button) .

Ce site s'est plutôt bien comporté avec la sortie du premier test, mais n'a pas si bien réussi avec le deuxième test qui avait la disposition en colonnes(column layout) . Voici les résultats d'i2OCR : Test1 Doc et Test2 Doc(Test1 Doc and Test2 Doc) .

OCR gratuit

Free-OCR.com prendra vos images et les convertira en texte brut(plain text) . Il n'a pas d'option pour exporter au format Word(Word format) . Choisissez votre fichier, sélectionnez une langue puis cliquez sur Démarrer(Start) .

Le site est rapide et vous obtiendrez la sortie assez rapidement. Cliquez simplement sur(Just click) le lien pour télécharger le fichier texte(text file) sur votre ordinateur.

freeocr

Comme avec NewOCR mentionné ci-dessous, ce site met en majuscule tous les T du document. Je ne sais pas pourquoi cela ferait cela, mais pour une raison étrange, ce site et NewOCR(site and NewOCR) l'ont tous deux fait. Ce n'est pas grave de le changer, mais c'est un processus fastidieux que vous ne devriez vraiment pas avoir à faire.

Voici les résultats de FreeOCR : Test1 Doc et Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader en ligne

Pour utiliser FineReader Online , vous devez créer un compte, ce qui vous donne droit à un essai gratuit de 15 jours pour l' OCR jusqu'à 10 pages gratuitement. Si vous n'avez besoin d'effectuer qu'une seule OCR pour quelques pages, vous pouvez utiliser ce service. Assurez(Make) -vous de cliquer sur le lien de vérification(verify link) dans l' e- mail de confirmation(confirmation email) après votre inscription.

bon lecteur en ligne

Cliquez sur Reconnaître(Recognize) en haut, puis cliquez sur Télécharger(Upload) pour sélectionner votre fichier. Choisissez votre langue, le format de sortie, puis cliquez sur Reconnaître(Recognize) en bas. Ce site a une interface propre et pas de publicité aussi.

Lors de mes tests, ce site a pu récupérer le texte du premier document de test(test document) , mais il était absolument énorme lorsque j'ai ouvert le document Word(Word doc) , j'ai donc fini par le refaire et choisir le texte brut(Plain Text) comme format de sortie(output format) .

Pour le deuxième test avec les colonnes, le document Word(Word document) était vide et je n'ai même pas trouvé le texte. Je ne sais pas ce qui s'est passé là-bas, mais il ne semble pas pouvoir gérer autre chose que de simples paragraphes. Voici les résultats de FineReader : Test1 Doc et Test2 Doc.

NouveauOCR

Le site suivant, NewOCR.com , était OK, mais pas aussi bon que le premier site. Tout d'abord, il y a des publicités, mais heureusement pas une tonne. Vous sélectionnez d'abord votre fichier, puis cliquez sur le bouton Aperçu(Preview) .

télécharger une image

Vous pouvez ensuite faire pivoter l'image et ajuster la zone où vous souhaitez rechercher du texte. C'est à peu près comme la façon dont le processus de numérisation(scanning process) fonctionne sur un ordinateur avec un scanner connecté.

image ROC

Si le document comporte plusieurs colonnes, vous pouvez cocher le bouton Analyse de la mise en page( Page layout analysis) et il essaiera de diviser le texte en colonnes. Cliquez sur(Click) le bouton OCR(OCR button) , attendez quelques secondes qu'il se termine, puis faites défiler vers le bas lorsque la page est actualisée.

Dans le premier test, il a obtenu tout le texte correctement, mais pour une raison quelconque, chaque T du document a été mis en majuscule ! Aucune idée pourquoi il ferait cela, mais il l'a fait. Dans le deuxième test avec l' analyse de page(page analysis) activée, il a obtenu la plupart du texte, mais la mise en page était complètement décalée.

Voici les résultats de NewOCR : Test1 Doc et Test2 Doc.

Conclusion

Comme vous pouvez le voir, la gratuité ne vous donne malheureusement pas vraiment de très bons résultats la plupart du temps. Le premier site mentionné est de loin le meilleur car non seulement il a fait un excellent travail de reconnaissance de tout le texte, mais il a également réussi à conserver le format du document original.

Si vous avez juste besoin de texte, la plupart des sites Web ci-dessus devraient pouvoir le faire pour vous. Si vous avez des questions, n'hésitez pas à commenter. Prendre plaisir!



About the author

Je suis un ingénieur logiciel avec plus de deux ans d'expérience dans les applications mobiles et de bureau. J'ai une expertise dans les mises à jour Windows, les services et Gmail. Mes compétences font de moi le candidat idéal pour des tâches telles que le développement d'applications Windows ou la maintenance de clients de messagerie.



Related posts