Comment extraire le texte surligné d'un PDF en tant que fichier texte ?

La surbrillance de texte dans un document PDF est pratique pour marquer rapidement les zones importantes auxquelles vous pourrez accéder plus tard. Vous pouvez utiliser Microsoft Edge pour mettre en surbrillance PDF(Microsoft Edge to highlight PDF)  ou tout autre logiciel fourni avec la fonction de surbrillance PDF . Parfois, vous avez peut-être également ressenti le besoin de n'avoir que le texte en surbrillance afin que vous puissiez avoir le résumé du PDF contenant tout le texte essentiel. Si vous cherchez des moyens d'enregistrer uniquement le texte en surbrillance d'un PDF en tant que fichier TXT , cet article peut être utile.

Extraire le texte surligné du PDF

Il existe des logiciels gratuits et un service pour extraire le texte surligné d'un fichier PDF et l'enregistrer sous forme de fichier texte :

  • Extracteur de surbrillance PDF
  • Lecteur Foxit
  • Sumnotes.net
  • DyAnnotationExtractor.

Vérifions ces logiciels PDF Highlight Extractor un par un.

1] Extracteur de surbrillance PDF

Logiciel d'extraction de surbrillance PDF

PDF Highlight Extractor est l'une des options les plus simples pour extraire le texte surligné d'un fichier PDF . Cet extracteur de surbrillance de texte PDF (PDF text highlight extractor)open source possède deux fonctionnalités qui attirent l'attention. Vous pouvez prévisualiser le texte en surbrillance(preview highlighted text) du PDF sur l'interface du logiciel.

La deuxième fonctionnalité est que vous pouvez définir la page de début ou de fin ou la plage de pages pour extraire le texte(set start or end page or page range to extract the text) . Ainsi, au lieu de numériser l'intégralité du PDF , vous pouvez définir des numéros de page pour obtenir le texte en surbrillance.

Une autre bonne fonctionnalité est que vous avez la possibilité d' enregistrer le texte en texte brut(save text as plain text) ou en fichier Excel(Excel file) .

Sur son interface, ajoutez votre fichier PDF en utilisant l'option donnée, puis appuyez sur le bouton Extraire . (Extract)Décochez l'option Toutes les pages(All Pages) si vous souhaitez définir la plage de pages ou la laisser telle quelle. Une fois le texte récupéré, vous pouvez le prévisualiser. Enfin, appuyez sur le bouton Texte(Text) ou Excel pour enregistrer le texte en surbrillance.

Vous pouvez télécharger ce logiciel à partir d ' ici(here) . Java est également nécessaire pour utiliser ce logiciel. Alors, installez Java (si ce n'est pas déjà fait) et exécutez ce logiciel à utiliser.

2] Lecteur Foxit

Extraire le texte surligné du PDF

Foxit Reader est l'un des meilleurs lecteurs PDF gratuits . Vous pouvez ouvrir plusieurs fichiers PDF dans des onglets distincts, mettre en surbrillance un PDF(PDF) , ajouter une note, exporter des commentaires(export comments) , ajouter des signatures(add signatures) , etc. Parmi la vaste liste de fonctionnalités, l'extraction de texte en surbrillance à partir d' un PDF(PDF) est également présente. La meilleure partie de cette fonctionnalité est qu'elle enregistre également les numéros de page avec le texte extrait(saves page numbers along with the extracted text) .

Pour récupérer le texte en surbrillance du PDF , ouvrez le fichier PDF sur son interface et accédez à l' onglet Commentaire . (Comment)Dans cet onglet, cliquez sur l' option Exporter disponible dans la section (Export)Gérer les commentaires(Manage Comments) . Vous verrez l' option Texte en surbrillance . (Highlighted Text)Utilisez cette option et vous pourrez ensuite enregistrer tout le texte en surbrillance dans un fichier texte.

Voici(Here) le lien de téléchargement de ce logiciel. Lors de l'installation, vous devez sélectionner une installation personnalisée(custom installation) pour inclure uniquement les composants requis de ce logiciel.

3] Sumnotes.net

Notes de synthèse

Sumnotes.net est un service gratuit qui vous permet d'annoter des PDF(PDF) ainsi que d'extraire le texte surligné. Tout le texte en surbrillance est visible séparément dans la barre latérale gauche. À l'aide de cette barre latérale, vous pouvez également supprimer le texte en surbrillance dont vous n'avez pas besoin(remove highlighted text that you don’t need) , puis télécharger le reste du texte en surbrillance.

Avant de télécharger le texte en surbrillance, vous pouvez également inclure des numéros de page et exclure(exclude) le texte en surbrillance d'une couleur spécifique(highlighted text of specific color) .

Vous avez également la possibilité d' enregistrer le texte en surbrillance du PDF en tant que fichier Excel(save highlighted text from PDF as Excel) ou Word . Donc, les fonctionnalités sont bonnes. Vous pouvez vous inscrire avec un forfait gratuit, puis extraire 50 faits saillants(extract 50 highlights) ou annotations par téléchargement(per download) , ce qui est suffisant dans la plupart des cas.

Voici(Here) le lien vers sa page d'accueil. Pour extraire le texte en surbrillance d' un PDF , ajoutez un PDF à partir d'un PC ou de Google Drive . Lorsque le PDF est téléchargé, les annotations et le texte en surbrillance sont visibles sur le côté gauche. Utilisez l' option Télécharger les annotations(Download Annotations) et vous pourrez ensuite enregistrer le texte en surbrillance dans un fichier au format TXT , XLSX ou DOC .

4] DyAnnotationExtractor

Logiciel de ligne de commande DyAnnotationExtractor

Le logiciel DyAnnotationExtractor(DyAnnotationExtractor) peut vous aider à extraire le texte et les commentaires(comments) surlignés d'un document PDF. C'est un logiciel en ligne de commande , mais son utilisation est très simple. (command-line)Une seule commande récupère le texte mis en surbrillance dans le fichier PDF d'entrée .

Vous pouvez obtenir ce logiciel en utilisant ce lien(this link) . Téléchargez(Download) son fichier ZIP puis extrayez-le. Pour faciliter l'exécution de la commande, vous devez également placer le PDF dans le même dossier où vous avez extrait ce logiciel. Après cela, ouvrez la fenêtre d' invite de commande(Command Prompt) dans ce dossier. Vous pouvez le faire en tapant cmd dans la zone d'adresse de ce dossier, puis en appuyant sur la touche Entrée(Enter) .

Lorsque la fenêtre CMD est ouverte, ajoutez le fichier BAT de ce logiciel, la commande d'entrée comprenant le chemin du PDF d'entrée , la commande de sortie et le nom du fichier de sortie avec l'extension '.txt'. La commande complète sera-

DyAnnotationExtractor.bat -input path of input PDF -output outputfilename.txt

Exécutez la commande. Attendez(Wait) quelques secondes et le fichier texte brut sera prêt contenant tout le texte en surbrillance et les commentaires extraits de ce PDF . Le fichier de sortie est enregistré dans le même dossier d'entrée.

Voici donc quelques options que vous pouvez utiliser pour extraire le texte en surbrillance du PDF , puis enregistrer la sortie sous forme de fichier texte. J'espère que(Hope) ces aide.



About the author

Je suis un ingénieur windows,ios,pdf,erreurs,gadgets avec plus de 10 ans d'expérience. J'ai travaillé sur de nombreuses applications et frameworks Windows de haute qualité tels que OneDrive for Business, Office 365, etc. Mes travaux récents ont inclus le développement du lecteur pdf pour la plate-forme Windows et travaillé à rendre les messages d'erreur plus clairs pour les utilisateurs. De plus, je suis impliqué dans le développement de la plate-forme ios depuis quelques années maintenant et je connais très bien ses fonctionnalités et ses particularités.



Related posts