Utiliser Excel comme outil pour copier des données à partir du Web

Le scraping Web(Web scraping) consiste à extraire des données, des informations ou des images d'un site Web à l'aide d'une méthode automatisée. Pensez(Think) -y comme un copier-coller(copy and paste) entièrement automatique.

Nous écrivons ou utilisons une application pour accéder aux sites Web que nous voulons et faire une copie des choses spécifiques que nous voulons de ces sites Web. C'est beaucoup plus précis que de télécharger un site Web entier.

Comme tout outil, le web scraping peut être utilisé pour le bien ou pour le mal. Certaines des meilleures raisons de scraper des sites Web seraient de les classer dans un moteur de recherche en(search engine) fonction de leur contenu, de comparer les prix(price comparison shopping) ou de surveiller les informations boursières(stock market information) . Vous pourriez même l'utiliser comme un outil(research tool) de recherche en quelque sorte.

Comment puis-je gratter des sites Web avec Excel ?

Croyez-le ou non, Excel a depuis longtemps la capacité d'extraire des données de sites Web, du moins depuis Excel 2003 . C'est juste que le web scraping est quelque chose auquel la plupart des gens ne pensent pas(t think) , et encore moins l'utilisation d'un tableur(spreadsheet program) pour faire le travail. Mais c'est étonnamment facile et puissant. Apprenons comment cela se fait en créant une collection de raccourcis clavier Microsoft Office .(Microsoft Office keyboard)

Trouvez les sites que vous voulez gratter

La première chose que nous allons faire est de trouver les pages Web spécifiques à partir desquelles nous voulons obtenir des informations. Allons à la source et cherchons(source and search) sur https://support.office.com/ . Nous allons utiliser le terme de recherche(search term) "raccourcis fréquemment utilisés". Nous pouvons le rendre plus spécifique en utilisant le nom de l'application spécifique, comme Outlook , Excel , Word , etc. Il peut être judicieux de mettre en signet la page de résultats afin que nous puissions facilement y revenir.

Cliquez(Click) sur le résultat de la recherche(search result) , "Raccourcis clavier dans Excel pour Windows". Une fois sur cette page, recherchez la liste des versions d' Excel et cliquez sur Nouvelles versions(Newer Versions) . Maintenant, nous travaillons avec les derniers et les meilleurs.

Nous pourrions revenir à notre page de résultats de recherche et ouvrir les résultats de toutes les autres applications Office(Office apps) dans leurs propres onglets et les mettre en signet. C'est une bonne idée, même pour cet exercice. C'est là que la plupart des gens s'arrêteraient pour collecter des raccourcis Office , mais pas nous. (Office)Nous allons les mettre dans Excel pour pouvoir en faire ce que nous voulons, quand nous le voulons.

Ouvrir Excel et gratter

Ouvrez Excel et démarrez un nouveau classeur. Enregistrez le classeur en tant que raccourcis Office(Office Shortcuts) . Si vous avez OneDrive, enregistrez-le là-bas pour que la fonction AutoSave fonctionne.

Une fois le classeur enregistré, cliquez sur l' onglet Données .(Data)

Dans le ruban de l' onglet Données(Data tab) , cliquez sur Depuis le Web(From Web) .

La fenêtre de l'assistant À partir du Web s'ouvre. (From Web )C'est là que nous mettons l' adresse Web ou l'URL(web address or URL) du site Web à partir duquel nous voulons récupérer des données. Basculez vers votre navigateur Web et copiez(copy) l'URL.

Collez l'URL dans le champ URL de l' (URL)assistant À partir du Web(From Web wizard) . Nous pourrions choisir de l'utiliser en mode de base(Basic) ou avancé(Advanced) . Le mode avancé(Advanced mode) nous donne beaucoup plus d'options sur la façon d'accéder aux données du site Web. Pour cet exercice, nous n'avons besoin que du mode Basic. Cliquez sur (Click) OK .

Excel va maintenant tenter de se connecter au site Web. Cela peut prendre quelques secondes. Nous verrons une fenêtre de progression(progress window) , si c'est le cas.

La fenêtre du navigateur(Navigator) s'ouvrira et nous verrons une liste de tables du site Web sur la gauche. Lorsque nous en sélectionnons un, nous verrons un aperçu du tableau sur la droite. Sélectionnons le tableau Raccourcis fréquemment utilisés .(Frequently used shortcuts )

Nous pouvons cliquer sur l' onglet Affichage Web(Web View) pour voir le site Web réel, si nous devons rechercher la table que nous voulons. Lorsque nous le trouvons, nous pouvons cliquer dessus et il sera sélectionné pour l'importation.

Maintenant, nous cliquons sur le bouton Charger(Load) en bas de cette fenêtre. Il y a d'autres options que nous pourrions choisir, qui sont plus complexes et qui dépassent le cadre de notre premier grattage. Sachez simplement qu'ils sont là. Les capacités de grattage Web d'Excel sont très puissantes.

Le tableau Web(web table) sera chargé dans Excel après quelques secondes. Nous verrons les données sur la gauche, où le numéro 1 est dans l'image ci-dessous. Le numéro 2 met en évidence la requête(Query) utilisée pour obtenir les données du site Web. Lorsque nous avons plusieurs requêtes dans un classeur, c'est ici que nous sélectionnons celle que nous devons utiliser.

Notez(Notice) que les données entrent dans la feuille de calcul sous forme de tableau Excel. Il est déjà configuré pour que nous puissions filtrer ou trier les données.

Nous pouvons répéter ce processus pour toutes les autres pages Web contenant les raccourcis Office souhaités pour (Office)Outlook , Word , Access , PowerPoint et toute autre application Office(Office app) .

Garder les données grattées(Scraped Data Current) à jour dans Excel

En prime pour vous, nous allons apprendre à garder nos données grattées à jour dans Excel . C'est un excellent moyen d'illustrer à quel point Excel est puissant pour le grattage des données. Même avec cela, nous ne faisons que le grattage le plus basique qu'Excel(Excel) puisse faire.

Pour cet exemple, utilisons une page Web d'informations boursières comme (stock information)https://www.cnbc.com/stocks/ .

Passez en revue ce que nous avons fait auparavant et copiez et collez(copy and paste) la nouvelle URL à partir de la barre d'adresse(address bar) .

Vous accéderez à la fenêtre du navigateur(Navigator window) et verrez les tables disponibles. Sélectionnons les principaux indices boursiers américains(Major U.S. Stock Indices) .

Une fois les données récupérées, nous verrons la feuille de calcul suivante.

Sur la droite, nous voyons la requête pour les principaux indices boursiers américains(Major U.S. Stock Indexes) . Sélectionnez(Select) -le pour qu'il soit mis en surbrillance. Assurez(Make) -vous que nous sommes dans l' onglet Outils de tableau et dans la zone de (Table Tools)conception(Design) . Cliquez ensuite sur la flèche vers le bas sous Actualiser(Refresh) . Cliquez ensuite sur Propriétés de la connexion(Connection Properties) .

Dans la fenêtre Propriétés de la requête(Query Properties ) , sous l' onglet Utilisation , nous pouvons contrôler la façon dont ces informations sont actualisées. (Usage)Nous pouvons définir une période de temps spécifique pour rafraîchir, ou pour rafraîchir lorsque nous ouvrirons le classeur la prochaine fois, ou pour rafraîchir en arrière-plan, ou toute combinaison de ceux-ci. Une fois que nous avons choisi ce dont nous avons besoin, cliquez sur OK pour fermer la fenêtre et continuer.

C'est ça! Vous pouvez désormais suivre les cours des actions, les résultats sportifs ou toute autre donnée qui change fréquemment à partir d'une feuille de calcul Excel(Excel spreadsheet) . Si vous êtes bon avec les équations et les fonctions Excel , vous pouvez faire presque tout ce que vous voulez avec les données.(Excel)

Essayez peut-être d'identifier les tendances boursières, de gérer un pool de sports fantastiques au travail ou peut-être simplement de suivre la météo. Qui sait? Votre imagination et les données disponibles sur Internet , sont les seules limites.



About the author

Je suis un technicien Windows 10 et j'aide les particuliers et les entreprises à tirer parti du nouveau système d'exploitation depuis de nombreuses années. J'ai une richesse de connaissances sur Microsoft Office, y compris comment personnaliser l'apparence et personnaliser les applications pour différents utilisateurs. De plus, je sais utiliser l'application Explorer pour explorer et rechercher des fichiers et des dossiers sur mon ordinateur.



Related posts