Regex Scraper

Outil qui récupère le contenu suivant la regex renseignée et exporte les données dans un fichier excel.

L'outil peut être utilie pour récupérer des éléments dans un fil d'Ariane pour catégoriser des URLs par exemple. Ou bien récupérer les URLs dans une page, les ALT des images, les balises de hiérarchisations, les URLs des images... Il y a tant de possibilité.

Dans le cas où un login et un mot de passe sont requis :

Exemples de Regex :

  • Récupérer le <h1> de plusieurs URLs :
    <h1.*>(.*)</h1>
  • Récupérer le <title> de plusieurs pages :
    <title>(.*)</title>
  • Récupérer le contenu présent dans un div avec un id spécifique :
    <div.*id=\".*Amodifier.*\".*>(.*)</div>
  • Récupérer le contenu d'un span avec une classe spécifique :
    <span.*class=\".*Apersonnaliser.*\".*>(.*)</span>