Logiciel scraping
Scrap, le logiciel indispensable pour SEO
Scraper définition
Automatiser toutes extractions sur internet. Au delà de cette définition littérale, scraper internet est une terminologie propre au milieu des référenceurs dits black hat.
Scraper est-ce légal?
Ceux ou celles édictant les règles du bon, du mal, de la face cachée.... bref le tout puissant (!) étant lui même le plus gros scrapeur du web, fait tout pour bannir les intrépides tentant à leur tour de venir automatiser leurs extractions. Lire le contenu du web, est le principe même de nos navigateurs, rien n'empêche l'automatisation de cette tâche, donc oui le scraping est bel et bien légal. Par contre, l'usage et l'utilisation que vous pourriez être amené à en faire, peut être tout à fait illégale, et cela dans de nombreux pays.
En France, par exemple l'intrusion dans les systèmes d'informations est illégale. Donc si avec l'aide des outils de scraping vous parvenez à lister une série de sites internet disposant de failles que vous connaissez, ce n'est pas le fait de les scraper qui est illégal mais bel et bien ce que vous ferez après....
Que récupérer en scrapant?
Tout.... ce qui est lu par vos navigateurs.
Quels sont les outils de scraping?
Il existe de nombreux logiciels de scraping, et je vous invite à nous faire part de vos retours d'expériences en commentaire de ce billet. Historiquement, dans tous les rassemblements virtuels ou physiques de la communauté des SEO, tout le monde va nous parler du bon vieux scrapbox. Sur le marché international il est l'un des premiers a être apparu, et s'est imposé par sa puissance. D'un accès rebutant de prime abord, il est puissant, rapide et quasiment paramétrable à l'infini par l'apport ou le dev spé de plug-ins externes.
Sur le marché Français :
Rddz scrap
Petit nouveau, sur le marché du scrap disponible en multilangues, se sont bien des développeurs Français qui se cachent derrière ce petit bijou. Forts d'une expérience de SEO, passés par tous les softs du marché, ils ont lancé en novembre 2012 leur premier logiciel : rddz.
Principal atout par rapport à scrapbox : une ergonomie et une puissance sans pareil! C'est simple, tout est paramétrable, tout est expliqué, et lorsque cela devient nécessaire un excellent support prémium est accessible à 10 euros par an! (vous pouvez sans aucun problème monter votre prix de support.... il est indispensable que ce soft vous permette d'en vivre de manière à le faire évoluer).
Que vous soyez développeur (le balisage et le langage xpath n'auront aucun secret pour vous en quelques minutes) ou SEO vous pourrez scraper tout et bien plus.
Prix Logiciel : 150 euros TTC
Mises à jour : Illimitées
Support : excellent
Efficacité : redoutable....
Lien officiel : rddz,logiciel scrap
Automate builder
Certainement un bon produit, mais tellement complexe à mettre en œuvre ! Et son support est juste mauvais, très mauvais. Dommage la promesse était très alléchante!
Prix Logiciel : 490 euros ht
Mises à jour : 1 an
Support : Très mauvais
Efficacité : Toujours impossible à dire..... grrrrr
Annuweb
Je le cite, quoi qu'il ne s’agisse pas vraiment d'un logiciel de scrap comme scrapBox, mais un logiciel de scrap dédié à une niche verticale de notre marché, l'automatisation de lecture d'annuaires de type pages jaunes.
Prix Logiciel : 159 euros ttc
Mises à jour : Illimitées
Support : Excellent
Efficacité : Parfaite