Outils pour capturer et convertir le Web

L'API Web Scraper de GrabzIt, Data as a Service!

Grâce à l’API Web Scraper de GrabzIt, nous pouvons fournir à votre application des données récupérées sous forme de service Web vous permettant de: intIntégrez l'information récupérée into votre application. le intintégration de données into votre application est réalisée via un gestionnaire de rappel, qui est un script ou une application sur une URL accessible au public qui traite les données envoyées Grattoir Web de GrabzIt. Les fichiers complets sont postés sur ce gestionnaire de rappel de manière séquentielle. Ainsi, par exemple, il pourrait commencer par une série d'images avant de se terminer par JSON fichier, les données du fichier JSON peuvent ensuite être facilement analysées à l’aide des méthodes d’aide de la bibliothèque client. Cette API permet également à votre application de contrôler automatiquement le démarrage et l'arrêt des éraflures, ainsi que de demander le renvoi des résultats.

Pour commencer en premier créer une éraflure puis choisir Option d'URL de rappel à partir de l'onglet Options d'exportation et entrez l'URL de votre gestionnaire de rappel, par exemple http://www.example.com/handler/

Si vous rencontrez des problèmes avec votre gestionnaire de rappel, choisissez le mode Débogage dans l'onglet Options de montage. Ceci affichera la réponse renvoyée par le gestionnaire de rappel into les journaux.

Gestionnaire de rappel

Pour traiter les données récupérées dans votre gestionnaire de rappel, choisissez les options JSON ou XML dans l'onglet Exporter, car cela renvoie les données dans un format facilement lisible par tout langage orienté objet.

Pour les données qui ne sont pas des données JSON ou XML, vos options de traitement sont limitées car les données ne sont pas très lisibles par machine. La meilleure option peut donc être: save le fichier sur le disque ou dans une base de données.

Pour aider le intProcessus d'intégration GrabzIt fournit les API de raclage suivantes pour les langues ci-dessous. Cependant, comme notre code est open source et disponible sur GitHub il n'y a pas de raison que vous ne puissiez pas en créer un pour un langage de programmation non mentionné ici ou vous pouvez nous demander de créer une bibliothèque pour vous. Si vous le faites, pourquoi ne pas le partager avec le monde?

API ASP.NET Scraper API PHP Scraper API Python Scraper

Bien que le gestionnaire de rappel soit le meilleur moyen de intEn intégrant le racleur Web de GrabzIt avec votre application, vous pouvez également integrate via Amazon S3, Dropbox, FTP et WebDav.