Outils pour capturer et convertir le Web

Améliorations apportées au racleur Web pour 2019

Vendredi, Mars 8, 2019

Outre une nouvelle conception et une multitude de corrections de bugs, nous avons apporté des améliorations considérables au racleur Web de GrabzIt, notamment:

  • Prise en charge de l'extraction du contenu contenu dans les styles CSS
  • Vous pouvez maintenant choisir le pays à partir duquel un raclage est exécuté. Pour le moment, les choix sont les États-Unis ou le Royaume-Uni.
  • Vous pouvez maintenant choisir si vous respectez ou non les règles robots.txt. Par défaut, une éraflure le fait.
  • Les données relatives peuvent désormais être automatiquement associées ensemble, ce qui est utile lorsque vous avez des données présentes sur certains éléments HTML mais pas sur d'autres. En associant ces éléments ensemble, les valeurs apparaîtront par rapport aux éléments de données corrects dans l'ensemble de données résultant.
  • Lors de la création d'un jeu de données, différentes colonnes peuvent appartenir à différents modèles, ce qui signifie que certaines colonnes peuvent être remplies à partir d'un type de page et d'autres colonnes à partir de différents types de page. Un exemple de ceci serait une page de liste de produits et une page de détails de produit. Cela vous permettrait d'obtenir les détails généraux de la page de liste, puis les informations détaillées de la page de détail du produit.
  • Une autre façon dont le générateur de jeu de données a été amélioré est de permettre aux effets d'une opération, telle qu'un contient, moins que etc., d'être appliqués à toutes ou à certaines colonnes.
  • Il existe maintenant plusieurs nouvelles commandes disponible à partir de l'assistant de raclage.
    • Supprimer - vous pouvez désormais supprimer des éléments, ce qui est utile dans certaines circonstances pour empêcher la lecture répétée des mêmes éléments.
    • Défilement - le Web Scraper peut désormais faire défiler les éléments HTML qui le prennent en charge.
    • Hover - cette commande place la souris au-dessus d'un élément spécifié, ce qui peut être utile pour révéler des informations.
    • Pagination - il s'agit d'une nouvelle fonctionnalité de l'action Cliquer et permet d'effectuer automatiquement la pagination sur les liens de pagination sélectionnés. Cela signifie que même si le grattoir clique quelque part dans les données paginées, dans le cadre du grattage, il retrouvera son chemin vers la page paginée actuelle pour continuer avec le grattage.
  • La meilleure partie de GrabzIt Grattoir Web c'est que vous pouvez l'utiliser gratuitement tous les mois. Alors qu'attendez-vous pour essayer et s'il vous plaît nous faire part de vos commentaires, nous aimerions faire du nôtre le meilleur grattoir en ligne!

Voir les derniers articles du blog