Outils pour capturer et convertir le Web

Comment compiler un jeu de données

Parfois quand construire un jeu de données le Grattoir Web plus de valeurs sont ajoutées into une colonne plutôt qu'une autre. Dans l'exemple ci-dessous, après la suppression de la première page, le nom John est ajouté à la colonne Nom avec trois couleurs. Sur la page suivante, le nom David est ajouté avec deux autres couleurs. Pour donner le jeu de données suivant.

NomCouleur
JohnJaune
DavidRouge
Vert
Bleu
Violet

Cependant, ce tableau est trompeur car il ne montre pas quel nom a été trouvé avec quelles couleurs. Au lieu de cela le pad Cette méthode peut être utilisée pour ajouter automatiquement des cellules vides à la fin des colonnes du jeu de données jusqu'à ce que toutes les colonnes aient la même longueur. Un exemple de la pad La méthode utilisée est indiquée ci-dessous.

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

Ces instructions décrivent un ensemble de données qui ressemble à ceci.

NomCouleur
JohnJaune
Rouge
Vert
DavidBleu
Violet

Nous pourrions améliorer cela davantage en spécifiant les padValue paramètre de la pad méthode pour être le nom trouvé par le grattoir. Comme dans cet exemple, il n'y a qu'un seul nom par page pour les instructions de suppression.

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

Ce qui met un nom dans chaque cellule vide de la colonne de nom, comme indiqué ci-dessous.

NomCouleur
JohnJaune
JohnRouge
JohnVert
DavidBleu
DavidViolet