Outils pour capturer et convertir le Web

Extraire le texte des images

Des informations textuelles souvent importantes peuvent être stockées dans des images. pourtant Grattoir Web de GrabzIt offre la possibilité d'extraire automatiquement ces informations à l'aide de la reconnaissance optique de caractères. Bien que ce soit une forme de artificielle intelligence les résultats ne sont pas toujours parfaits.

Pour extraire du texte à partir d’images, utilisez le Utility.Image.extractText méthode comme indiqué ci-dessous.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

Ces exemples obtiennent tous les URL de l'image de la page Web, puis passent l'URL à la méthode extractText qui tente d'extraire des données textuelles de chaque image et renvoie toutes les correspondances sous forme de tableau de strings.

Si le texte de l'image est dans une langue différente, vous devez spécifier le code de langue correct à l'aide du format à deux lettres (ISO 639-1), comme indiqué ci-dessous.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');