Outils pour capturer et convertir le Web

Détermination de la taille des pages PDF lors du ciblage d'éléments HTML

Wednesday, Février 20, 2019

A l'origine, avant la mise à niveau récente du ciblage des éléments HTML dans le format PDF, la taille de la page PDF résultante était identique à celle de l'élément HTML ciblé. En effet, nous ne pouvions pas trouver un moyen fiable d'extraire uniquement la cible du fichier PDF autrement que de tout rogner, sauf l'élément HTML.

Cependant, après beaucoup de travail, nous avons réussi à fournir l'élément HTML ciblé, avec des marges autour de celui-ci, tout en restant compatible avec notre système de modèles. Permettre aux utilisateurs de spécifier des en-têtes et des pieds de page pour la première fois lors de l'utilisation de cette fonctionnalité.

Malheureusement, il est vite apparu qu'il existait une autre incohérence lors de l'utilisation de la fonctionnalité cible. Ces paramètres liés à l’orientation et à la taille de la page étaient ignorés. En effet, une nouvelle taille de page spéciale est utilisée pour le fichier PDF, tandis que la fonctionnalité cible fonctionne de la même manière dans notre API de capture d'image. En tant que document, elle devrait probablement être cohérente avec notre API DOCX si le code HTML ciblé était. L'élément apparaît en haut du document résultant.

Nous avons donc modifié le fonctionnement de cette fonctionnalité pour créer une page PDF avec la taille et l'orientation demandées, le contenu ciblé apparaissant dans le coin supérieur gauche, conformément à l'API DOCX.

Voir les derniers articles du blog