Outils pour capturer et convertir le Web

Détermination de la taille des pages PDF lors du ciblage d'éléments HTML

20 Février 2019

À l'origine, avant les récentes mises à niveau du ciblage des éléments HTML dans le PDF, la taille de la page PDF résultante était la même que celle de l'élément HTML ciblé. En effet, nous n'avons pas trouvé de moyen fiable d'extraire uniquement la cible du PDF autre que de recadrer tout le reste, à l'exception de l'élément HTML.

Cependant, après beaucoup de travail, nous avons réussi à fournir l'élément HTML ciblé, avec des marges autour, tout en étant compatible avec notre système de modèles. Permettre aux utilisateurs de spécifier des en-têtes et des pieds de page pour la première fois lors de l'utilisation de cette fonctionnalité.

Malheureusement, il est vite devenu évident qu’il y avait une autre incohérence lors de l’utilisation de la fonctionnalité cible. Ces paramètres liés à l’orientation et à la taille de la page étaient ignorés. En effet, essentiellement, une nouvelle taille de page spéciale est utilisée pour le PDF, alors que la fonctionnalité cible fonctionne de la même manière dans notre API de capture d'image, car elle est basée sur un document, elle devrait probablement être cohérente avec notre API DOCX si le HTML ciblé L'élément apparaît en haut du document résultant.

Nous avons donc modifié le fonctionnement de cette fonctionnalité pour créer une page PDF avec la taille et l'orientation demandées, avec le contenu ciblé apparaissant dans le coin supérieur gauche, en cohérence avec l'API DOCX.

Voir les derniers articles du blog