Outils pour capturer et convertir le Web

Comment GrabzIt convertit-il HTML en DOCX

Le HTML peut représenter de nombreuses structures compliquées telles que les DIV en ligne ou le SPAN côte à côte. Les éléments HTML se chevauchent et les bordures sont appliquées à différents éléments HTML. Pour la plupart, ce ne serait pas une approche sensée dans DOCX alors qu'il serait possible de créer floatEn incorporant des éléments HTML avec des zones de texte, cela entraînerait la quasi-totalité du contenu contenu dans les zones de texte, ce qui donnerait un document Word très laid et désordonné.

C’est à cause de ce problème que nous ignorons floatdes éléments HTML et des bordures de la plupart des éléments HTML. Cependant, nous respectons les frontières sur certains éléments HTML comme les cellules de tableau et l'alignement sur les éléments d'image par exemple.

Cela signifie-t-il que vous ne pouvez pas placer le contenu côte à côte? Non. Ceci est toujours possible en utilisant attributs CSS de colonne, Tableaux HTML et taquets de tabulation comme indiqué ci-dessous.

Si vous voulez qu'un document HTML soit capturé exactement comme indiqué à l'écran, il serait préférable de convertir le HTML en PDF car le format de fichier PDF utilise un positionnement absolu.

Arrêts de tabulation

Arrêts de tabulation sont une fonction DOCX spéciale qui est activée si floatLes éléments HTML, avec alignement du texte, sont contenus dans un élément HTML de 100% de largeur qui n'a pas lui-même d'alignement de texte spécifique. Ceci est important car cela signifie que l'alignement normal ne doit pas être appliqué aux éléments enfants. Ceci est fait en utilisant text-align:start. Notez que les arrêts de tabulation ne fonctionneront pas dans une table ou une liste.

Un exemple de ceci est montré ci-dessous.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>