Outils pour capturer et convertir le Web

Conseils sur l'écriture de HTML pour la conversion

L'API de GrabzIt vous permet de convertir n'importe quel HTML into PDF, DOCX, images et plus encore. Pour ce faire, vous devez transmettre régulièrement du code HTML à notre API. Par exemple, quelque chose comme le HTML montré dans l'exemple suivant.

<html>
<body>
<h1>Hello World</h1>
</body>
</html>

Notez que cet exemple HTML a inclus les balises HTML et BODY, mais cela n'est pas obligatoire si vous souhaitez simplement convertir un extrait de code HTML. Cependant, si vous n'ajoutez pas les balises HTML et BODY, celles-ci seront automatiquement ajoutées pour vous comme dans un navigateur normal. Pour contrer cela, vous pouvez spécifier du CSS pour supprimer tout remplissage et marges supplémentaires sur la balise BODY, comme indiqué ci-dessous.

<style>
body{margin:0;padding:0}
</style>

Si vous souhaitez inclure du JavaScript, des images ou du CSS dans le code HTML que vous allez convertir, vous pouvez fournir ces ressources dans un manoir en ligne ou référencé. Par exemple, le code ci-dessous montre comment créer des ressources dans le HTML d'une manière en ligne.

<html>
<head>
<script>
document.getElementsByTagName('H1')[0].innerText = 'Goodbye';
</script>
<style>
h1{
color:red;
}
</style>
</head>
<body>
<img width="16" height="16" alt="star" src="
SKudfOulrSOp3WOyDZu6QdvCchPGolfO0o/XBs/fNwfjZ0frl3/zy7////wAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAACH5BAkAABAALAAAAAAQABAAAAVVICSOZGlCQAosJ6mu7fiyZeKqNKToQGDsM8hBADgUXoGA
iqhSvp5QAnQKGIgUhwFUYLCVDFCrKUE1lBavAViFIDlTImbKC5Gm2hB0SlBCBMQiB0UjIQA7" />
<h1>Hello World</h1>
</body>
</html>

Comme vous pouvez le voir dans l'exemple ci-dessus, JavaScript et CSS sont contenus directement dans la page HTML et comment l'image a été transformée into URL de données.

Si nous voulions référencer ces ressources à la place, nous devrons nous assurer que toutes les URL liées à ces fichiers utilisent des URL absolues, qui sont également accessibles au public. Cela signifie que l'URL contient toutes les informations nécessaires pour localiser une ressource. Ne pas utiliser d'URL absolues est la principale raison images, CSS et JavaScript non rendus lors de la conversion HTML.

Pour ce faire, le JavaScript, le CSS et l'image devraient être mis into des fichiers séparés puis référencés dans le HTML, qui ressemblerait à l'exemple ci-dessous.

<html>
<head>
<script src="http://www.example.com/myscript.js"></script>
<link rel="stylesheet" type="text/css" href="http://www.example.com/mystyle.css">
</head>
<body>
<h1>Hello World</h1>
<img width="16" height="16" alt="star" src="http://www.example.com/star.gif" />
</body>
</html>