Outils pour capturer et convertir le Web

Prendre des captures d'écran de sites Web avec l'API de captures d'écran PythonAPI Python

La panneau de diagnostic peut vous aider à déboguer votre code!

L'API de capture d'écran de GrabzIt est très flexible et peut être appelée à partir d'un cronjob, d'une page Web ou d'une application. Le moyen le plus simple d'ajouter des captures d'écran de sites Web ou de convertir du HTML en images, PDF et DOCX. Pour votre application Python, procédez comme suit:

  1. Obtenez votre libre clé et secret.
  2. Téléchargez gratuitement Bibliothèque Python manuellement ou via pip installer et essayer le application de démonstration.
  3. Découvrez les bases sur le fonctionnement de l'API de GrabzIt en lisant l'aperçu ci-dessous.

Vue d'ensemble de l'API Python

Pour utiliser l’API, vous devez d’abord créer une instance du GrabzItClient classe. Puis passe ton clé et secret de votre compte GrabzIt au constructeur.

from GrabzIt import GrabzItClient

# Create the GrabzItClient class
# Replace "APPLICATION KEY", "APPLICATION SECRET" with the values from your account!
grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

Ensuite, vous devrez utiliser l'un des image, PDF, animation or table méthodes. Pour demander que le service GrabzIt capture l'URL qui lui a été transmise. Ou convertir HTML into une image, un fichier JPG ou DOCX.

# To take a image screenshot
grabzIt.URLToImage("https://www.tesla.com") 	
# Or to take a PDF screenshot
grabzIt.URLToPDF("https://www.tesla.com")
# Or to convert online videos into animated GIF's
grabzIt.URLToAnimation("http://www.example.com/video.avi")
# Or to capture table(s)
grabzIt.URLToTable("https://www.tesla.com")
# To convert HTML into a image
grabzIt.HTMLToImage("<html><body><h1>Hello World!</h1></body></html>")	
# Or convert HTML into a PDF document
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Or convert HTML into a CSV, XLSX or JSON document
grabzIt.HTMLToTable("<html><body><table><tr><th>Name</th><th>Age</th></tr>
    <tr><td>Tom</td><td>23</td></tr><tr><td>Nicola</td><td>26</td></tr>
    </table></body></html>")
# To convert HTML file into a image
grabzIt.FileToImage("example.html") 	
# Or convert HTML file into a PDF document
grabzIt.FileToPDF("example.html")
# Or convert HTML file into a CSV, XLSX or JSON document
grabzIt.FileToTable("tables.html")

Enfin, l’un des deux suivants save Des méthodes doivent être utilisées pour récupérer la capture. Le recommandé Save méthode nécessite l'URL d'un gestionnaire tel que handler.py. Cela permet à la capture d'être récupérée de manière asynchrone. Cela évite à votre application d'attendre la création d'une capture d'écran et évite d'avoir à interroger GrabzIl à plusieurs reprises, ce qui pourrait potentiellement être plus rapide.

grabzIt.Save("http://www.example.com/handler.py") 	
Toujours utiliser le SaveTo méthode sur localhost

L'autre save la méthode est la synchrone SaveTo méthode, alors que cela est plus simple à utiliser. Cela forcera votre application à attendre pendant la création de la capture d'écran.

Donc, il ne devrait être utilisé que dans des situations où le Save Cette méthode ne peut pas être utilisée, par exemple dans une application de bureau ou sur localhost.

filepath = "images/result.jpg"
grabzIt.SaveTo(filepath) 	

Plus d'options

Il existe de nombreuses autres options lors de captures d'écran de pages Web ou lors de la conversion de HTML. Comprenant; configuration de la hauteur et de la largeur du navigateur, de la hauteur et de la largeur de la capture d'écran. Le délai avant la capture et le format de la capture. Retrouvez toutes ces options et bien plus encore dans le GrabzIt Client Documentation.