Exemple de capture de site avec HTTrack
Camelot Theme Park juillet 2004
nom du projet : camelotthemeparkadresses Web(URL) :
www.camelotthemepark.co.uk
cocher : Essayer de détecter tous les liens
durée de la capture : 10 minutes (modem 56k)
ajoutez dans règles de filtrage :
+*.png +*.gif +*.jpg +*.css +*.js
-*.doc -*.zip
problèmes :
Fichiers non capturés, barre de navigation en Flash, FlashAutres exemples avec des difficultés similaires : Discovery Cove | Ratanga | The Engine Room | Wild Waters Park | Rapids Water Park | Gulliver's Theme Park
solutions :
En fin de capture, plusieurs liens "more info" appellent des fichiers absents.
Dans le répertoire camelotthemepark/www.camelotthemepark.co.uk/html on trouve des fichiers Flash nom_detect.swf à l'origine du problème.
L'utilitaire swf2html.exe téléchargeable sur le site Macromedia va permettre de trouver les adresses et fichiers manquants (on peut aussi utiliser SWFRIP).
Copiez les fichiers capturés dans un répertoire de votre choix et effectuez l'opération suivante :
Puis ouvrez (éditez) les fichiers html créés.
Tous les fichiers donneront le même résultat.
Ces liens n'ont pas été analysés.
Il devraient se trouver dans le répertoire www.camelotthemepark.co.uk/html comme nous l'indique le message du navigateur (voir plus haut) quand on clique sur les liens rompus.
En fait, il nous manque donc explore_brave_flash.htm, explore_merlins_flash.htm, explore_kings_flash.htm, explore_knights_flash.htm et explore_squire_flash.htm.
Nous allons néanmoins ajouter dans les adresses Web(URL) à capturer :
http://www.camelotthemepark.co.uk/html/explore_brave_flash.htm http://www.camelotthemepark.co.uk/html/explore_knights_flash.htm http://www.camelotthemepark.co.uk/html/explore_kings_flash.htm http://www.camelotthemepark.co.uk/html/explore_merlins_flash.htm http://www.camelotthemepark.co.uk/html/fun_merlins_flash.htm http://www.camelotthemepark.co.uk/html/fun_jousting_flash.htm
On relance la capture, et tous les liens sont maintenant opérationnels.
Quelques fichiers zip et doc peuvent être capturés en modifiant les règles de capture.
Si les pop-ups ne sont pas bloqués, tout fonctionne maintenant.