Exemple de capture de site avec HTTrack

httrack

Testée avec la version WinHTTrack Website Copier 3.33-beta-2 (+swf)

Camelot Theme Park juillet 2004

nom du projet : camelotthemepark
adresses Web(URL) :
www.camelotthemepark.co.uk
cocher : Essayer de détecter tous les liens
durée de la capture : 10 minutes (modem 56k)
ajoutez dans règles de filtrage :
+*.png +*.gif +*.jpg +*.css +*.js
-*.doc -*.zip

problèmes :

Fichiers non capturés, barre de navigation en Flash, Flash

Autres exemples avec des difficultés similaires : Discovery Cove | Ratanga | The Engine Room | Wild Waters Park | Rapids Water Park | Gulliver's Theme Park

solutions :

En fin de capture, plusieurs liens "more info" appellent des fichiers absents.
camelot1
Dans le répertoire camelotthemepark/www.camelotthemepark.co.uk/html on trouve des fichiers Flash nom_detect.swf à l'origine du problème.
L'utilitaire swf2html.exe téléchargeable sur le site Macromedia va permettre de trouver les adresses et fichiers manquants (on peut aussi utiliser SWFRIP).
Copiez les fichiers capturés dans un répertoire de votre choix et effectuez l'opération suivante :
camelot

Puis ouvrez (éditez) les fichiers html créés.

Tous les fichiers donneront le même résultat.
Ces liens n'ont pas été analysés.
Il devraient se trouver dans le répertoire www.camelotthemepark.co.uk/html comme nous l'indique le message du navigateur (voir plus haut) quand on clique sur les liens rompus.
En fait, il nous manque donc explore_brave_flash.htm, explore_merlins_flash.htm, explore_kings_flash.htm, explore_knights_flash.htm et explore_squire_flash.htm.
Nous allons néanmoins ajouter dans les adresses Web(URL) à capturer :

http://www.camelotthemepark.co.uk/html/explore_brave_flash.htm
http://www.camelotthemepark.co.uk/html/explore_knights_flash.htm
http://www.camelotthemepark.co.uk/html/explore_kings_flash.htm
http://www.camelotthemepark.co.uk/html/explore_merlins_flash.htm
http://www.camelotthemepark.co.uk/html/fun_merlins_flash.htm
http://www.camelotthemepark.co.uk/html/fun_jousting_flash.htm

On relance la capture, et tous les liens sont maintenant opérationnels.
Quelques fichiers zip et doc peuvent être capturés en modifiant les règles de capture.

Si les pop-ups ne sont pas bloqués, tout fonctionne maintenant.

hautHaut de la page

Avec javascript

W3C XHTML 1.0
W3C CSS