Exemple de capture de site avec HTTrack

httrack

La version 2004 est en Flash avec des videos (.asx)

La capture ne pose pas de problème.

Adventure City juin 2002

nom du projet : adventurecity
adresse Web(URL) : www.adventurecity.com
cocher : Essayer de détecter tous les liens
ne pas cocher les options : noms ISO9660
durée de la capture : 2/3 minutes (modem 56k)

problèmes :

  1. n° de compteur au bas des pages d'accueil (index.html et index-2.html) et du bon de réduction absents
  2. cadre gris au lieu d'un texte déroulant

Autres exemples avec des difficultés similaires : Herberton | Firstenergy | Yorba

solutions :

  1. Dans le répertoire _vti_bin/fpcount.exe se trouvent 2 fichiers index???.html. Ce sont des fichiers "gif" (voir illustration du 2), il faut les renommer (remplacer .html par .gif ).
    répertoire site local
    Il faut éditer les pages d'accueil (index.html et index-2.html) et remplacer
    img src="_vti_bin/fpcount.exe/index????.html?Page=nomdepage.htm|Image=1"
    par
    img src="_vti_bin/fpcount.exe/index????.gif".
    Il faut éditer la page acoupon.htm et faire de même.

  2. Il faut alors se connecter et visiter la page d'accueil du site www.adventure.com puis attendre qu'elle soit complètement chargée.
    Dans le répertoire Temporary Internet Files, il faut trier les fichiers par adresse Internet, puis rechercher www.adventurecity.com.
    Temporary Internet Files
    Là, il faut copier les fichiers ".class" dans le répertoire www.adventurecity.com/applets/textscroll de la capture (ce n'est plus nécessaire avec WinHTTrack 3.23).
    Si les fichers ac2.txt et ac3.txt manquent, copiez les depuis le cache.
    Pour chaque fichier il faut ôter le chiffre avec les crochets [1] ajoutés lors de la copie.
    Parce que l'applet "TextScroll" a besoin de connaître l'emplacement du texte à afficher, le plus simple c'est de copier ou déplacer les fichiers www.adventurecity.com/ac2.txt et ac3.txt dans www.adventurecity.com/applets/textscroll.
    Il faut encore indiquer dans la déclaration de l'applet le chemin pour value. Il faut donc remplacer value="ac dans les fichiers www.adventurecity.com/index.html, index-2.html et kidcity.htm par value="applets/textscroll/ac.
    "TextScroll" a besoin d'adresses absolues dans les fichiers ac2.txt et ac3.txt , il faut donc modifier ces deux fichiers et remplacer ^^setURL(http://www.adventurecity.com) par ^^setURL(file:///chemin complet d'accès au fichier) par exemple ^^setURL(file:///C:/HTTrack/adventurecity/www.adventurecity.com/index.html) si vos captures sont sur le disque C, dans le répertoire Httrack.
    Si vous gravez cette capture, il faudra modifier toutes ces lignes. Le plus simple est encore de supprimer toutes les lignes avec ^^setURL ou d'accepter qu'en cliquant sur le texte déroulant, une page d'erreur s'affiche.
attentionIl faut tout reprendre car une nouvelle capture efface pratiquement toutes les modifications apportées manuellement. (Ici, seul le problème n°1 doit être réglé.)
On peut ajouter www.imenu.com dans les URL à capturer ou +www.imenu.com dans les règles de filtrages des options à définir, mais www.imenu.com est un site géant et sans grand intérêt.
On peut ne récupérer que la partie de site traitant des restaurants, et modifier manuellement tous les liens vers www.imenu.com, mais c'est un gros travail !

Les problèmes avec les applets Java peuvent n'apparaître qu'une fois la capture terminée car si le site a été visité, Internet Explorer les trouve dans le cache. Les captures interrompues ont souvent des réactions étranges liées à ce cache qui est néanmoins bien pratique pour récupérer ce que le logiciel de capture n'est pas en mesure de télécharger.

hautHaut de la page

Avec javascript

W3C XHTML 1.0
W3C CSS