Exemple de capture de site avec HTTrack
Areaparks octobre 2002
nom du projet : areaparksadresse Web(URL) : www.areaparks.com
ne pas cocher les options : noms ISO9660
durée de la capture : 10 heures (modem 56k)
ajoutez dans règles de filtrage :
+*[name].areaparks.com/*
Pour limiter la taille de la capture, ajoutez dans les règles de filtrage
-ad.doubleclick.net/* -ad2.doubleclick.net/
-aeraguides.webbanners.net/*
-*.exe -*.zip
-forums.*
-*/spyellow/* (cette partie du site peut être capturée ensuite)
problèmes :
Publicité et taille du siteAutres exemples avec des difficultés similaires : Marian High | Kakadu | Travel West
solutions :
En fin de capture, trouvez avec Inforapid, par exemple, tous les fichiers avec cette chaîne : http://et remplacez la par #.La consultation en ligne n'appelle plus aucune des pages non capturées et l'affichage des images fournies par les partenaires ne se fait plus.
Plus aucun appel vers un site externe n'est possible, mais à ce stade, la capture est exploitable avec des élèves car elle n'oblige plus l'utilisateur à cliquer 4 à 5 fois à chaque changement de page.
ou
Trouvez avec inforapid search and replace, par exemple, tous les fichiers avec cette chaîne : src="http:// et remplacez la par src="#http://. Puis remplacez window.open par windowopen ou n'importe quelle instruction inconnue de l'interpréteur javascript.La consultation du site n'appelle plus aucune des pages des sites partenaires et la capture est exploitable avec des élèves car elle n'oblige plus l'utilisateur à cliquer 4 à 5 fois à chaque changement de page.