Exemple de capture de site avec HTTrack

httrack

Areaparks octobre 2002

nom du projet : areaparks
adresse Web(URL) : www.areaparks.com
ne pas cocher les options : noms ISO9660
durée de la capture : 10 heures (modem 56k)
ajoutez dans règles de filtrage :
+*[name].areaparks.com/*
Pour limiter la taille de la capture, ajoutez dans les règles de filtrage
-ad.doubleclick.net/* -ad2.doubleclick.net/
-aeraguides.webbanners.net/*
-*.exe -*.zip
-forums.*
-*/spyellow/* (cette partie du site peut être capturée ensuite)

problèmes :

Publicité et taille du site

Autres exemples avec des difficultés similaires : Marian High | Kakadu | Travel West

solutions :

En fin de capture, trouvez avec Inforapid, par exemple, tous les fichiers avec cette chaîne : http://et remplacez la par #.
La consultation en ligne n'appelle plus aucune des pages non capturées et l'affichage des images fournies par les partenaires ne se fait plus.
Plus aucun appel vers un site externe n'est possible, mais à ce stade, la capture est exploitable avec des élèves car elle n'oblige plus l'utilisateur à cliquer 4 à 5 fois à chaque changement de page.

ou

Trouvez avec inforapid search and replace, par exemple, tous les fichiers avec cette chaîne : src="http:// et remplacez la par src="#http://. Puis remplacez window.open par windowopen ou n'importe quelle instruction inconnue de l'interpréteur javascript.
La consultation du site n'appelle plus aucune des pages des sites partenaires et la capture est exploitable avec des élèves car elle n'oblige plus l'utilisateur à cliquer 4 à 5 fois à chaque changement de page.
hautHaut de la page

Avec javascript

W3C XHTML 1.0
W3C CSS