Exemple de capture de site avec HTTrack

httrack

Martin Luther King juin 2002site modifié

nom du projet : MLK
adresse Web(URL) : http://seattletimes.nwsource.com/mlk/
durée de la capture : 1 heure (modem 56k)
Pour limiter la taille de la capture, ajoutez dans les règles de filtrage
-*.aiff

problèmes :

Fichiers non capturés et publicité

Autres exemples avec des difficultés similaires : Martin Luther King 2004 | Recycling | Extreme World | Herberton | Canobie

solutions :

Fichiers non capturés

En fin de capture, trouvez les fichiers qui n'ont pas été téléchargés et qui vous intéressent.
S'il vous manque http://seattletimes.nwsource.com/mlk/sound/promised_resample.wav
1. Créez le répertoire sound s'il n'existe pas dans la capture.
2. A l'aide de l'URL, avec dlexpert par exemple, téléchargez le puis copiez le dans le répertoire sound.
3. Editez le fichier votre répertoire de capture/nom du projet/seattletimes.nwsource.com/mlk/man/MLKsound.html
et remplacez
A HREF="http://seattletimes.nwsource.com/mlk/sound/dream_resample.wav"
par A HREF ="sound/dream_resample.wav"
4. Faites de même pour les autres fichiers manquants.

Plusieurs liens, dont celui de la photo de MLK sur page d'accueil sont restés absolus.
1. Vérifiez la présence du fichier dans la capture.
a. S'il n'y est pas, connectez vous et visitez la page.
b. Copiez l'image dans le répertoire de la capture correspondant à ses propriétés (clic droit puis propriétés).
2. Rectifiez le lien dans la page html (votre répertoire de capture/nom du projet/seattletimes.nwsource.com/mlk/index.html pour la photo de MLK).

La capture avec tous les fichiers présentant un intérêt est exploitable avec des élèves.

Publicité

Trouvez avec inforapid search and replace, par exemple, tous les fichiers avec cette chaîne : src="http:// et remplacez la par src="#http://.
Pour cette capture, comme les images des sites partenaires sont dans le répertoire ads.nwsource.com/Realmedia/ au lieu de seattletimes.nwsource.com/Realmedia/, il est aussi possible de remplacer src="http://seattletimes par src="../../ads puis ajouter ../ ou ../../ à src="../../ads dans les sous répertoires en fonction de la profondeur. C'est une méthode moins radicale mais qui demande beaucoup plus de temps.

La consultation du site n'appelle plus aucune image depuis les sites partenaires et la capture est exploitable avec des élèves car elle n'oblige plus l'utilisateur à cliquer 1 à 4 fois à chaque changement de page.

Quiz

Le Quiz, dont la fiche élève est inspirée, peut être capturé mais il ne peut pas être contrôlé hors connexion.
Une consultation du site permet d'avoir les réponses. Cette page peut être sauvegardée et liée si nécessaire.
hautHaut de la page

Avec javascript

W3C XHTML 1.0
W3C CSS