Derniers passages de robots au 23/05/25
nom | accès à | Pays | ||
IP 216.73.216.220 | 2 pages en 5s | ÉTATS-UNIS | ||
SemrushBot | crawler | 1 page | ÉTATS-UNIS | |
IP 216.73.216.153 | 1 page | ÉTATS-UNIS | ||
SemrushBot | crawler | 1 page | ÉTATS-UNIS | |
IP 216.73.216.17 | 1 page | ÉTATS-UNIS | ||
IP 216.73.216.66 | 1 page | ÉTATS-UNIS | ||
IP 216.73.216.78 | 1 page | ÉTATS-UNIS | ||
IP 43.134.12.237 | 1 page | SINGAPOUR | ||
IP 216.73.216.226 | 1 page | ÉTATS-UNIS | ||
SemrushBot | crawler | 1 page | ÉTATS-UNIS | |
SemrushBot | crawler | 1 page | ÉTATS-UNIS | |
IP 194.246.81.112 | Spammeur | 1 page | PAYS-BAS | |
IP 141.94.194.132 | 1 page | FRANCE | ||
IP 216.73.216.206 | 1 page | ÉTATS-UNIS | ||
IP 185.246.210.131 | Zombie | 1 page | TCHÈQUE, RÉPUBLIQUE | |
IP 216.73.216.30 | 1 page | ÉTATS-UNIS | ||
SemrushBot | crawler | 1 page | ÉTATS-UNIS | |
IP 216.73.216.182 | 2 pages en 10s | ÉTATS-UNIS | ||
IP 216.73.216.158 | 1 page | ÉTATS-UNIS | ||
IP 216.73.216.194 | 2 pages en 3s | ÉTATS-UNIS | ||
511 572 visites de robots identifiés environ 85 par jour en 2025 170 aujourd'hui à 20:24 (+1 visiteurs) zombies : 13 visites / 14 requêtes - spammeurs : 32 visites |
D'où proviennent ces informations ?
Elles ont été obtenues à partir de $_SERVER["HTTP_USER_AGENT"] -$HTTP_USER_AGENT avec PHP 3-, $_SERVER ["QUERY_STRING"], $_SERVER ["SCRIPT_NAME"] et gethostbyaddr().Elles sont faussées par le filtre parfois mis en place par l'hébergeur (free.fr).
Dans les statistiques du site, les robots ne sont pas considérés comme des visiteurs, le navigateur et le pays d'origine qu'ils annoncent sont ignorés.
S'ils consultent plusieurs pages, ils ne sont pris en compte qu'une fois (sauf s'ils ne reviennent qu'après plus de 10 minutes - plus de 30 minutes pour Google Desktop, semrush, Bytespider).
La liste des visites est indicative car elle suppose une connexion parfaite avec MySQL, ce qui n'est pas le cas pour ce site. Mais l'hébergement est gratuit, alors ...
Les robots représentent au moins 78 % des visites en 2025 répartis ainsi :
- 30,97% de ces visites sont les robots de moteurs de recherche, d'indexation de pages, d'analyse des informations, de vérification des liens ou du code, d'optimisation SEO...
- 18,27 % proviennent de spammeurs (60,14 % tentent d'envoyer des emails, les 39,86 % restants spamment les fichiers journaux).
- 50,75 % recherchent des vulnérabilités.
Détection du robot
Cette routine est commentée dans la page sur les pièges à robots.
Il est nécessaire de stocker les identificateurs des autres visiteurs pour compléter la liste des robots qui fréquentent le site et celle de leurs "User Agents".
La base de données
Voici la structure de la table robots que j'utilise :# # Structure de la table `robots` # CREATE TABLE `robots` ( `heureacces` int(10) unsigned NOT NULL default '0', `heurearrivee` int(10) unsigned NOT NULL default '0', `nom` varchar(64) NOT NULL default '', `dernierepage` varchar(30) NOT NULL default '', `nombrepages` mediumint(8) unsigned NOT NULL default '0', KEY `heureacces` (`heureacces`), KEY `heurearrivee` (`heurearrivee`), KEY `nom` (`nom`), KEY `nombrepages` (`nombrepages`) ) TYPE=MyISAM;
En fonction de la place occupée par chaque champ chez votre prestataire, choisissez double ou datetime pour les heures, double ou int pour nombrepages, si nécessaire augmentez le nombre de caractères pour dernierepage.
Mise à jour de la base de données
Affichage des données
Nous disposons donc du nom du robot, de l'heure d'arrivée, de l'heure de la dernière page lue et du nombre de pages lues.
S'il n'y a qu'une page et des heures différentes, c'est que la page a été actualisée.
J'ai choisi d'afficher le nombre de pages lues et le temps passé à les lire.
Voilà pour le principe, à vous de voir ce que vous voulez afficher ou calculer.
Un script du même type est maintenant disponible ici