=== AlmaWeb AI Visitor Analytics ===
Contributors: almawebdev
Donate link: https://almaweb.fr/ai-visitor-analytics
Tags: bot-detection, ai, analytics, security, monitoring
Requires at least: 5.0
Tested up to: 6.9
Requires PHP: 7.4
Stable tag: 1.2.2
License: GPLv3 or later
License URI: https://www.gnu.org/licenses/gpl-3.0.html

Détectez GPTBot, ClaudeBot, Gemini et 200+ crawlers IA. Suivez quels bots IA scrappent votre contenu et bloquez les scrapers indésirables.

== Description ==

**Deux faces du trafic IA, une extension puissante.**

Avec l'essor des plateformes IA comme ChatGPT, Claude, Gemini et Perplexity, votre site fait face à deux nouvelles réalités :
1. **Les bots IA qui extraient votre contenu** pour l'entraînement et l'indexation
2. **Les vrais visiteurs humains qui découvrent votre site via les outils IA** et cliquent pour le visiter

**AlmaWeb AI Visitor Analytics** est la seule extension WordPress qui suit LES DEUX :

**Détection des Bots IA**
Identifiez les bots des grandes entreprises IA (OpenAI, Google, Meta), les crawlers SEO (Ahrefs, Semrush), les scrapers agressifs, et même les bots "furtifs" cachés derrière des User-Agents standard.

**Suivi des Référents IA (NOUVEAU en v1.1.0)**
Suivez les vrais visiteurs humains provenant DES plateformes IA ! Quand quelqu'un pose une question à ChatGPT et clique sur un lien vers votre site, vous le verrez. Comprenez quels outils IA vous envoient du trafic, sur quelles pages ils atterrissent, et à quel point vos sources de trafic IA sont diversifiées.

= Pourquoi AlmaWeb AI Visitor Analytics ? =

Dans un monde où les IA consomment ET distribuent massivement le contenu web, il est crucial de savoir :

*   **Qui accède à votre contenu** - Identifiez précisément chaque bot IA (GPTBot, ClaudeBot, Google-Extended, etc.)
*   **Combien de données sont extraites** - Mesurez l'impact réel sur votre bande passante et vos ressources
*   **Quelles pages sont ciblées** - Découvrez quel contenu intéresse le plus les IA
*   **Les bots cachés** - Détectez même les bots qui masquent leur identité avec des User-Agents standard

= Fonctionnalités Clés =

**Détection Multi-Niveaux**

*   **Niveau 1 - User-Agent :** Détecte plus de 190 signatures de bots IA (OpenAI, Anthropic, Google, Meta, Amazon, Apple, etc.)
*   **Niveau 2 - Plage IP :** Vérifie les plages IP officielles (OpenAI, etc.) pour identifier les bots masqués
*   **Niveau 3 - Détection Furtive :** Détecte les bots invisibles comme ChatGPT Atlas qui utilisent des User-Agents de navigateurs standard

**Tableau de Bord Complet**

*   Statistiques en temps réel (visites humaines vs bots)
*   Graphiques d'évolution avec Chart.js
*   Répartition par famille IA (OpenAI, Google, Anthropic, etc.)
*   Top 10 des bots les plus actifs
*   Top 10 des pages les plus scrapées
*   Comparaison avec la période précédente
*   KPIs Business : taux de croissance, heures de pointe, distribution des intentions

**Journaux Détaillés**

*   Filtrage avancé par type de bot, IP, date
*   Recherche en temps réel
*   Export CSV complet
*   Détails complets : User-Agent, IP, URL, méthode de détection, famille IA, intention du bot
*   Badge spécial pour les bots "invisibles"

**Configuration Flexible**

*   Activer/désactiver le suivi
*   Option de blocage des mauvais bots (désactivée par défaut)
*   Rétention des données configurable (90 jours par défaut)
*   Nettoyage automatique quotidien des anciennes données
*   Exclure les utilisateurs connectés (optionnel)

**Respectueux de la Vie Privée**

*   Aucune donnée envoyée à des services tiers
*   Toutes les données restent dans votre base de données WordPress
*   Conforme au RGPD
*   Pas de cookies ni de suivi côté client
*   Télécharge uniquement des données publiques (plages IP)

= Bots Détectés =

L'extension détecte plus de 190 bots différents dans les catégories suivantes :

**Bots IA (Entraînement & Inférence IA) :**
OpenAI (GPTBot, ChatGPT-User, OAI-SearchBot, Operator), Anthropic (ClaudeBot, Claude-Web), Google AI (Google-Extended, Gemini, NotebookLM), Meta AI, Amazon Bedrock, Apple Intelligence, Perplexity, Mistral, xAI (Grok), Cohere, Character.AI, Stability AI, et plus de 100 autres.

**Moteurs de Recherche :**
Google, Bing, Yahoo, DuckDuckGo, Yandex, Baidu, etc.

**Crawlers SEO :**
Ahrefs, Semrush, Moz, Majestic, etc.

**Scrapers & Bots Malveillants :**
Scrapers de contenu, collecteurs d'emails, bots d'attaque, etc.

= Détection Avancée des Bots Furtifs =

Certains bots IA comme **ChatGPT Atlas** utilisent des User-Agents de navigateurs standard (Chrome, Safari) pour passer inaperçus. AlmaWeb AI Visitor Analytics les détecte en vérifiant leurs adresses IP par rapport aux plages IP officielles des fournisseurs IA.

**Exemple :**
Un visiteur avec le User-Agent "Mozilla/5.0 Chrome/..." provenant d'une IP dans la plage OpenAI (AS401518) sera identifié comme "ChatGPT Atlas" et marqué d'un badge "INVISIBLE" dans les journaux.

= Performance =

*   **Impact minimal :** Optimisé pour ne pas ralentir votre site
*   **Cache intelligent :** Les plages IP sont mises en cache pendant 24h
*   **Requêtes optimisées :** Index sur toutes les colonnes importantes
*   **Nettoyage automatique :** Suppression quotidienne des anciennes données

Protégez votre contenu et comprenez votre trafic comme jamais auparavant.

== Installation ==

1. Téléversez le dossier `almaweb-ai-visitor-analytics` dans votre répertoire `/wp-content/plugins/`.
2. Activez l'extension via le menu 'Extensions' dans WordPress.
3. Allez dans le nouveau menu 'Statistiques IA' pour voir le tableau de bord et les journaux.

== Page Officielle de l'Extension ==

Visitez la page officielle de l'extension pour des ressources supplémentaires et du support :
**https://almaweb.fr/ai-visitor-analytics**

== Foire Aux Questions ==

= Comment bloquer GPTBot sur WordPress ? =

AlmaWeb AI Visitor Analytics inclut un Pare-feu intégré (depuis la v1.2.0) qui vous permet de bloquer n'importe quel bot par intention ou famille depuis la page des paramètres. Pour bloquer GPTBot spécifiquement, allez dans IA Analytics > Paramètres > Pare-feu, et bloquez les bots avec l'intention "entraînement" ou la famille "OpenAI". Le bot recevra une réponse 403 et la visite bloquée sera journalisée.

= Mon contenu est-il utilisé pour entraîner ChatGPT ? =

C'est possible — et cette extension vous le dira. GPTBot (le crawler d'entraînement d'OpenAI) visite les sites web pour collecter des données destinées à entraîner les modèles IA. AlmaWeb AI Visitor Analytics détecte les visites de GPTBot en temps réel, vous montre quelles pages sont ciblées, et vous permet de le bloquer entièrement via le Pare-feu.

= Comment détecter les scrapers IA sur WordPress ? =

Installez AlmaWeb AI Visitor Analytics et il commence à détecter les scrapers IA immédiatement — sans aucune configuration. Il identifie 200+ bots dont GPTBot, ClaudeBot, Google-Extended, Meta-ExternalAgent, Bytespider (TikTok) et bien d'autres. Chaque visite est journalisée avec le nom du bot, la famille, l'intention (entraînement/scraping/inférence) et la page visitée.

= Quelle est la différence entre GPTBot et ClaudeBot ? =

GPTBot est le crawler d'OpenAI utilisé pour collecter des données d'entraînement pour ChatGPT et autres modèles OpenAI. ClaudeBot est l'équivalent d'Anthropic, utilisé pour entraîner Claude. Les deux sont détectés et suivis par cette extension. Vous pouvez voir leur fréquence de visite, quelles pages ils ciblent, et bloquer l'un ou l'autre via le Pare-feu.

= Cette extension ralentit-elle mon site ? =

Non, AlmaWeb AI Visitor Analytics est conçu pour être léger. L'analyse est faite côté serveur et optimisée pour un impact minimal sur les temps de chargement. Les plages IP sont mises en cache pendant 24 heures et toutes les requêtes de base de données utilisent des index pour des performances optimales.

= Quels types de bots peut-elle détecter ? =

L'extension détecte plus de 190 bots différents, incluant :
* **Bots IA** : GPTBot, ClaudeBot, Google-Extended, Gemini, Meta-ExternalAgent, Amazonbot, Applebot-Extended, Perplexity, Mistral, Grok, et bien d'autres
* **Moteurs de Recherche** : Googlebot, Bingbot, Yahoo Slurp, DuckDuckBot, Yandex, Baidu
* **Crawlers SEO** : AhrefsBot, SemrushBot, MJ12bot (Majestic), DotBot (Moz)
* **Scrapers malveillants** : Bots de scraping de contenu, collecteurs d'emails, etc.
* **Bots furtifs** : Bots qui masquent leur identité (détectés par vérification IP)

= Comment fonctionne la détection des bots furtifs ? =

Certains bots IA comme ChatGPT Atlas utilisent des User-Agents de navigateurs standard pour se cacher. L'extension les détecte en vérifiant si l'adresse IP du visiteur appartient aux plages IP officielles des fournisseurs IA (OpenAI, etc.). Ces informations sont téléchargées depuis des sources officielles et mises en cache localement.

= Puis-je bloquer les mauvais bots ? =

Oui, une option pour bloquer les bots identifiés comme malveillants est disponible dans les paramètres (désactivée par défaut). Vous pouvez l'activer si vous voulez empêcher l'accès aux scrapers agressifs tout en laissant passer les bots IA légitimes et les moteurs de recherche.

= L'extension est-elle conforme au RGPD ? =

Oui, l'extension est conçue pour respecter la vie privée :
* Toutes les données restent dans votre base de données WordPress
* Aucune donnée n'est envoyée à des services externes
* Pas de cookies ni de suivi JavaScript côté client
* Les adresses IP sont stockées uniquement pour l'analyse des bots
* Vous contrôlez la durée de rétention des données (90 jours par défaut)

= Des données sont-elles envoyées à des serveurs externes ? =

Non. L'extension télécharge uniquement des informations publiques (plages IP des bots) depuis des sources officielles (openai.com). Aucune donnée de votre site n'est jamais envoyée à l'extérieur. Tout est stocké localement dans votre base de données WordPress.

= Combien d'espace base de données l'extension utilise-t-elle ? =

Cela dépend de votre trafic. En moyenne, chaque visite enregistrée prend environ 1-2 Ko. Pour un site avec 1000 visites de bots par jour, cela représente environ 60-180 Mo sur 90 jours (période de rétention par défaut). Le nettoyage automatique quotidien supprime les anciennes données.

= Puis-je exporter les données ? =

Oui, la page des journaux inclut une fonction d'export CSV qui vous permet d'exporter toutes les données filtrées pour une analyse externe (Excel, Google Sheets, outils BI, etc.).

= L'extension fonctionne-t-elle avec les sites multilingues ? =

Oui, l'extension est entièrement traduite et compatible avec les sites multilingues. Elle est livrée avec des traductions françaises et anglaises, et vous pouvez ajouter vos propres traductions.

= Quelle différence avec les outils d'analytics classiques (Google Analytics, Matomo) ? =

Les outils d'analytics classiques se concentrent sur le trafic humain et ignorent souvent les bots. AlmaWeb AI Visitor Analytics fait le contraire : il se spécialise dans la détection et l'analyse des bots IA, scrapers et crawlers. Il complète vos outils d'analytics existants en vous donnant de la visibilité sur le trafic non-humain.

= Comment savoir si mon contenu est utilisé pour entraîner les IA ? =

L'extension identifie les bots d'entraînement IA (comme GPTBot, Google-Extended, etc.) et vous montre exactement quelles pages ils visitent, à quelle fréquence, et combien de données ils extraient. Cela vous permet de prendre des décisions éclairées sur le blocage ou l'autorisation de ces bots.

= L'extension supporte-t-elle les sites à fort trafic ? =

Oui, l'extension est optimisée pour la performance avec des index sur toutes les colonnes importantes, un système de cache, et un nettoyage automatique des anciennes données. Elle a été testée sur des sites recevant des milliers de visites par jour.

== Captures d'écran ==

1. Tableau de bord principal avec les statistiques de visites.
2. Page des journaux détaillant chaque requête de bot.
3. Page des paramètres de l'extension.

== Changelog ==

= 1.2.2 (2026-05-20) =
* Performance : requêtes DB du dashboard réduites jusqu'à 95% via cache des KPIs
* Performance : charge base de données par visite significativement réduite
* Base de données : structure de table optimisée — jusqu'à 20% de réduction de taille sur les installations existantes
* Suivi : les requêtes wp-cron.php ne sont plus journalisées

= 1.2.1 (2026-03-23) =
* Bibliothèque de bots v2.1.0 avec 10 nouveaux bots : Amzn-SearchBot, Amzn-User, NovaAct (Amazon), AzureAI-SearchBot (Microsoft), ExaBot, TavilyBot, kagi-fetcher (Search AI), ApifyBot, ApifyWebsiteContentCrawler, Spider
* Détection par plage IP étendue à Anthropic (160.79.104.0/21) et Google (Googlebot + crawlers spéciaux)
* Détection des bots furtifs étendue aux IP Anthropic et Google, pas seulement OpenAI

= 1.2.0 (2026-01-30) =
* **NOUVEAU : Pare-feu** - Bloquez les bots par intention (entraînement, scraping) ou par famille (ByteDance, Meta, etc.)
* Les bots bloqués sont journalisés avant d'être rejetés (403)
* Nouveau badge BLOQUÉ dans la vue des journaux
* Schéma de base de données mis à jour avec la colonne is_blocked

= 1.1.2 (2026-01-05) =
* Correction d'une erreur de base de données dans le calcul du Score d'Autorité IA
* Correction de la variable table_name manquante dans la fonction get_intention_counts()

= 1.1.1 (2026-01-05) =
* Traduction anglaise complète de toutes les chaînes de l'extension
* Traduction française complète avec fichiers .po et .mo mis à jour
* Correction des traductions manquantes dans le tableau de bord, les paramètres et les pages de journaux
* L'extension est maintenant entièrement bilingue (Anglais/Français)

= 1.1.0 (2025-12-20) =
* **NOUVEAU : Suivi des Référents IA** - Suivez les vrais visiteurs humains provenant DES plateformes IA (ChatGPT, Claude, Perplexity, etc.)
* Tableau de bord Sources IA avec graphique de distribution du trafic
* Score de diversité pour mesurer la dépendance aux sources de trafic IA
* Analyse des pages d'atterrissage pour les visites référées par l'IA
* Détection des paramètres UTM et des en-têtes referrer des plateformes IA
* Suivi de session pour les visiteurs référés par l'IA
* Tableau de bord amélioré avec graphique des Intentions des Bots
* Chart.js mis à jour vers v4.5.1
* Améliorations de conformité WordPress.org

= 1.0.0 (2024-12-20) =
* Version initiale
* Détection de plus de 190 bots IA (OpenAI, Anthropic, Google, Meta, Amazon, etc.)
* Détection des scrapers SEO et bots malveillants
* Détection User-Agent et Plage IP
* Bibliothèque de bots basée sur JSON pour des mises à jour faciles
* Tableau de bord en temps réel avec statistiques par famille IA
* Graphique d'évolution empilé avec Chart.js
* Comparaison avec la période précédente
* Top des bots IA et pages les plus scrapées
* Suivi et rétention des données configurables
* Nettoyage automatique des journaux avec période de rétention personnalisable

== Upgrade Notice ==

= 1.2.1 =
Bibliothèque de bots mise à jour (+10 bots), détection IP étendue à Anthropic et Google, amélioration de la détection des bots furtifs.

= 1.2.0 =
Nouvelle fonctionnalité Pare-feu ! Bloquez les bots indésirables par intention ou famille directement depuis les paramètres.

= 1.1.2 =
Correction de bug critique pour le calcul du Score d'Autorité IA. Mise à jour recommandée pour tous les utilisateurs.

= 1.1.1 =
Support bilingue complet ! Toutes les chaînes sont maintenant correctement traduites en anglais et français.

= 1.1.0 =
Nouvelle fonctionnalité de Suivi des Référents IA ! Suivez maintenant les vrais visiteurs humains provenant des plateformes IA comme ChatGPT, Claude et Perplexity. Voyez quels outils IA envoient du trafic vers votre site.

= 1.0.0 =
Version initiale de AlmaWeb AI Visitor Analytics.

== Vie Privée & Protection des Données ==

AlmaWeb AI Visitor Analytics prend votre vie privée au sérieux :

= Stockage des Données =

* Toutes les données sont stockées localement dans votre base de données WordPress
* Aucun service externe ne reçoit de données de votre site
* Vous avez le contrôle total sur la rétention des données (configurable de 1 à 365 jours)
* Le nettoyage automatique quotidien supprime les anciennes données selon vos paramètres

= Quelles Données Sont Collectées =

L'extension collecte les informations suivantes pour chaque visite :
* Chaîne User-Agent
* Adresse IP
* URL demandée
* Référent HTTP
* Méthode de requête (GET, POST, etc.)
* En-têtes HTTP (Accept, Accept-Language, Accept-Encoding)
* Horodatage

Ces données sont utilisées uniquement pour la détection des bots et l'analyse du trafic sur votre propre site.

= Conformité RGPD =

* Aucun cookie n'est défini par cette extension
* Pas de suivi côté client ni d'analytics basés sur JavaScript
* Les adresses IP sont stockées uniquement à des fins d'identification des bots
* Vous pouvez configurer la rétention des données pour respecter votre politique de confidentialité
* Les utilisateurs peuvent demander la suppression des données via les outils standard d'export/effacement de données WordPress

= Ce que cette Extension NE Fait PAS =

* N'envoie PAS vos données à des serveurs externes
* Ne suit PAS le comportement des utilisateurs finaux à des fins publicitaires
* N'utilise PAS de services d'analytics tiers
* Ne définit PAS de cookies
* Ne nécessite PAS le consentement de l'utilisateur (journalisation côté serveur uniquement)

== Services Tiers ==

Cette extension peut se connecter aux services tiers suivants **uniquement** pour télécharger les plages IP de bots disponibles publiquement :

= Plages IP OpenAI =

* **GPTBot :** https://openai.com/gptbot.json
* **ChatGPT-User :** https://openai.com/chatgpt-user.json
* **SearchBot :** https://openai.com/searchbot.json

**But :** Vérifier les adresses IP pour détecter les bots OpenAI, y compris les bots furtifs comme ChatGPT Atlas
**Données envoyées :** Aucune - l'extension télécharge uniquement les informations de plages IP publiques
**Mise en cache :** Les plages IP sont mises en cache pendant 24 heures pour minimiser les requêtes
**Politique de Confidentialité :** https://openai.com/privacy

= Notes Importantes =

* **Aucune donnée de votre site n'est jamais envoyée à ces services**
* L'extension télécharge uniquement des listes de plages IP disponibles publiquement
* Ces requêtes se font côté serveur (pas depuis les navigateurs des visiteurs)
* Les plages IP sont mises en cache localement pendant 24 heures
* Si le service externe n'est pas disponible, l'extension continue de fonctionner en utilisant la détection User-Agent

= Bibliothèques Intégrées =

**Chart.js v4.5.1** (intégré localement)
* Utilisé pour les visualisations du tableau de bord
* Aucune connexion externe requise
* Chargé uniquement sur les pages d'administration
* Licence : MIT

Tout le code tiers est inclus dans l'extension et ne nécessite pas de connexions CDN externes.

== Support & Documentation ==

= Obtenir de l'Aide =

Si vous avez besoin d'aide avec l'extension, voici vos options :

1. **Documentation :** Consultez la page des paramètres de l'extension pour l'aide en ligne et les infobulles
2. **Forum de Support WordPress :** Posez vos questions sur le forum de support WordPress.org
3. **Page Officielle :** Visitez https://almaweb.fr/ai-visitor-analytics pour contact et support

= Signaler des Bugs =

Si vous trouvez un bug, veuillez le signaler sur le forum de support WordPress.org avec :
* Version de WordPress
* Version de PHP
* Étapes pour reproduire le problème
* Tout message d'erreur que vous voyez

Vous pouvez également nous contacter directement via notre page officielle à https://almaweb.fr/ai-visitor-analytics

= Demandes de Fonctionnalités =

Nous accueillons les suggestions de fonctionnalités ! Veuillez les soumettre sur le forum de support WordPress.org ou contactez-nous via https://almaweb.fr/ai-visitor-analytics

== Contribuer ==

Cette extension est open source et accueille les contributions !

= Traduction =

L'extension est disponible en français et en anglais. Pour ajouter une nouvelle langue :

1. Copiez `languages/almaweb-ai-visitor-analytics.pot`
2. Traduisez avec Poedit ou un outil similaire
3. Enregistrez sous `almaweb-ai-visitor-analytics-{locale}.po` et compilez en `.mo`
4. Contactez-nous via https://almaweb.fr/ai-visitor-analytics pour soumettre votre traduction

== Crédits ==

**Développé par :** Yohan Ziri
**Entreprise :** AlmaWeb (https://almaweb.fr)
**Licence :** GPLv3 ou ultérieure

**Remerciements Spéciaux :**
* Chart.js pour les belles visualisations
* La communauté WordPress pour les retours et le support
* Tous les utilisateurs qui aident à améliorer la bibliothèque de détection de bots
