Scraping web légal en 2026 : ce que vous pouvez faire, ce que vous ne pouvez pas

Q: Le scraping web est-il interdit en France ?

Non par défaut. Le RGPD s'applique dès lors que des données personnelles sont collectées. L'objectif du scraping détermine sa légalité.

Q: Quelle est la différence entre scraping et crawling ?

Le crawling explore et indexe des pages web. Le scraping extrait des données spécifiques depuis ces pages. Les deux peuvent être combinés.

Guide du scraping web légal en France 2026 : RGPD, CGU, directive base de données. Ce qui est autorisé, ce qui est interdit, et les bonnes pratiques.

“Est-ce que je peux scraper ce site ?” C'est une des questions les plus fréquentes quand on parle d'automatisation de données. La réponse n'est pas simple — elle dépend du type de données, de l'utilisation prévue et des conditions du site ciblé. Voici un guide pratique sur le scraping web légal en 2026 : ce que vous pouvez faire, ce que vous ne pouvez pas, et les zones grises à connaître.

Ce que dit le droit en France

En France, il n'existe pas de loi qui interdit explicitement le web scraping. Mais plusieurs cadres légaux s'appliquent selon les cas.

Le RGPD (données personnelles)

C'est le cadre le plus important. Dès que vous scrapez des données qui permettent d'identifier une personne (nom, email, numéro de téléphone, profil LinkedIn), le RGPD s'applique. Vous devez avoir une base légale pour collecter ces données et les traiter.

Concrètement : scraper des données B2B (nom d'entreprise, secteur, chiffre d'affaires) pour de la prospection est généralement acceptable si vous avez un intérêt légitime documenté. Scraper des données personnelles pour les revendre ou les utiliser sans base légale : c'est une infraction RGPD.

Les conditions générales d'utilisation

La plupart des sites web interdisent le scraping dans leurs CGU. Techniquement, cette interdiction n'a pas toujours de valeur légale contraignante — mais elle peut servir de base à une action pour violation contractuelle, notamment si vous avez un compte sur la plateforme.

La règle pratique : ne jamais scraper en étant connecté avec un compte personnel ou professionnel. Si vous scrapez en anonyme des données publiques, le risque légal est limité. Si vous scraper en utilisant un compte, vous avez accepté les CGU qui l'interdisent.

La directive sur la base de données (sui generis)

En Europe, les bases de données bénéficient d'une protection spécifique si leur constitution a nécessité un investissement substantiel. Scraper une grande partie d'une telle base peut constituer une extraction illicite — même si les données individuelles sont publiques.

Ce que vous pouvez faire sans risque majeur

Scraper vos propres données

Vos propres données depuis des plateformes qui ne proposent pas d'export facile. Votre historique de commandes, vos métriques de performance, votre catalogue produits — c'est clairement dans vos droits.

Données publiques B2B pour la prospection

Les informations publiques sur les entreprises (raison sociale, secteur, dirigeants, depuis des registres officiels comme le RNCS) sont généralement scrapables légalement avec une base légale d'intérêt légitime pour la prospection B2B.

Veille de prix et de marché

Surveiller les prix de vos concurrents sur des sites d'e-commerce publics est une pratique courante et généralement acceptée. Les CGU de certains sites l'interdisent explicitement — mais sans mécanisme d'identification (compte), le risque légal est limité.

Agrégation de contenus publics

Agréger des contenus publics (articles de presse, publications officielles, offres d'emploi) pour de la veille ou de l'analyse est généralement légal, dans la limite du droit d'auteur (pas de reproduction intégrale de contenu protégé).

Ce qu'il faut éviter

Scraper des données personnelles sensibles : emails, numéros de téléphone, données de santé
Surcharger les serveurs : des requêtes trop fréquentes peuvent être assimilées à une attaque DoS
Contourner des mesures de protection technique : captchas, authentification — c'est illégal en droit européen
Revendre des données scrapées sans vérifier les droits associés
Scraper des plateformes avec un compte en violation des CGU

Les bonnes pratiques techniques

Si vous scrapez légalement, appliquez ces règles pour réduire les risques et le bruit :

Respectez le fichier robots.txt du site (il indique les pages à ne pas crawler)
Espacez vos requêtes (1 à 2 secondes minimum entre chaque)
Identifiez votre bot dans le User-Agent (si pertinent)
Préférez l'API officielle quand elle existe
Stockez le minimum de données nécessaire, pas tout ce que vous pouvez obtenir

En résumé

Le scraping web est un outil puissant — et comme tout outil puissant, il demande une utilisation réfléchie. Les cas d'usage légaux et utiles sont nombreux ; les zones grises existent mais sont navigables avec le bon conseil.

Consultez notre guide complet sur le web scraping ou discutez de votre projet de scraping avec nous pour avoir une analyse de votre cas spécifique.

FAQ

Le scraping web est-il interdit en France ?

Non par défaut, mais des cadres légaux s'appliquent. Le RGPD s'applique dès lors que des données personnelles sont collectées. Certaines bases de données bénéficient d'une protection sui generis. L'objectif du scraping détermine sa légalité.

Faut-il déclarer à la CNIL les données scrapées ?

Si les données permettent d'identifier des personnes physiques, le RGPD s'applique. Une base légale doit être identifiée (intérêt légitime, consentement, obligation contractuelle). Une consultation juridique est recommandée pour les volumes importants.

Quelle est la différence entre scraping et crawling ?

Le crawling explore et indexe des pages web (c'est ce que fait Google). Le scraping extrait des données spécifiques depuis ces pages. Les deux peuvent être combinés : on crawle d'abord pour trouver les pages, puis on scrape pour en extraire les données.