fbpx
Salon du Search Marketing 2025 240 € 270 € HT Fin des billets standard 31/12/2024Prendre mon billet

Tutoriel maillage interne avec screaming frog

Par Patrick Valibus

Le maillage interne est une composante essentielle de l’optimisation du référencement naturel de votre site Internet. L’amélioration du SEO par le travail de la stratégie de liens passe par plusieurs étapes en commençant par la réflexion initiale comme je vous l’évoquais dans mon précèdent article sur la conception seo du maillage interne de fepsem.org pour qu’il soit évolutif.

L’étape intermédiaire consiste à faire un ou plusieurs crawls, car entre l’idée qu’on avait en conception, la vie naturelle du site et les interprétations des acteurs, il peut y avoir des écarts, c’est l’étape de recette, et comme le montre le schéma à droite, elle va révéler de nombreux points. Ce sera le sujet de cet article.

Ensuite, en dernier lieu on pourra aller travailler des méthodes avancées comme je l’évoquais dans l’article sur la comparaison cloaking versus obfuscation pour le PageRank Sculpting.

schéma de maillage interne screaming frog avec des erreurs

Crawler son site avec Screaming Frog

Screaming Frog SEO Spider est sans doute le crawler le plus utilisé par les SEO pour analyser un site. La liste des fonctionnalités est très longue tant l’outil est complet mais il vous permettra de parcourir de votre site à la manière du robot de Google qui le découvrirait et d’avoir une idée des Urls découvertes, des <title> proposées et des différents codes Http rencontré comme les 200,404, 301 ou même 503.

Si vous n’êtes pas consultant(e) SEO mais avez commandé un audit SEO auprès d’un(e) expert en référencement, il est fort probable que vous ayez reçu un fichier Excel listant les 404 et 301 à corriger. Envie d’en savoir plus sur ce point ? Découvrez l’article sur les objectifs d’un audit SEO.

Les objectifs d’un crawl de recette et de suivi dans le temps

Comme dans tout projet, il y a la théorie idéale et la dure réalité. Ici ce type de crawl va vous permettre de constater dans quelle mesure vous avez ou pas dévié de la trajectoire initiale. Nous allons ici nous focaliser sur certains points bien précis du crawl en lien avec l’optimisation du maillage interne.

Les recherches autour des codes HTTP :

  • La découverte et correction des 404 : Vous avez pu modifier des urls pour x ou y raisons, supprimer des articles, constaté que des liens externes ne pointent plus vers un contenu actif, bref, vous avez des 404. Screaming frog va vous l’indiquer car vous envoyer un mauvais signale à Google voir avez perdu un ou plusieurs backlinks.
  • La détection des redirections 301 : Vous avez sans doute mis en place des redirections mais pas forcément changé le contenu de l’url d’origine, bien que n’étant pas dramatique, ce point peut être corrigé en masse, nous allons voir comment.
  • L’identification des URLs intermédiaires : Ce point diffère un peu des 301, mais il s’agit ici d’identifier dans quelle mesure on évite les liens vers des urls technique comme p=[id-du-post] sur WordPress, ou des liens vers des URLs qui ne sont pas leur propre canonical.

En parallèle, ce crawl sera également l’occasion de découvrir où vont les liens, et peut être que la structure de maillage peut être revue.
Par exemple sur FePSeM, nous avons rationalisé le nombre de liens sortants vers le site de l’agence qui était présent dans chaque bloque auteur, pour renvoyer plutôt vers la fiche entreprise qui elle fait un lien vers le site de l’agence concerné. Cela limite la dispersion du Page Rank pour la concentrer dans le site avant de faire un plus gros lien vers le site vitrine de l’entreprise adhérente.

L’analyse du graphique de maillage dans Screaming Frog

Comme vous pouvez le voir dans le graphique en en-tête (que vous pouvez obtenir via le menu « visualisation -> diagramme de crawl fondé sur les forces ») on obtient un ensemble de ronds qui décrivent chacun une page avec des couleurs vertes et rouges, le rouge décrivant les urls en 404 ou 301.

Bien sur, ce graphique est surtout utile pour une vue macro et une idée de l’étendu des problèmes. Avec l’expérience vous apprendrez à identifier rapidement des typologies de problèmes ou des choix de maillage volontaire. (Dans tous les cas le travail lui sera surtout sur la vue tableau pour être exhaustive.)

Par exemple, ici les quelques ronds vers entouré de ronds rouges sont issus d’un pattern d’url complet qui avait changé, du coup deux pages « sommaire » de l’annuaire impliquait un mauvais renvoi vers ses urls enfants. Le rond vers foncé central en bas et la home, et son satellite en haut à gauche est la racine de la page annuaire. Les corrections en masse

Diagramme des forces dans screaming frog pour le maillage interne

Les corrections en masses du maillage interne

On ne va pas se mentir, si vous vous lancer dans ce chantier et il faut régulièrement prendre le courage de le faire, vous allez avoir des actions manuelles à faire qui ne seront pas les moments les plus épanouissants de vos journées.

A titre personnel, je ne suis pas fan des modules WordPress qui corrigent les erreurs 301 en automatique mais ils valent toujours mieux que rien surtout pour la partie remplacement des URLs redirigées dans le lien source. Vous éviterez ainsi à Google de perdre du temps. (Si vous avez des modules testés et approuvés, n’hésitez pas à me les faire passer pour que je les test. Pour ma part, je reste un grand fan du MySQL pour corriger un grand nombre d’URLs en une fois. Attentions, si vous n’êtes pas à l’aise, parlez-en à votre développeur pour effectuer ces actions en binôme.

Exemple de requête pour corriger en masse un pattern d’url :

UPDATE wp_posts
SET post_content = REPLACE(post_content, 'https://www.fepsem.org/actualite', 'https://fepsem.org/blog')
WHERE post_content LIKE '%https://www.fepsem.org/actualite%';

Ce code par exemple permet de remplacer l’intitulé de l’url de blog.

Vous pouvez également générer des requêtes SQL de ce type en utilisant Screaming Frog et Excel ou google sheet.

Ainsi vous activer dans screaming frog, l’utilisation du suivi des redirections, et en exportant : Rapport -> redirections -> toutes les redirections, vous pourrez utiliser l’url finale comme url de remplacement. La partie dans excel se fera avec une formule de ce type :

=CONCATENER("UPDATE wp_posts
SET post_content = REPLACE(post_content, '";A2;"', '";B2;"')
WHERE post_content LIKE '%";A2;"%';")

Cette formule vous génèrera l’ensemble des requêtes SQL de redirection, sous réserve que l’url d’origine soit dans la cellule A2 et l’url nouvelle(finale) dans b2. Encore une fois, chaque site à ses propres cas, mais l’utilisation combinée d’Excel et de Screaming Frog vous permettra un gain de temps non négligeable y compris pour industrialiser ce genre d’actions.

Un point positif qui n’est pas évident au premier abord est que vous aurez au delà d’une optimisation SEO du maillage interne, une visualité de la structure de votre site bien plus efficace que ça soit dans votre gestion au quotidien ou dans vos différents outils SEO.

Bilan de l’opération

Vous pouvez voir à droit le rendu final après correction qui ne comporte quasiment plus de rouge, (sauf quelques urls volontairement en no index comme lost password).

On observe également une répartition du PageRank (on parle plutôt de score de lien dans Screaming Frog) bien plus tranchée et interprétable en fonction de nos ambitions SEO.

Ces actions auront donc permis d’avoir une structure plus claire pour vous comme pour Google, de réduire les mauvais signaux transmis et de s’assurer qu’on ne perd plus de Page Rank au travers d’un maillage qui comporte des erreurs ou des 404.

Bien sur l’étape suivante serait d’utiliser des outils soit sur mesure (ce que nous faisons chez 410 Gone) soit d’utiliser un export Screaming Frog avec Gephi, ou encore des outils comme Seolyzer ou cocon.se qui permettent d’avoir une vue des liens pas uniquement descendante mais globale avec une simulation du PageRank plus réaliste). Mais tout cela fera l’objet d’un prochain article !

Schéma de maillage interne avec optimisation du PageRank