Pureblog - Pure content. Any language.

← Retour

Visibilité en ligne

9 min de lecture

La visibilité de votre contenu en ligne est un point clé à ne pas négliger si vous souhaitez construire votre audience ou plus humblement partager vos réflexions. Pureblog a été conçu dès le départ pour permettre le meilleur référencement de votre contenu sur les moteurs de recherches (Google, Bing, etc) et sur les LLMs (ChatGPT, Claude, Gemini, etc).

Cette page explique les fonctionnalités intégrées à Pureblog qui améliore la visibilité de votre contenu.

Les signaux web essentiels (back to the basics)

Les signaux web essentiels (Core Web Vitals) sont des métriques Google évaluant l'expérience utilisateur réelle d'un site web via la vitesse de chargement (LCP), la réactivité (INP) et la stabilité visuelle (CLS). Ils sont essentiels pour le SEO (Search Engine Optimization ou facteurs de classement), ils ciblent des seuils spécifiques, notamment un LCP ≤ 2,5 s, un INP ≤ 200 ms et un CLS ≤ 0,1, analysés dans la Google Search Console.

Les 3 signaux web essentiels (Core Web Vitals) sont les suivants :

Ces éléments sont pris en charge par Pureblog de deux manières :

  1. L'intégralité de votre Pureblog est en HTML statique. C'est-à-dire qu'il est construit lors de la génération. Les pages sont légères et ne nécessitent aucun post-traitement dans le navigateur du visiteur. Cela signifie que le LCP et le INP restent extrêmement bas même si vous avez beaucoup de contenu.
  2. Toutes les pages ont un format unique basée sur un template dont vous avez le contrôle. Le template assure une cohérence au sein de votre Pureblog, tout en étant personnalisable (voir aussi comment modifier le design de votre Pureblog).

TODO AJOUTER UN SCREENSHOT DES CORE VITALS DE CE SITE UNE FOIS PUBLIE

Les éléments clés du référencement

Tous les éléments clés du référencement sont gérés dans Pureblog.

Lorsque vous observez attentivement un résultat de recherche Google, vous trouvez les éléments clés suivants :

Description de l'anatomie d'un résultat Google

Le titre du site est défini dans le fichier de configuration (config/config.yml) avec le paramètre general.site_title.

L'icône du site (favicon) est générée automatiquement par Pureblog à partir d'un simple emoji défini dans le paramètre theme.favicon_emoji du fichier de configuration (par exemple 📝). Pureblog produit un fichier SVG accessible à /favicon.svg et le référence sur toutes les pages du site, sans qu'aucune ressource graphique externe ne soit requise.

L'URL est définie par le slug de la page et le code langue. Le slug est obtenu à partir du nom du fichier Markdown. Le slug est important pour le référencement.

Le titre et la description de la page sont définis dans l'entête de l'article respectivement avec les tags title et excerpt.

Chaque article de blog possède une description (excerpt dans l'entête de votre article). Cette description est générée automatiquement en utilisant les 200 premiers caractères de votre article si elle n'est pas définie. La description est utilisée dans la balise meta de vos pages d'article (<meta name="description" content="..."/>).

La séparation entre le titre et l'URL

De nombreux blog utilisent le titre de la page comme URL. Nous pensons que c'est une mauvaise idée. En effet, le titre de la page peut contenir des mots "vides" (comme des "un", "les", etc). Or, l'URL ne nécessite pas ces mots "vides". L'URL doit être la plus courte possible et contenir les mots clés utiles au référencement. De plus, un changement dans le titre de la page pour une correction ne devrait pas casser les URLs déjà référencées sur d'autres sites ou dans les moteurs de recherche.

C'est pour cela que le titre de la page et l'URL sont deux notions différenciées dans Pureblog.

Le titre de la page (qui est repris dans la page et qui est visible pour les visiteurs) est défini dans l'entête de l'article (sous le tag title). C'est également ce titre qui est utilisé pour construire les indexes reprennant toutes les pages du site.

L'URL, quant à elle, est composée à partir du nom de fichier de l'article. Le nom de fichier est composé par <id>-<slug>.<lang>.md. L'identifiant id permet de faire le lien avec une même page écrite dans différentes langues. Le slug est l'URL qui sera utilisée. La langue est le code ISO en 2 caractères (lang).

Donc, un fichier portant le nom 002-ecrire-nouvel-article.fr.md sera référencé sur l'URL /fr/ecrire-nouvel-article/.

Le sitemap

Un sitemap (plan de site) est un fichier XML répertoriant les pages, vidéos et fichiers essentiels d'un site web pour les moteurs de recherche. Il agit comme une carte, facilitant le travail des robots d'indexation (crawl) pour découvrir et indexer efficacement le contenu, notamment pour les nouveaux sites ou les structures complexes.

Pour un blog, il permet également de s'assurer que toutes les pages sont référencées; même celles qui ne se trouvent plus sur la page principale du site (sur une 2e ou 3e page par exemple).

Pourquoi le sitemap est-il important ?

Pureblog génère automatiquement un fichier sitemap pour l'ensemble de votre Pureblog en tenant compte des traductions et de la disponibilité des différentes langues. Pour chaque page, la date de dernière modification (<lastmod>) est tirée de la date de l'article ; pour les pages d'index, c'est la date de l'article le plus récent dans la langue concernée qui est utilisée.

Le fichier sitemap est disponible à l'URL https://www.example.com/sitemap.xml et il est référencé automatiquement dans le robots.txt pour faciliter sa découverte par les crawlers (moteur de recherche et LLMs).

Exemple de sitemap pour ce Pureblog : https://www.pureblog.dev/sitemap.xml.

Les flux RSS

Le flux RSS (Really Simple Syndication) est un format de fichier XML qui permet de syndiquer et de diffuser automatiquement des contenus web (articles, actualités, podcasts) fréquemment mis à jour. Il permet aux utilisateurs de s'abonner à leurs sites favoris et de recevoir les nouvelles mises à jour sans avoir à visiter chaque site individuellement.

Les utilisateurs peuvent consulter les dernières publications sous forme de résumés ou de textes intégraux via des lecteurs dédiés comme Feedly, Inoreader ou encore des extensions de navigateur.

Pureblog fournit un flux RSS par langue. Les flux RSS sont générés automatiquement lors de la génération de votre Pureblog. Les flux RSS sont disponibles via des URLs sous la forme https://www.example.com/<lang>/feed.xml.

Pour la langue que vous êtes en train de lire sur ce site, le flux RSS est disponible sur https://www.pureblog.dev/fr/feed.xml et il est référencé sur chaque page dans une balise <link> d'autodécouverte (RSS autodiscovery) pour assurer sa découverte aisée par les applications tierces.

Un flux RSS est toujours composé d'un ensemble d'articles.

Chaque article contient :

Les fichiers de configuration pour les moteurs de recherches et les LLMs

Pureblog gère également un fichier de configuration supplémentaire pour les moteurs de recherche et les LLMs.

Le fichier robots.txt est un fichier texte placé à la racine d'un site web qui donne des instructions aux robots d'indexation (crawlers) sur les pages à explorer ou non. Il sert principalement à gérer le budget de crawl et à bloquer l'accès à des zones privées, mais n'empêche pas l'indexation si la page est liée ailleurs.

Pureblog se base sur le fichier robots.txt référencé dans la configuration (config/config.yml) sous le paramètre seo.robots_file. Lors de la génération, le fichier renseigné est copié dans le site final et la directive Sitemap: est ajoutée automatiquement à la fin (uniquement si elle n'est pas déjà présente). Vous pouvez donc gérer librement le contenu de votre robots.txt source sans craindre de doublon.

Le fichier robots.txt est disponible à l'URL https://www.pureblog.dev/robots.txt.

Autres fonctionnalités utiles

Pureblog est compatible avec les modes liseuses des navigateurs web sans altération de la mise en page.