blog.pagesd.info

Aller au contenu | Aller au menu | Aller à la recherche

Tag - Référencement

Fil des billets - Fil des commentaires

lundi 19 octobre 2009

Amélioration du blog de l'Ardèche

Cette fois-ci, j'ai cherché à améliorer le blog de l'Ardèche. Jusqu'à présent, c'était presque plus proche d'une saisie de pages à la chaine que d'un véritable blog digne de ce nom.

Dans un premier temps, j'ai fait évoluer la partie administration du blog. J'ai amélioré le contrôle utilisateur employé pour le wysiwyg afin qu'il soit plus adapté lors de la saisie du résumé des billets. Et j'en ai profité pour gérer de façon plus cohérente le contrôle du code html saisi, notamment en ce qui concerne la vérification des urls relatives.

Comme pour l'instant j'utilise surtout le blog pour saisir des informations destinées à l'agenda, j'ai décidé d'ajouter la saisie d'une période de dates à chaque billet. Ce n'est peut-être pas très orthodoxe, mais au moins je peux faire ressortir cette période lors de l'affichage des billets.

J'ai aussi fait quelques essais pour générer en automatique le résumé des billets en fonction des premières lignes du billet complet. Mais il faudrait que je revoie ça autrement. Mais au moins, je suis certain de toujours avoir un résumé (ou plutôt une accroche) que je peux utiliser pour définir la balise <description> de la page dans laquelle est publiée le billet.

Après m'être occupé de mes besoins, je me suis consacré à ceux des visiteurs. Pour commencer (et pour me faire un peu plaisir), j'ai mis en place le format hAtom pour publier les billets du blog.

<div class="hentry" id="post-23">
  <h3 class="entry-title">
    <a href="/blog/2009/10/2eme-festival-soupes-pays-ardeche-meridionale.aspx" rel="bookmark">2ème Festival des Soupes du Pays de l'Ardèche Méridionale</a>
  </h3>
  <p class="published" title="2009-10-17T14:25:32">Publié le samedi 17 octobre 2009, 14:25.</p>
  <div class="entry-content">
    ...
  </div>
</div>

Puis j'ai travaillé à la navigation. Jusqu'à présent, on pouvait consulter le contenu d'un billet mais une fois là, il fallait savoir se débrouiller pour poursuivre la consultation du blog ou du site. C'est maintenant de l'histoire ancienne puisque j'ai ajouté des liens vers le billet précédent et vers le billet suivant ainsi qu'un lien qui permet de revenir à l'index des billets du blog.

Et en ce qui concerne cette page principale du blog, comme elle commençait à atteindre une certaine longueur, je lui ai ajouté un système de pagination pour présenter une dizaine de billets dans chaque page. Et puis finalement, j'ai préféré faire apparaitre les billets complets dans les pages d'archives comme c'est le cas avec Dotclear. Par conséquent, j'ai dû réviser le nombre de billets par page à la baisse et pour l'instant j'en fait apparaitre cinq par page.

Et pour finir, j'ai ajouté un fil Atom des billets du blog. J'ai fait ça un peu à la barbare (à coup de StringBuilder) et pour compenser, j'ai utilisé FeedBurner pour le publier : http://feeds.feedburner.com/07-ardeche. Après ça, je n'ai eu qu'à ajouter la ligne suivante à mon template pour activer la découverte automatique de mon nouveau fil Atom :

<link rel="alternate" type="application/atom+xml" title="Atom 1.0" href="http://feeds.feedburner.com/07-ardeche" />

jeudi 15 octobre 2009

Faire un site pour rien

Jusqu'à présent, quand on essayait de remonter à la racine des sites hébergés sur le domaine pagesd.info, le navigateur renvoyait une erreur indiquant qu'il ne parvenait pas à trouver le site. Ce qui était plutôt normal puisqu'il n'existait pas de site défini pour l'adresse http://www.pagesd.info/.

Mais tout ça c'est du passé, parce que ce soir je me suis accordé une petite pause pour coder une page qui évite de faire mauvais effet avec une erreur de DNS. Après avoir trouvé une jolie image sur le site de Dry Icons, j'ai maintenant la joie d'avoir un nouveau site en production :

Ceci n'est pas un site

lundi 5 octobre 2009

Mise à jour des OT de l'Ardèche

Toujours dans l'optique d'améliorer le contenu de mon site sur l'Ardèche et faire plaisir à Google pour qu'il m'envoie toujours plus de visiteurs, je me suis cette fois-ci attelé à la cinquantaine de pages consacrées aux offices de tourisme de ardéchois.

Pour commencer, je suis repassé sur les quelques 50 écrans pour ajouter une description qui soit spécifique à chacun d'entre eux. Pour cela, j'ai fait au plus simple avec des variations autour de "Présentation de (l'antenne de) l'office de tourisme Xxxxxx à / dans la région de Xxxxxxx : informations, coordonnées, horaire d'ouverture..."

Dans un second temps, j'ai repris la page principale des offices de tourisme pour la faire évoluer en lui apportant quelques petites modifications :

  • mise à jour de son contenu pour tenir compte du fait que l'ex "Comité du Tourisme" s'est transformé en "Agence de Développement Touristique" (ça fait un peu ex pays de l'Est), ce qui s'est accompagné d'un changement de logo et d'une nouvelle adresse mél.
  • ajout d'un petit texte de présentation de chaque "Territoire d'Accueil et de Consommation Touristique" (ça fait ...) ou TACT, qui regroupe les différents offices de tourisme de chacune des 4 grandes régions touristiques de l'Ardèche

En attendant de réaliser des pages spécifiques pour ces 4 TACT, j'ai d'ores et déjà fait évoluer la fiche de chaque office du tourisme pour indiquer à quel TACT il est rattaché (même si pour l'instant je ne fait rien du tout de cette information). Comme pour cela j'ai eu à faire évoluer le formulaire de mise à jour des OT, j'en ai également profité pour transformer la façon de saisir la présentation et les heures d'ouverture de l'OT :

  • agrandissement des colonnes destinées à enregistrer ces deux informations
  • ajout d'un mini formulaire dédié qui propose un éditeur wysiwyg permettant de modifier ces deux infos uniquement, sans avoir à passer par la fiche complète de l'OT

Une fois cette mise à jour réalisée, j'ai attaqué la partie difficile, à savoir procéder à la mise à jour de ma base de données des OT ardéchois. Pour cela, j'ai fait une synthèse entre mes données actuelles, les informations disponibles dans les documentations fournies par l'ADT et les renseignements proposés sur les sites internet des différents OT.

Pour l'instant, je me suis concentré sur la mise à jour des renseignements suivants :

  • le nom de l'OT,
  • une petite description pour présenter la région,
  • le TACT auquel appartient l'OT,
  • le heures d'ouverture,
  • la liste des communes adhérentes.

Au passage, c'est quand même assez fou le nombre de fois où il est difficile (voire impossible) de trouver les coordonnées ou les heures d'ouvertures sur leur site internet...

Ca n'a pas été facile, mais au final j'ai maintenant une base de données asse cohérente (au moins jusqu'à l'année prochaine) et j'ai même réussi à récupérer 4 ou 5 photos supplémentaires pour illustrer la situation de l'office de tourisme. Après ce travail un peu fastidieux, j'ai reporté ces mises à jour dans la table des communes en re-générant le lien vers l'office de tourisme qui est enregistré dans les fiches communes.

Pour la suite, j'espère avoir bientôt un peu plus de temps pour compléter le fichier des offices de tourisme avec des informations sur les visites guidées qu'ils organisent et éventuellement sur le catalogue de topo-guides de randonnées que l'on peut y trouver. Mais ça sera peut être un peu difficile à caser car cela risque de prendre beaucoup de temps.

Ce qui semble plus donc réalisable, c'est de créer les 4 pages spéciales pour chacun des TACT, où dans un premier temps je pourrais faire apparaitre la liste des OT concernés, avec peut-être une mini carte du secteur... Une fois cet ajout terminé, je pourrais presque supprimer la liste de tous les OT qui apparait actuellement sur toutes les pages et la remplacer par une mini-liste qui ne contiendrait que les quatre TACT avec leur logo respectif.

jeudi 1 octobre 2009

ASP.NET 2.0 et Googlebot

Suite à mes différentes petites améliorations, je commence à avoir quelques résultats. Déjà, il n'y a plus de pages avec des titres en double et le nombre de pages ayant la même description commence à diminuer.

Par contre, il semblerait que Google ne parvient pas à accéder aux pages du blog et qu'il se retrouve à chaque fois avec une erreur du type "Network unreachable".

Au début, je ne me suis pas trop méfié parce que lors de la première installation, il y avait eu une petite erreur pour générer le sitemap. Mais étant donné que cela continue de se produire, j'ai quand même fini par essayer de voir d'où cela pouvait provenir.

Après quelques recherches, il semble que ce problème soit lié à l'url-rewriting et au au changement du user agent de Googlebot (vers mars 2006 !) qui est passé de "Googlebot/2.1 (+http://www.googlebot.com/bot.html)" à "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)". Et apparemment cela perturbe ASP.NET (la version 2.0 seulement ?) dans sa façon de détecter les caractéristiques du navigateur appelant, si bien qu'il finit par faire comme s'il s'agissait un très vieux Mozilla/1 et par faire un peu n'importe quoi...

Deux billets pour avoir des explications plus complètes :

J'ai pu vérifier ce problème par moi-même en utilisant Safari et en le configurant pour qu'il déclare le même user agent que Googlebot. Grâce à quoi, quand j'accédais aux pages du blog, je tombais moi aussi sur une magnifique erreur "Cannot use a leading .. to exit above the top directory" :

[HttpException (0x80004005): Cannot use a leading .. to exit above the top directory.]
   System.Web.Util.UrlPath.ReduceVirtualPath(String path) +3626102
   System.Web.Util.UrlPath.Reduce(String path) +84
   System.Web.Util.UrlPath.Combine(String appPath, String basepath, String relative) +326
   System.Web.HttpResponse.ApplyAppPathModifier(String virtualPath) +209
   System.Web.UI.HtmlControls.HtmlForm.GetActionAttribute() +2036998
   System.Web.UI.HtmlControls.HtmlForm.RenderAttributes(HtmlTextWriter writer) +840
   System.Web.UI.HtmlControls.HtmlControl.RenderBeginTag(HtmlTextWriter writer) +39
   System.Web.UI.HtmlControls.HtmlForm.Render(HtmlTextWriter output) +56
   System.Web.UI.Control.RenderControlInternal(HtmlTextWriter writer, ControlAdapter adapter) +25
   System.Web.UI.Control.RenderControl(HtmlTextWriter writer, ControlAdapter adapter) +121
   System.Web.UI.HtmlControls.HtmlForm.RenderControl(HtmlTextWriter writer) +37
   System.Web.UI.Control.RenderChildrenInternal(HtmlTextWriter writer, ICollection children) +199
   System.Web.UI.Control.RenderChildren(HtmlTextWriter writer) +20
   System.Web.UI.Page.Render(HtmlTextWriter writer) +26
   ap.Engine._default.Render(HtmlTextWriter writer) +89
   System.Web.UI.Control.RenderControlInternal(HtmlTextWriter writer, ControlAdapter adapter) +25
   System.Web.UI.Control.RenderControl(HtmlTextWriter writer, ControlAdapter adapter) +121
   System.Web.UI.Control.RenderControl(HtmlTextWriter writer) +22
   System.Web.UI.Page.ProcessRequestMain(Boolean includeStagesBeforeAsyncPoint, Boolean includeStagesAfterAsyncPoint) +2558

J'ai donc suivi la solution proposée par Brendan qui consiste à ajouter un fichier genericmozilla5.browser dans le répertoire App_Browsers pour détecter correctement les navigateurs compatibles Mozilla/5 génériques. Et après ça, tout est rentré dans l'ordre (au moins pour Safari) et les pages du blog devraient donc être générée à nouveau correctement pour Googlebot.

Ce qui est quand même bizarre, c'est que :

  1. je n'ai eu ce problème de "Network unreachable" qu'avec les pages du blog alors que je fais de l'url rewriting dans tout le site,
  2. je suis affecté alors que même si le site tourne en .NET 2, il est (encore) compilée en .NET 1.1 (d'un autre côté, du moment que le répertoire spécial App_Browsers fonctionne avec une application en .NET 1.1).

Reste plus qu'à espérer qu'avec tout ça je n'ai pas trop épuisé la patience de Goooglebot et qu'il aura la bonté de prendre en compte les pages du blog très très vite ! Mise à jour : ça à marché :)

lundi 21 septembre 2009

Mise à jour des descriptions

J'ai terminé l'ajout des balises descriptions aux pages des tags de l'annuaire dans les délais que j'avais envisagés. Et j'ai même trouvé le temps compléter les descriptions de quelques pages isolées : séances cinéma de l'été, formulaire de contact, plan du site...

Cela m'a d'ailleurs donné l'occasion d'améliorer Altrr-Press pour supprimer les guillemets lors de la saisie des champs description et mots clés dans le formulaire de mise à jour d'un écran. Cela évite de générer ensuite des balises description ou keywords avec des guillemets inopportun.

Pour les pages de l'annuaire contenant les liens, j'ai d'abord regardé comment fonctionnent les autres annuaires et j'ai fait à peu près pareil. Dans ce cas, le consensus semble être de reproduire le début du texte décrivant le site internet lié dans la balise description. L'avantage de cette méthode, c'est que c'est rien que de la programmation et que c'est donc assez rapide à mettre en oeuvre.

Pour suivant sur ma lancée, j'ai aussi commencé à insérer des descriptions pour les pages consacrées aux communes de l'Ardèche. Pour l'instant, je n'en ai fait qu'une bonne soixantaine. Mais en attendant d'avoir traité l'ensemble des 339 communes, j'ai codé un truc pour générer automatiquement une balise description contenant un texte du type "Informations, plan et liens sur la commune de Xxxxxxx en Ardèche".

Après ça, il ne me restera plus qu'à régler le cas du répertoire des offices de tourisme ardéchois pour qu'en théorie chaque page du site ait une balise description différente. Mais dans ce cas, il faudra que je profite de ces modifications pour revoir le contenu de ces pages, et notamment les coordonnées des offices de tourisme.

vendredi 11 septembre 2009

Amélioration du référencement

Je persiste et poursuis mes efforts entamés ce week-end en continuant de travailler à améliorer le référencement de mon site sur l'Ardèche. Par rapport à avant hier, j'ai finalement trouvé une description très convenable pour les pages de cinéma :

  • Pour la page principale j'ai complété ce qui existait pour finir avec : "Programme des cinémas en Ardèche, annuaire des salles de cinéma ardéchoises, les films à l'affiche et les horaires des séances"
  • Et pour les pages spécifiques pour chaque cinéma, cela donne : "Présentation du programme du cinéma NomCinéma à NomCommune : les films à l'affiche et les horaires des séances".

C'est pas très extraordinaire, mais c'est plutôt mieux que ce qu'il y avait jusqu'à présent...

Ensuite, comme je l'avais fait pour certains titre des pages de cinéma, j'ai résolu le même genre de problème de doublon pour les titres des pages concernant les offices de tourisme de l'Ardèche.

Jusqu'à présent, j'utilisais le nom de l'office de tourisme comme titre de la page. Mais il y a un certain nombre d'OT qui ont plusieurs antennes et par conséquent je me retrouvais avec 3 cas où un même titre était attribué à plusieurs pages. J'ai donc du là aussi ajouter le nom de la commune où se situe l'antenne dans le titre de la page pour corriger le problème.

Reste plus à espérer que Google repasse très vite sur ces pages pour que mon problème de "Pages with duplicate title tags" soit de l'histoire ancienne !

Et pour finir, le plus gros de mon travail a consisté à ajouter des descriptions différentes pour chaque tag géré dans l'Annuaire de l'Ardèche. C'est pas une mince affaire et ça m'a pris pas mal de temps. Pour l'instant, j'ai réussi à rédiger une description spécifique pour un bon tiers des 56 tags existants.

Pour bien faire, il faudrait encore que j'en trouve 5 ou 6 d'ici la fin de la semaine et que j'essaie de terminer le tout avant la fin du mois....

mercredi 9 septembre 2009

Des nouvelles de l'Ardèche

Maintenant que Google a tant bien que mal pris en compte mon changement de nom de domaine et qu'il a plus ou moins daigné me renvoyer des visiteurs, j'ai estimé qu'il était temps de mon côté de faire quelques efforts pour améliorer le référencement de 07 - Ardèche (c'est ma bonne résolution de la rentrée).

Pour commencer, je teste deux modifications assez importantes sur la page consacrée à la Météo de l'Ardèche :

  • j'ai essayé de rendre la description de la page un peu plus concrète et attractive : "Consultez la météo de l'Ardèche : le temps du jour et les prévisions météo à 5 jours des principales communes du département".
  • j'ai ajouté un petit texte d'une dizaine de lignes pour expliquer la complexité et la diversité du climat ardéchois.

En ce qui concerne les pages de météo des communes, la description est désormais initialisé de la façon suivante : "Prévisions météo de Xxxxxxxxx (en Ardèche) et de sa région : le temps qu'il fait aujourd'hui et les prévisions météo à 5 jours". Cela permet d'avoir une description bien différente pour chaque page de météo, comme le recommande Google Webmaster Tools.

Pour les Cinémas de l'Ardèche, j'ai déjà fait en sorte que le titres des pages soit bien uniques en ajoutant le nom de la commune à la fin du titre de la page. Grâce à quoi il n'y a plus de doublon dans le titre des cinémas suivants :

Et sinon, toujours dans le cas des pages de cinéma, il faut encore que je mette au point une description qui soit à la fois un peu plus parlante et que je puisse décliner correctement pour chaque salle de cinéma.

Plus généralement, il faudrait que je fasse quelques essais avec le site sur Saint-Privat pour voir ce qu'il est préférable de faire :

  • utiliser la même description pour plusieurs pages
  • laisser la description vide pour éviter d'avoir des doublons

Après ces tâches plutôt triviales, j'ai aussi commencé à faire évoluer l'Agenda de l'Ardèche. Par rapport à ce qui existait jusqu'à présent, je voudrais aller vers quelque chose d'un peu plus complet :

  • donner plus d'informations
  • proposer le programme des théâtres
  • présenter les différents festivals
  • ajouter les foires
  • automatiser la répétition des évènements
  • etc...

Pour l'instant, je suis parti sur l'ajout d'une page de blog très simplifiée et je reprend les billets dans la page de l'agenda. Par rapport à la liste actuelle des évènements, cela offre plusieurs avantages :

  • il y a plus de contenu qu'avant. C'est bon pour le référencement et cela me permet de faire apparaitre plus d'informations : une description beaucoup plus complète, des tarifs, des contacts...
  • quand je reçois des demandes pour faire figurer une manifestation dans l'agenda, la plupart des gens fournissent une description assez détaillée (beaucoup plus d'ailleurs que ceux qui veulent faire référencer leur site !). Par conséquent, cela devrait être facile de transformer ces demandes en billets.
  • Les évènements disparaissent de l'agenda une fois que la date est passée. Avec un fonctionnement de type blog, les billets seront publiés pour l'éternité ce qui m'évitera de "perdre" du contenu (ce qui n'est pas plus mal pour les visites).
  • Cela devrait me permettre de "regrouper" les évènements. Par exemple, je pourrais tenter de rédiger des billets pour présenter la saison 2009 / 2010 des théâtres de l'Ardèche.
  • Si je réussi à publier un billet par semaine en moyenne, j'aurai accumulé une cinquantaine de pages supplémentaires d'ici un an (et donc un certain nombre de visites en plus !). Et comme les différentes manifestations se répètent généralement d'année en année, cela me fera une bonne base pour la suite...

Il faudrait aussi que je réfléchisse sur comment utiliser le blog pour d'autres contenus que l'agenda. Par exemple, j'aimerais m'en servir pour annoncer les séances de cinéma en plein air proposées en été. J'ai encore un peu de temps pour ça d'ici l'année prochaine, mais ça serait pas mal si j'arrivais d'ores et déjà à transformer les films des années passées en billet.

jeudi 19 mars 2009

Limiter l'accès à BlogEngine.NET

Pour faire un blog privé avec BlogEngine.NET, il faut modifier son fichier Web.config de façon à interdire l'accès aux visiteurs anonymes. Pour cela, il faut ajouter une section autorization dans le Web.Config :

  <system.web>
    ...
    <authorization>
        <deny users="?" />
        <allow users="*" />
    </authorization>
    ...
  </system.web>

Cela permet de :

  • interdire (deny) l'accès aux visiteurs anonymes (users="?")
  • autoriser (allow) l'accès aux utilisateurs identifiées (users="*")

De cette façon, tous les visiteurs sont forcés de s'identifier pour pouvoir consulter le contenu du blog => ils sont automatiquement redirigés vers l'écran de connexion.

Dans le cas où le thème du site est up to date et qu'il utilise des HttpHandlers pour gérer les CSS et les JavaScripts, il faut malgré tout donner l'accès à ceux-ci pour que l'écran de connexion puisse fonctionner correctement.

Là encore, il faut modifier le fichier Web.config et y ajouter des éléments location pour autoriser les visiteurs anonymes à accéder à ces 2 types de ressources :

  </system.web>
    ...
   <location path="themes/Scribbish/css.axd">
     <system.web>
       <authorization>
         <allow users="*" />
       </authorization>
     </system.web>
   </location>

   <location path="js.axd">
     <system.web>
       <authorization>
         <allow users="*" />
       </authorization>
     </system.web>
   </location>
    ...
</configuration>

Pour ne pas voir à revenir modifier le fichier Web.config à chaque changement de thème, il est même préférable de ne pas se limiter au fichier "themes/Scribbish/css.axd", mais d'indiquer seulement "themes" pour autoriser l'accès à toutes les ressources du dossier "themes" et de ses sous-dossiers.

Pour que tout soit parfait, on peut aussi cacher le bandeau de Widgets qui apparait automatiquement sur toutes les pages du blog et par conséquent également sur la page de connexion.

Pour cela, il faut mettre à jour le fichier site.master du thème (/themes/Scribbish/site.master dans mon cas) et remplacer la ligne :

<blog:WidgetZone runat="server" ID="rightzone" />

Par :

<% if (Page.User.Identity.IsAuthenticated) { %>
        <blog:WidgetZone runat="server" ID="rightzone" />
<% } %>

Ainsi, le bloc de Widgets ne sera généré que dans le cas des visiteurs identifiés.

Ensuite, pour vivre complètement cachés, il faut aussi aller dans la partie Paramètres du blogue et passer dans l'onglet / Ping Services pour supprimer tous les services qui sont pingués à chaque fois que l'on publie un nouveau billet.

Et pour finir, il est aussi préférable de modifier le fichier robots.txt pour interdire complètement l'accès du blog à tous les moteurs de recherche et autres bots qui pourraient avoir eu vent de notre existence :

User-agent: *
Disallow: /

jeudi 3 mai 2007

Comment cibler le contenu référencé

Yahoo vient de mettre en place un tag "robots-nocontent" pour indiquer les parties du contenu que l'on ne souhaite pas voir référencées. Un peu comme l'attribut rel="nofollow" indique qu'il ne faut pas suivre un lien, cela permet d'indiquer qu'il ne faut pas indexer le contenu compris dans les balises affublées de l'attribut class="robots-nocontent" .

mercredi 11 avril 2007

Auto-découverte du sitemap dans robots.txt

Tout chaud, tout beau. Il est maintenant possible d'indiquer automatiquement à Google, Yahoo et MSN (et même Ask) l'emplacement du fichier sitemap par l'intermédiaire du fichier robots.txt :

Sitemap: <url_complete_du_sitemap>

Par exemple :

Sitemap: http://www.example.com/sitemap.xml

{via Live Search Blog}

vendredi 6 avril 2007

Contenu, contenant, et popularité

A disséquer : Identifier et corriger ce qui bloque un référencement, un article qui rappelle que pour faire un bon référencement "naturel" il n'y a que trois points à prendre en compte :

  • Le contenu (le texte)
  • Le contenant (la structure du site, le code)
  • La popularité (l'environnement du site, les liens)

vendredi 13 octobre 2006

Recherche et mots vides

Hier, j'ai vu passer sur Blogmarks un lien vers un article pour construire un moteur de recherche avec Symfony. C'est l'occasion pour refaire un point sur les différentes pistes pour intégrer un moteur de recherche dans un site en ASP.NET :

L'autre truc intéressant dans l'article sur Symfony, c'est les stops words (appelés mots vides en français), c'est à dire les mots qui sont tellement communs qu'il est inutile de les indexer ou de les utiliser dans une recherche. Dans PI, on en gère déjà empiriquement un certain nombre mais apparament, il existe des listes "officielles" :

Et maintenant, la question qui se pose : si j'utilise des mots vides pour mon nom de domaine (ou mon titre de page, ou mon url...), est-ce que cela aura un impact sur mon référencement ? Est-ce qu'un nom de domaine tel que www.qui-quand-et-comment.com est viable ou est-ce que c'est une véritable hérésie ?

dimanche 19 mars 2006

Correction de Google Sitemap

Correction de deux problèmes qui empêchaient l'exploitation correcte du fichier sitemap.xml par Google.

  • enlevé le "/" de trop à la fin de l'url vers la page principale du site,
  • suppression de l'utilisation de UrlEncode dans l'adresse de toutes les autres pages.

Et modification de Common.TrackFileUpdate() pour employer la nouvelle méthode Common.MapPath() en lieu et place de Server.MapPath().

lundi 20 février 2006

Et de trois (auto-promotion :)

Après le site sur Condrieu de Frédéric, un autre site réalisé cette fois par Philippe (et utilisant lui-aussi la charte Green Marinee). La Compagnie Peretti est une compagnie théâtrale de Haute-Savoie au service des petits. Elle monte et présente ses propres spectacles de théâtre, de marionnettes, animations ou concerts pour les enfants de l'âge de 4 ans et jusqu'à l'âge du capitaine.

Et pour la 1° fois sous Quick-Content, l'utilisation du DewPlayer d'Alsacréations permet de suivre la route du lait et les aventures de Marguerite.

vendredi 3 février 2006

Sémantique HTML et PageRank

Mike Davidson tried to rank for the term lodefizzle on Google. He wrote a dozen different pages to find out what aspects of HTML Google really cares about. Scroll down to the Google…

  1. The H1 tag does indeed assert some dominance and we can therefore assume you are better off using proper headings in your HTML documents.
  2. The mere appearance of many nested tables in your code does not have a strong enough negative effect to be considered a drag on search engine ranking.
  3. It’s not clear that validity helps search engine ranking, but it’s definitely true that certain errors in your code can get you completely removed from indexes.
  4. The semantic effect of hierarchical HTML headings is a stronger factor in search rankings than more rudimentary measures such as physical keyword placement.
  5. Although good semantics are somewhat valuable in optimization, simple things like proper titles, descriptive filenames, and incoming links are dramatically more important.

samedi 28 janvier 2006

Google Sitemap et mise à jour fichiers

Modification des modules Aspxfile, Flashfile, Htmlfile, Image, Svgfile, Textfile, Xmlfeed et Xmlfile pour tester la date de dernière mise à jour du fichier (ou celle de sa création).

Lorsque celle-ci est supérieure d'une heure à la date de dernière mise à jour de l'écran, la date de mise à jour de l'écran est actualisée puis le fichier sitemap destiné à Google est regénéré. Cela permet d'éviter que la mise à jour des pages dont le contenu est basé sur des fichiers "externes" ne soit jamais signalée à Google.

mercredi 25 janvier 2006

HTTP 301 - Moved Permanently

Prise en compte des paramètres "permanentRedirectFrom" et "permanentRedirectTo" dans le web.config pour gérer une redirection permanente. Cela permet par exemple de changer le nom de domaine d'un site (et d'en informer correctement les moteurs de recherche) :

  • permanentRedirectFrom = http://www.monsite.info/
  • permanentRedirectTo = http://www.mon-site.com/

Cela peut aussi servir à unifier les urls pour éviter d'être référencé 2 fois (et donc de "gaspiller" son pagerank) :

  • permanentRedirectFrom = http://monsite.info/
  • permanentRedirectTo = http://www.monsite.info/

Références :

mardi 24 janvier 2006

HTTP 301 - Moved Permanently

<script runat="server">
private void Page_Load(object sender, System.EventArgs e) {
  Response.Status = "301 Moved Permanently";
  Response.AddHeader("Location", "http://www.new-url.com");
}
</script>

(publié à l'origine sur http://www.bigbold.com/snippets/posts/show/1295)

vendredi 20 janvier 2006

Comment cibler les publicités AdSense

Il est possible d'indiquer à Google quelle sont les parties de la page dont on souhaite mettre le contenu en avant. Cela permet de cibler les annonces affichées sur le site en fonction de ce contenu.

Pour cela, il suffit d'encadrer le contenu "intéressant" par :

<!-- google_ad_section_start -->
    ....
<!-- google_ad_section_end -->

Il est aussi possible de "masquer" du contenu pour éviter d'avoir des annonces relatives à celui-ci :

<!-- google_ad_section_start(weight=ignore) -->

    ....
<!-- google_ad_section_end -->

Via «What is section targeting and how do I implement it?»

samedi 14 janvier 2006

Google Sitemap

Quick-Content peut désormais générer automatiquement un fichier sitemap.xml à chaque fois qu'un écran est modifié.

L'attribut «lastmod» correspond à la date de dernière mise à jour de l'écran telle qu'elle est enregistrée dans le champ «lastUpdate» de la table qc_Screens.

L'attribut «changefreq» est généré en comparant la date de dernière modification de l'écran à la date en cours :

  • "daily" s'il y a moins de 7 jours,
  • "weekly" s'il y a moins de 15 jours,
  • "monthly" s'il y a moins de 3 mois,
  • "yearly" dans les autres cas.

En ce qui concerne l'attribut «priority», il est initialisé à 0.7, 0.5 ou 0.3 selon que l'écran est de niveau 1, 2 ou 3.

La boite de configuration du site a été mise à jour pour permettre la saisie de l'url du fichier sitemap.xml à générer (en général, indiquer ~/sitemap.xml). Dans le cas où ASP.NET n'a pas de droit en écriture sur la racine du site mais seulement sur le sous-répertoire «/data», il faut :

  • indiquer "~/data/sitemap.xml" pour que Quick-Content puisse écrire le fichier,
  • placer le fichier «_sitemap.aspx» à la racine du site pour que Google accepte toutes les urls qu'il contient.

Le fichier «_sitemap.aspx» se contente de renvoyer le contenu du fichier «/data/sitemap.xml» :

<%@ Page Language="C#" %>
<script runat="server">
void Page_Load(object sender, System.EventArgs e) {
    Response.ContentType = "application/xml";
    Server.Transfer("data/sitemap.xml");
}
</script>

Il est également nécessaire d'inscrire l'url du fichier sitemap sur Google Sitemaps pour qu'il soit pris en compte.

Note : même si selon Google un fichier sitemap n'est pas censé améliorer le référencement du site, cela présente au moins les avantages suivants :

- page 1 de 2