Url rewriting par .htaccess

7 février 2008

Url rewriting
L’”url rewriting” ou “ré-écriture d’url” vous permet de modifier l’adresse de vos pages internet sans modifier votre code. Cela est très utile pour les pages dynamiques, ainsi une page ayant pour url “http://www.monsite.com?do=show&id=25&id_cat=3&id_marque=7” pourra être accessible par une url de la forme “http://www.monsite.cat/appareils-photos/canon/ixus-v3.html

A quoi ça sert ?
Mis à part la satisfaction d’avoir un site acec des urls plus “propres”, l’intérêt essentiel se trouve dans le référencement de votre site internet. Ainsi si on reprend l’exemple précédent, un moteur de recherche risque de ne pas indexer une page ayant pour url “http://www.monsite.com?do=show&id=25&id_cat=3&id_marque=7” car ils limitent leur indexation à un certain nombre de paramètres. Et même si cette page est indexée, le robot comprendra plus facilement le thème de la page avec une url de la forme “http://www.monsite.cat/appareils-photos/canon/ixus-v3.html“.

Comment ça marche ?
Je ne parlerai ici que d’url rewriting avec un fichier “.htaccess”. Cela signifie que vous devez avoir un site hébergé sur un serveur Apache (cela est faisable différemment avec IIS), pouvoir uploder un fichier texte à la racine du site et que votre hébergeur accepte l’url rewriting (de nombreux hébergeurs l’acceptent, le mieux est de consulter leurs FAQ ou de leur demander directement).
Si toutes ses conditions sont remplies, vous n’avez plus qu’à mettre un fichier texte appelé “.htaccess” à la racine de votre site.

Le fichier “.htaccess”
La première ligne à mettre dans votre fichier “.htaccess” est
RewriteEngine on
pour signifier que vous souhaitez utiliser le module de réécriture d’url.
Les règles de réécritures se présentes ensuite ainsi
RewriteRule url_de_depart url_d_arrivee [L]
La réécriture d’url utilse les expressions régulières pour définir les urls de départ, n’étant pas spécialiste (et n’étant pas passionné par la chose) je me contenterai de vous exposer des exemples courants.

Changer le dossier d’une url simple
RewriteRule ^sitemap\.xml$ /robot/sitemap.xml [L]

L’url http://www.monsite.com/robot/sitemap.xml est transformée en http://www.monsite.com/sitemap.xml

Supprimer un paramètre dans une url
RewriteRule ^textes\.html$ /index.php?do=texts [L]

L’url http://www.monsite.com/index.php?do=texts est transformée en http://www.monsite.com/textes.html

Expression régulière avec des chiffres
RewriteRule ^auteurs-([0-9]+)\.html$ /index.php?do=users&p=$1 [L]

L’url http://www.monsite.com/index.php?do=user&p=5 est transformée en http://www.monsite.com/auteurs-25.html

_ L’expression [0-9]+ signifie “au moins un chiffre entre 0 et 9” (si on voulait “0 ou plus chiffres entre 0 et 9, on aurrait remplacé le “+” par “*”)
_ Le “$1″ signifie la première expression régulière (donc ici le [0-9]+)
Si on avait plusieurs expressions régulières, on aurrait $1, $2, $3, …

Expression régulière avec des lettres
Pour les lettres, il faut utiliser l’expression [a-z]+ (ou [a+z]*) qui signifie “une lettre entre a et z

Expression régulière “n’importe quoi sauf un point”
RewriteRule ^t/([^.]*)\.html$ /index.php?do=text&url=$1 [L]

Toutes les urls “html” dans le dossier “http://www.monsite.com/t/” sont réécrites en “http://www.monsite.com/index.php?do=text&url=$1” avec “$1” qui est le nom de fichier “html

La plupart des exemples sont tirés du site ObiSong.com: chanson, poeme, poesie , vous pouvez consulter directement sur le site le “.htaccess

Le format sitemap

7 février 2008

A quoi ça sert ?
Le format sitemap vous permet de lister dans un fichier toutes les urls des pages de votre site internet. Il permet ainsi aux robots des moteurs de recherche de trouver vos pages rapidement et facilement.
Concrétement, cela se présente sous la forme d’un fichier xml (donc texte), souvent appelé “sitemap.xml”

Pour quels moteurs de recherche ?
La majorité des robots des moteurs de recherche utilisent le format sitemap et bien sur les plus importants : Google, Yahoo

Ecrire un sitemap
Vous pouvez trouver les spécifications du format sitemap sur le site de Google
https://www.google.com/webmasters/tools/docs/fr/protocol.html

Voici un exemple de sitemap très simple que j’utilise pour un de mes sites :
<urlset xmlns=”http://www.google.com/schemas/sitemap/0.84″>
<url><loc>http://www.monsite.com/mapage1.html
</loc></url>
<url><loc>http://www.monsite.com/mapage2.html
</loc></url>
<url><loc>http://www.monsite.com/mapage3.html
</loc></url>
</urlset>

On voit ainsi qu’il est très simple de lister toutes les pages d’un site.

Pour les sites dynamiques
Pour mes sites dynamiques, je génère le sitemap “à la volée” grâce à un script PHP, le sitemap est donc toujours à jour.

Le plan sitemap
Si votre site internet comporte beaucoup de pages, il peut être intéressant de le séparer en plusieurs “morceaux”, le plan sitemap permet au moteur de recherche de trouver ces différens morceaux.

Exemple de plan sitemap :
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>http://www.monsite.com/sitemap1.xml
</loc>
</sitemap>
<sitemap>
<loc>http://www.monsite.com/sitemap2.xml
</loc>
</sitemap>
<sitemap>

<loc>http://www.monsite.com/sitemap3.xml</loc>
</sitemap>
</sitemapindex>

Déclarer son sitemap
Créer son sitemap, c’est bien mais si les moteurs ne le lisent pas ça ne sert pas à grand chose.
Pour déclarer son sitemap, il y a 2 solutions :
_ le déclarer directement au moteur : pour Google, il faut avoir un compte Google, se connecter à son compte et aller dans les “outils pour Webmaster” (”Webmaster Tools”)
_ utiliser le fichier robots.txt
Ce fichier doit se trouver à la racine de votre site internet

Exemple de fichier “robots.txt” :
User-agent: *
Disallow:
Sitemap: http://www.monsite.com/sitemap.xml

Si on utilise un plan sitemap, il faut donner l’adresse de ce plan

Sitemap et blogger.com
(Source : http://philippe.chappuis.googlepages.com/sitemap-blogger)
Pour les sites utilisant la plate forme de blog “blogger.com”, vous pouvez soumettre dans les “outils pour webmaster” de Google le flux rss de vos messages comme sitemap.
Pour cela, utilisez l’adresse http://www.monsite.com/atom.xml
Par exemple pour le blog “Webmaster Infos” : http://webmasterinfos.blogspot.com/atom.xml

Réussir vos campagnes d’emailing

7 février 2008

Quelques conseils pour une campagne d’emailing réussie (newsletter ou autre):

1/ émetteur du mail
Cet émetteur doit être clairement identifiable par l’internaute, par exemple “Votre conseiller XXX”, avec “XXX” étant le nom de votre marque

2/ objet du mail
L’objet du mail doit être suffisamment percutant pour inciter l’internaute à cliquer.
Pour éviter de se retrouver dans le spam, il est conseillé d’avoir un objet de 40 à 50 caractères espaces compris (40 caractères étant un bon objectif), cet objet ne doit pas commencer par un chiffre et il faut éviter d’utiliser des mots caractéristiques des spammeurs (sex, viagra, …)

3/ commencer l’email par un “lien mirroir” permettant d’accéder à une version “en ligne” de l’email, par exemple : “Si vous avez des difficultés à lire cet email, cliquez ici : http://www.monsite.com/newsletter/25.html”
Cela permet aux internautes de voir le mail dans de bonnes conditions même si leur utilitaire de messagerie ne leur permet pas.

4/multiplier les liens dans l’email : le but est de multiplier les occasions pour l’internaute d’accéder à votre site internet. Ces liens doivent être en nombre (plusieurs dizaines) et envoyer sur des parties différentes du site (multiplier les liens vers la home page risque de créer une insatisfaction chez l’internaute)

5/ prendre en compte la fenêtre de prévisualisation.
La plupart des internautes utilisent un logiciel de messagerie (genre OutLook) pour regarder leurs mails.
Ces logiciels séparent en général l’écran en 2 :
_ une partie haute avec la liste des messages
_ une partie basse avec le haut du message sélectionné : la fenêtre de prévisualisation.
Cette fenêtre montre en général le tiers haut du mail et cette partie doit être étudiée pour que l’internaute comprenne tout du mail et doit l’inciter à cliquer.