Les services CVFM
Conseil/Stratégie Affiliation Noms/Domaines Référencement Formation/Conférence Agents/Intellig.
Referencement, positionnement
24pm
Newsletters
 Ecom2
 Brand Alert
 Droit ebusiness
 Nouvelle Economie
 Guide de l'ebusiness
 Etudes de cas
 Les nouvelles règles
 Discussions
 Interviews
 Vidéo
Référencement
 Guide
 Assistants intelligents
 Discussion
 Annuaire web
 Top 100 francophone
 Interviews
 Emploi
 Offres
 Demandes de presse
Etudes et Stats
 eCommerce
 Connectés
 Etudes
 Appel d'offres web
 Publier un appel
 Consulter les appels
 Sellbuyweb
 Sites web à vendre
 Vendre votre site
  Agents Intelligents
 Dossier
 Annuaire web
 Interviews
 CVFM
 Présentation
 Revue de presse
 Nous contacter
 Votre E-mail 

Contenu fourni par l'agence de webmarketing CVFM, expert du référencement pour les grands comptes.

Qu'est-ce que le fichier Robot.txt ?

Ce fichier permet surtout d'indiquer aux outils de recherche de ne pas indexer certaines parties de votre site. Il s'agit d'un fichier texte que vous créez avec Word, Wordpad ou Notepad. Pour qu'il soit prix en compte par les outils de recherche, vous devez le télécharger dans le répertoire racine de votre site web.

Voici ce que doit contenir ce fichier pour chaque moteur:

User-agent: { nomduspider }
Disallow: { document-a-exclure }

Par exemple, pour indiquer au spider d'Excite, dénommée ArchitextSpider, de ne pas indexer les fichiers secret.html et secrets2.html, il faut insérer les lignes suivantes dans robot.txt :

User-agent: ArchitextSpider
Disallow: secret.html
Disallow: secrets2.html

Vous pouvez ajouter plus de lignes pour exclure des pages d'autres moteurs en indiquant le paramètre User-Agent encore dans le même fichier, suivi de plus rejetez des lignes.
Si vous voulez exclure un répertoire entier, utilisez cette syntaxe suivante:

User-agent: ArchitextSpider
Disallow: / nomdurepertoire / *

Vous pouvez demander à ce qu'une page ne soit visitée par aucun outil de recherche avec la syntaxe suivante
User-agent: *
Disallow: secrets2.html

Lorsque je veux interdirà un moteur de recherche d'indexer mon site, j'insère les ligne suivante dans le fichier robot.txt
User-agent: Sooter
Disallow: / *
(ici, j'ai demandé à Scooter, le spider d'Altavista, un viel ami à moi, de ne pas visité le site).

D'ailleurs, je vous donne la liste de tous les spiders dont j'ai fait la connaissance.
 
Outil de recherche:  User-Agent de l'outil:
Alta Vista Scooter 
Infoseek  InfoSeek Sidewinder
Excite ArchitextSpider
Lycos Lycos_Spider_(T-Rex) 
Northern Light Gulliver

Robot.txt Référencement



Vous aimez ce site ?
Recommandez-le à vos amis
Newsletters gratuites
Cliquez ici pour vous abonner

 

copyrights

Weborama, les meilleurs sites francophones