|
AltaVista pour les webmasters |
précédent
| suivant |
2.Bien référencer son site sur AltaVista et ailleurs
2.1 Ajouter et supprimer une URL
Si vous cliquez sur le lien Ajouter une URL, vous pourrez insérer instantanément vos pages web et faire référencer votre site Internet.
C'est une fonction ouverte à tous, aucune demande n'est requise et il en est de même pour la fonction inverse qui consiste à Supprimer
une URL. Comme son nom l'indique, elle permet d'effacer un site donné ou des pages qui n'existent plus de la "mémoire" d'AltaVista.
|
 |
Certains sites soumettent un grand nombre de pages à
AltaVista espérant les faire figurer en bonne place
dans les pages de résultat. Ils soumettent des pages
avec de nombreux mots-clés, ou avec des mots-clés
qui sont sans rapport avec le contenu des pages. D'autres
soumettent des pages avec un contenu qui diffère
de ce que les utilisateurs verront. Nous décourageons
fortement ces pratiques.
Les tentatives pour remplir l'index d'AltaVista de fausses pages ou de pages promotionnelles diminuent la valeur
de l'index pour les utilisateurs et rendent la recherche sans valeur. Nous n'accepterons pas les URL de ceux
qui polluent l'index et supprimerons de l'index toutes les pages de ce type.
|
|
|
|
2.2 Obtenir les meilleures places dans les moteurs de recherche
2.2.1 Soignez les titres et les premières lignes de vos pages HTML
Le titre des pages HTML et les premières lignes d'une page web représentent les informations
les plus essentielles. Si les mots ou les phrases correspondant à une requête se trouvent déjà dans
le titre HTML ou dans les premières lignes d'une page, celle-ci ne manquera pas de figurer en haut de
la liste des résultats.
L'importance du titre
Qu'est-ce qu'un titre HTML ? Il s'agit de l'en-tête de la page, autrement dit de l'inscription qui
apparaît dans la barre de titre du navigateur. Dans le code HTML d'une page
web, le titre se présente de la façon suivante :
titre de la page
Retour en haut de la page 
De nombreux logiciels de création de pages HTML sous-évaluent hélas le rôle de ces titres. Il arrive
ainsi que ces logiciels en établissent automatiquement, voire qu'ils ne permettent pas d'en attribuer.
Le cas échéant, il vous faudra alors entrer dans le code même de la page HTML et rajouter " à la main "
la balise décrite ci-dessus. Quoi qu'il en soit, il est dans votre intérêt de choisir des termes précis
et pertinents afin d'expliciter le contenu d'une page donnée et de générer un trafic maximum sur vos
pages.
L'importance des premières lignes de chaque page
De même, vous devrez soigner les premiers mots apparaissant dans
chaque page et y faire figurer si possible le maximum de mots pertinents
par rapport au contenu de votre site web. Votre site aura plus de
chances d'apparaître dans les pages de résultat d'une recherche,
si cette dernière comporte un ou à fortiori plusieurs mots communs
à ceux des premières lignes de votre site. Cet effort doit d'ailleurs
être effectué si possible sur chacune des pages de votre site
et pas seulement sur la page d'accueil.
Prenons un exemple : si vous souhaitez mettre votre CV en ligne, vous devez prendre en considération
une règle simple : n'insérez pas votre nom tout en haut de la page car ce n'est pas ce qui intéresse
votre futur interlocuteur ! Ce dernier est en premier lieu attiré par vos compétences, et par le type
de poste que vous recherchez. Le premier mot de votre page devra donc être "curriculum" ou "cv", suivi,
dans le texte, des renseignements professionnels.
2.2.2 Quelle importance réelle revêtent les balises Meta ?
Les balises méta représentent de brèves indications qui peuvent être insérées dans l'en-tête des pages
web. Il y a deux types de balise :
Balise de description
Elle permet d'introduire un commentaire de quelques lignes sur le site. Celles-ci se trouvent après la
balise "title" sous cette forme par exemple :
Balise de mots clés
Elle fournit une liste de mots décrivant autant que possible l'ensemble
des sujets abordés par le site web. On la trouve après la balise
de description sous cette forme par exemple :
A quoi servent ces balises au juste ? A apporter des éclaircissements
sur le contenu des pages qui ne révèlent pas complètement leur thématique
à l'intérieur du texte.
Retour en haut de la page 
Cependant, les webmasters se méprennent souvent sur les fonctions
des balises Meta. En effet, en présupposant qu'AltaVista fonctionne
telle une base de données, ils estiment que ces mots-clés sont les
uniques facteurs déterminant la recherche. En fait, AltaVista inscrit
dans son index tous les mots de chaque page. Chacun d'entre eux
est déterminant, tout comme sa place dans le texte. L'objectif
de ces balises méta est tout simplement d'ajouter des synonymes,
autrement dit, des termes qui soient cohérents avec le contenu du
texte et qui le décrivent, sans toutefois y faire leur apparition.
Ces balises sont particulièrement utiles pour les traductions automatiques
des termes plus significatifs : grâce à elles, les pages peuvent
être repérées même par les utilisateurs s'exprimant en d'autres
langues.
De nombreux webmasters pensent aussi que, au travers de ces balises
méta déguisées en mots-clés, il est possible de mieux référencer
les pages comportant peu de texte et de nombreux effets graphiques
(animations Flash ou Shockwave par exemple). La réalité est tout
autre car ces "mots-clés" jouissent de bien peu de privilèges par
rapport au reste de la page. Pourquoi AltaVista n'accorde-t-il
pas la priorité aux balises méta ? Tout simplement parce que cela
laisserait le champ libre au spamming et parce que les utilisateurs
ne pourraient pas bénéficier d'un véritable service de qualité.
Les secrets du référencement sur AltaVista
- AltaVista attribue des valeurs à chaque page afin de les
ordonner. Ces valeurs peuvent être absolues (indépendantes
du type de recherche) ou relatives (influencées par une recherche
donnée).
Les facteurs privilégiés dans la classification absolue
- Les pages avec un texte long et ayant un sens (pas
de lettres ou de mots au hasard).
- Les pages qui proposent des liens ou d'autres pages traitant
du même thème
- Les pages présentant des liens efficaces ou de qualité.
La valeur d'un site ou d'une page dépend du nombre de liens
et de la valeur des sites contenant des liens dans sa direction.
- Les pages "de proximité" dans un site arborescent
: plus la page correspondant à la recherche effectuée est éloignée
de la page principale, plus sa valeur sera faible.
Les valeurs absolues sont recalculées chaque semaine afin de
mettre à jour la classification. Il est préférable de choisir
une adresse simple que vous garderez longtemps afin de conserver
les liens vers le site et de s'assurer un bon référencement
sur le moteur de recherche.
Les facteurs privilégiés dans la classification relative
- Le titre HTML.
- Les premières lignes du texte.
- Les mots et phrases de la recherche placés au début de la
page.
- Les termes précisés dans les balises Méta et réellement
utilisés dans le corps du texte
- Les mots mentionnés dans les ancres (par exemple, si les
liens vers le site contiennent un texte identique à celui d'une
recherche, les pages apparaîtront en haut des résultats).
|
Attention :
N'oubliez pas que les termes rares sont plus importants que
les termes communs. Par exemple, si votre requête contient
les termes "fruit" et "papaye", les pages contenant le deuxième
mot apparaîtront en haut de la liste des résultats. Par conséquent,
il est préférable d'utiliser des termes bien précis lors de la
création des pages, des ancres et des balises méta. Plus la page
et son contenu seront précis, plus les avantages seront nombreux.
|
Retour en haut de la page 
2.2.3 Les limites inhérentes aux moteurs d'indexation
1. Les sites qui exigent une inscription ou un mot de passe sont inaccessibles
aux moteurs de recherche. N'oubliez pas : les indexateurs ne peuvent
compléter aucun type de module ; lorsqu'ils en rencontrent un, ils
se bloquent. Si vous souhaitez recueillir des informations concernant
les utilisateurs mais aussi indexer les pages, il vous suffit de
proposer l'inscription au site en option.
2. Les indexateurs n'ont pas accès au contenu d'une base de données parce qu'ils ne sont
pas en mesure de remplir des modules.
3. Si le contenu de la base de données du site est essentiellement du texte, vous pouvez l'indexer
simplement en créant des pages HTML de type statique comprenant
ce même contenu. L'AltaVista kit développeur vous aide à convertir
le contenu de la base de données en pages statiques prêtes à être
indexées.
4. Les pages dynamiques sont également inaccessibles aux
indexateurs (.asp, .jsp, .cgi etc.). Si vous utilisez des pages
dynamiques afin de satisfaire au mieux les exigences des utilisateurs,
vous risquez d'en entraver l'indexation complète par un moteur de
recherche. Les pages dynamiques sont créées en temps réel à partir
des bases de données et se distinguent par le point d'interrogation
contenu dans leur adresse. Lorsque l'indexateur d'un moteur de recherche
récupère ce type de page, il en indexe le contenu mais ne peut en
suivre les liens car pour lui ces derniers sont reliés à un nombre
infini de pages.
5. Si un site web contient de nombreux cadres (frames),
vous risquez de rencontrer quelques problèmes d'indexation, que
vous pourrez cependant vite résoudre. En règle générale, AltaVista
recense tout ce qui se trouve à l'extérieur des cadres et par la
suite chaque partie du cadre en tant que pages séparées. Vous verrez
ainsi s'afficher uniquement le cadre contenant le résultat de la
requête. Afin de sélectionner le mode d'affichage de la page, vous
devrez proposer le choix entre la version avec le cadre et celle
sans le cadre. Cette dernière peut être placée dans le moteur de
recherche grâce à la fonction Ajouter une URL.
6. AltaVista n'est pas en mesure d'indexer le texte compris dans les photographies
ou tout autre élément graphique.Les moteurs de recherche ne peuvent
pas "lire" le texte si le webmaster n'a pas inséré la commande ALT
pour décrire l'image. Quoi qu'il en soit, AltaVista peut indexer
les images d'une autre façon afin de les rendre accessibles.
Retour en haut de la page 
7. Le texte contenu dans les fichiers multimédia (audio et vidéo) ne
peut être indexé, à moins de recourir à la fonction MP3/Audio et
Vidéo.
8. Les informations générées moyennant les applets Java ou
en code XML ne peuvent être indexées.
9. Il en va de même pour les fichiers .pdf (Acrobat). Cependant, il existe une technique qui
permet à AltaVista de convertir ces fichiers en d'autres formats
compatibles avec l'indexation. AltaVista recherche Intranet software
est en mesure d'indexer ce type de fichiers. Toutefois, si vous
souhaitez faire indexer vos pages au plus vite, publiez une version
HTML et faites-la connaître grâce à la fonction Ajouter une URL.
10. Les commentaires, autrement dit les textes entre chevrons ,
en code HTML ne peuvent être indexés. Ces informations sont de toute
façon destinées aux visiteurs qui peuvent les visualiser en cliquant
sur "Affichage/Source" ou bien sur "Affichage/HTML".
11. Lorsque la connexion au site est lente ou lorsque celui-ci comprend des
pages d'une grande complexité, l'indexateur, au terme d'un certain
délai, renonce à récupérer l'ensemble du texte.
12. Si la structure du site dépend des répertoires ou présente une forme arborescente,
vous devez insérer les informations plus importantes au niveau supérieur.
En effet, les moteurs de recherche estiment que les informations
ainsi disposées sont prioritaires. Par ailleurs, les indexateurs
arrêtent parfois leurs recherches au troisième, quatrième ou cinquième
niveau.
13. En règle générale, il est préférable de faire en sorte que les non-voyants, qui représentent une bonne tranche des utilisateurs
d'Internet, puissent avoir accès à votre site. Ils utilisent des
navigateurs de type textuel et des convertisseurs vocaux. Cela implique
que vous devez offrir si possible une version texte de votre site,
même si vous avez publié une version " plus graphique " de celui-ci.
Sachez, en outre, que les obstacles qui entravent l'accès aux non-voyants
représentent autant de difficultés également pour les indexateurs.
Retour en haut de la page 
2.2.4 Gare au " spamming " !
Ce terme anglais se réfère au comportement incorrect de certains webmasters qui faussent l'indexation des moteurs
de recherche afin de faire apparaître leurs pages en tête des résultats.
Les tactiques employées par ces " spammers " peuvent être diverses.
Retenons simplement un exemple, hélas fréquent : l' insertion d'un
grand nombre de mots clés racoleurs et sans rapport avec le contenu
du site (exemple : utiliser le mot " sexe " dans les balises Meta
ou en couleur de fond sur toutes les pages du site).
La première conséquence de ces manoeuvres est que l'internaute se sent floué
lorsqu'il se rend sur une page sans rapport avec ce qu'il demandait,
ce qui est non seulement inefficace, mais qui plus est, mauvais
en terme d'image.
La seconde conséquence est que les moteurs de
recherche et AltaVista en particulier sont maintenant très au courant
de ces techniques de " triche " et sont en mesure de les contrer
facilement. Le risque pour tout spammer est alors de se voir banni
à jamais du ou des moteurs concernés et de diminuer par là-même
considérablement ses chances de générer du trafic sur son site web.
Ceci implique aussi que vous devrez être très vigilant dans le choix
de votre hébergeur. En effet, si ce dernier héberge des spammers
et des sites pornographiques, votre site sera pénalisé, ou mis de
côté, simplement parce que tous les domaines auront la même adresse
IP.
2.3 Contrôlez le référencement de votre site web
Une fois vos pages indexées par AltaVista, vous pouvez vous servir de la recherche
pour vérifier l'efficacité du référencement effectué. Pour contrôler
le nombre de pages qui ont été indexées, il vous suffit de saisir
host: suivi du domaine (par exemple, host:rcs.fr). Le repérage des
titres, des descriptions qui manquent à l'appel, des documents obsolètes
ou des doublons est une opération simple, à condition que la liste
ne soit pas interminable.
Prenons un exemple fictif : si vous souhaitez
vérifier la sécurité de votre entreprise vous pouvez par exemple
taper la phrases-clé suivante :
host : nom de domaine AND " confidentiel
". Grâce à ce procédé, vous pouvez également vérifier la mise à
jour des pages. Lorsqu'il y a plus de 200 pages, il est conseillé
de passer par la Recherche avancée : la fonction Contrôler plusieurs
résultats permet en effet de visualiser toutes les pages en question.
|
 |

host:altavista.fr
AND ("zone réservée" OR secret 

OR
confidentiel OR privée) 

|
Si vous avez modifié le nom de votre domaine, fichier ou répertoire, il vous suffit de saisir "link:" suivi de l'ancienne
adresse afin de savoir s'il existe encore des pages (à l'intérieur du site ou ailleurs) reliées aux anciennes adresses. Si vous
souhaitez contrôler plus de 200 résultats, nous vous conseillons de recourir pour cela à la Recherche avancée. De plus, pour effectuer
cette recherche complexe, vous devez bénéficier d'une connexion Internet assez rapide car le comptage des pages prend un certain
temps. Il vaut mieux également effectuer ces recherches en dehors des " heures de pointe ", c'est à dire après 22 heures.
" link : " vous permet par ailleurs de savoir combien de pages web sont reliées à votre site, afin d'une part d'en
sonder la popularité, et d'autre part de vérifier les descriptions des pages auxquels ces liens donnent accès. Pourquoi ? Parce que
l'image véhiculée par le site est un point important. La cohérence entre le contenu de votre site et celui relayé par les autres sites
est donc fondamentale.
N'oubliez pas non plus l'ancre (anchor : ) , autrement dit, le texte mis en évidence dans les liens. Si vous voulez attirer
les internautes et faire indexer vos pages, l'ancre doit contenir des termes clairs et précis.
Retour en haut de la page 
|
 |
|