Connexion Internet recquise AltaVista: Recherche     
 
Guide de la Recherche
web français tout le web
Connexion Internet recquise Recherche avancée

  sommaire
Introduction
La Recherche simple : principes de base
Les résultats de la recherche : conseils pratiques
La recherche de sons, images et vidéos
La recherche avancée
Les fonctions avancées pour les initiés
AltaVista pour les webmasters
Caractéristiques générales du référencement sur Altavista
• Bien référencer son site sur AltaVista et ailleurs
Désactiver l'indexation
Fonctions avancées d'AltaVista pour les webmasters
glossaire
  Tableau récapitulatif
AltaVista pour les webmasters précédent   |   suivant  
2.Bien référencer son site sur AltaVista et ailleurs

2.1 Ajouter et supprimer une URL

Si vous cliquez sur le lien Ajouter une URL, vous pourrez insérer instantanément vos pages web et faire référencer votre site Internet. C'est une fonction ouverte à tous, aucune demande n'est requise et il en est de même pour la fonction inverse qui consiste à Supprimer une URL. Comme son nom l'indique, elle permet d'effacer un site donné ou des pages qui n'existent plus de la "mémoire" d'AltaVista.
  Certains sites soumettent un grand nombre de pages à AltaVista espérant les faire figurer en bonne place dans les pages de résultat. Ils soumettent des pages avec de nombreux mots-clés, ou avec des mots-clés qui sont sans rapport avec le contenu des pages. D'autres soumettent des pages avec un contenu qui diffère de ce que les utilisateurs verront. Nous décourageons fortement ces pratiques.

Les tentatives pour remplir l'index d'AltaVista de fausses pages ou de pages promotionnelles diminuent la valeur de l'index pour les utilisateurs et rendent la recherche sans valeur. Nous n'accepterons pas les URL de ceux qui polluent l'index et supprimerons de l'index toutes les pages de ce type.


       


2.2 Obtenir les meilleures places dans les moteurs de recherche

2.2.1 Soignez les titres et les premières lignes de vos pages HTML

Le titre des pages HTML et les premières lignes d'une page web représentent les informations les plus essentielles. Si les mots ou les phrases correspondant à une requête se trouvent déjà dans le titre HTML ou dans les premières lignes d'une page, celle-ci ne manquera pas de figurer en haut de la liste des résultats.

  • L'importance du titre

    Qu'est-ce qu'un titre HTML ? Il s'agit de l'en-tête de la page, autrement dit de l'inscription qui apparaît dans la barre de titre du navigateur. Dans le code HTML d'une page web, le titre se présente de la façon suivante :
    <head> <title>titre de la page</title> </head>

    Retour en haut de la page 


    De nombreux logiciels de création de pages HTML sous-évaluent hélas le rôle de ces titres. Il arrive ainsi que ces logiciels en établissent automatiquement, voire qu'ils ne permettent pas d'en attribuer. Le cas échéant, il vous faudra alors entrer dans le code même de la page HTML et rajouter " à la main " la balise décrite ci-dessus. Quoi qu'il en soit, il est dans votre intérêt de choisir des termes précis et pertinents afin d'expliciter le contenu d'une page donnée et de générer un trafic maximum sur vos pages.

  • L'importance des premières lignes de chaque page

    De même, vous devrez soigner les premiers mots apparaissant dans chaque page et y faire figurer si possible le maximum de mots pertinents par rapport au contenu de votre site web. Votre site aura plus de chances d'apparaître dans les pages de résultat d'une recherche, si cette dernière comporte un ou à fortiori plusieurs mots communs à ceux des premières lignes de votre site. Cet effort doit d'ailleurs être effectué si possible sur chacune des pages de votre site et pas seulement sur la page d'accueil.
    Prenons un exemple : si vous souhaitez mettre votre CV en ligne, vous devez prendre en considération une règle simple : n'insérez pas votre nom tout en haut de la page car ce n'est pas ce qui intéresse votre futur interlocuteur ! Ce dernier est en premier lieu attiré par vos compétences, et par le type de poste que vous recherchez. Le premier mot de votre page devra donc être "curriculum" ou "cv", suivi, dans le texte, des renseignements professionnels.

    2.2.2 Quelle importance réelle revêtent les balises Meta ?

    Les balises méta représentent de brèves indications qui peuvent être insérées dans l'en-tête des pages web. Il y a deux types de balise :

  • Balise de description

    Elle permet d'introduire un commentaire de quelques lignes sur le site. Celles-ci se trouvent après la balise "title" sous cette forme par exemple :
    <META name="description" content="AltaVista.fr propose le moteur le plus fiable et le plus pertinent du Web">
  • Balise de mots clés

    Elle fournit une liste de mots décrivant autant que possible l'ensemble des sujets abordés par le site web. On la trouve après la balise de description sous cette forme par exemple : <META name="keywords" content="recherche, recherches, avançée, etc "> A quoi servent ces balises au juste ? A apporter des éclaircissements sur le contenu des pages qui ne révèlent pas complètement leur thématique à l'intérieur du texte.

    Retour en haut de la page 


    Cependant, les webmasters se méprennent souvent sur les fonctions des balises Meta. En effet, en présupposant qu'AltaVista fonctionne telle une base de données, ils estiment que ces mots-clés sont les uniques facteurs déterminant la recherche. En fait, AltaVista inscrit dans son index tous les mots de chaque page. Chacun d'entre eux est déterminant, tout comme sa place dans le texte. L'objectif de ces balises méta est tout simplement d'ajouter des synonymes, autrement dit, des termes qui soient cohérents avec le contenu du texte et qui le décrivent, sans toutefois y faire leur apparition. Ces balises sont particulièrement utiles pour les traductions automatiques des termes plus significatifs : grâce à elles, les pages peuvent être repérées même par les utilisateurs s'exprimant en d'autres langues.

    De nombreux webmasters pensent aussi que, au travers de ces balises méta déguisées en mots-clés, il est possible de mieux référencer les pages comportant peu de texte et de nombreux effets graphiques (animations Flash ou Shockwave par exemple). La réalité est tout autre car ces "mots-clés" jouissent de bien peu de privilèges par rapport au reste de la page. Pourquoi AltaVista n'accorde-t-il pas la priorité aux balises méta ? Tout simplement parce que cela laisserait le champ libre au spamming et parce que les utilisateurs ne pourraient pas bénéficier d'un véritable service de qualité.

    Les secrets du référencement sur AltaVista

    • AltaVista attribue des valeurs à chaque page afin de les ordonner. Ces valeurs peuvent être absolues (indépendantes du type de recherche) ou relatives (influencées par une recherche donnée).

      Les facteurs privilégiés dans la classification absolue

    • Les pages avec un texte long et ayant un sens (pas de lettres ou de mots au hasard).
    • Les pages qui proposent des liens ou d'autres pages traitant du même thème
    • Les pages présentant des liens efficaces ou de qualité. La valeur d'un site ou d'une page dépend du nombre de liens et de la valeur des sites contenant des liens dans sa direction.
    • Les pages "de proximité" dans un site arborescent : plus la page correspondant à la recherche effectuée est éloignée de la page principale, plus sa valeur sera faible.

      Les valeurs absolues sont recalculées chaque semaine afin de mettre à jour la classification. Il est préférable de choisir une adresse simple que vous garderez longtemps afin de conserver les liens vers le site et de s'assurer un bon référencement sur le moteur de recherche.

      Les facteurs privilégiés dans la classification relative

    • Le titre HTML.
    • Les premières lignes du texte.
    • Les mots et phrases de la recherche placés au début de la page.
    • Les termes précisés dans les balises Méta et réellement utilisés dans le corps du texte
    • Les mots mentionnés dans les ancres (par exemple, si les liens vers le site contiennent un texte identique à celui d'une recherche, les pages apparaîtront en haut des résultats).


    Attention :

    N'oubliez pas que les termes rares sont plus importants que les termes communs. Par exemple, si votre requête contient les termes "fruit" et "papaye", les pages contenant le deuxième mot apparaîtront en haut de la liste des résultats. Par conséquent, il est préférable d'utiliser des termes bien précis lors de la création des pages, des ancres et des balises méta. Plus la page et son contenu seront précis, plus les avantages seront nombreux.

    Retour en haut de la page 


    2.2.3 Les limites inhérentes aux moteurs d'indexation

    1. Les sites qui exigent une inscription ou un mot de passe sont inaccessibles aux moteurs de recherche. N'oubliez pas : les indexateurs ne peuvent compléter aucun type de module ; lorsqu'ils en rencontrent un, ils se bloquent. Si vous souhaitez recueillir des informations concernant les utilisateurs mais aussi indexer les pages, il vous suffit de proposer l'inscription au site en option.

    2. Les indexateurs n'ont pas accès au contenu d'une base de données parce qu'ils ne sont pas en mesure de remplir des modules.

    3. Si le contenu de la base de données du site est essentiellement du texte, vous pouvez l'indexer simplement en créant des pages HTML de type statique comprenant ce même contenu. L'AltaVista kit développeur vous aide à convertir le contenu de la base de données en pages statiques prêtes à être indexées.

    4. Les pages dynamiques sont également inaccessibles aux indexateurs (.asp, .jsp, .cgi etc.). Si vous utilisez des pages dynamiques afin de satisfaire au mieux les exigences des utilisateurs, vous risquez d'en entraver l'indexation complète par un moteur de recherche. Les pages dynamiques sont créées en temps réel à partir des bases de données et se distinguent par le point d'interrogation contenu dans leur adresse. Lorsque l'indexateur d'un moteur de recherche récupère ce type de page, il en indexe le contenu mais ne peut en suivre les liens car pour lui ces derniers sont reliés à un nombre infini de pages.

    5. Si un site web contient de nombreux cadres (frames), vous risquez de rencontrer quelques problèmes d'indexation, que vous pourrez cependant vite résoudre. En règle générale, AltaVista recense tout ce qui se trouve à l'extérieur des cadres et par la suite chaque partie du cadre en tant que pages séparées. Vous verrez ainsi s'afficher uniquement le cadre contenant le résultat de la requête. Afin de sélectionner le mode d'affichage de la page, vous devrez proposer le choix entre la version avec le cadre et celle sans le cadre. Cette dernière peut être placée dans le moteur de recherche grâce à la fonction Ajouter une URL.

    6. AltaVista n'est pas en mesure d'indexer le texte compris dans les photographies ou tout autre élément graphique.Les moteurs de recherche ne peuvent pas "lire" le texte si le webmaster n'a pas inséré la commande ALT pour décrire l'image. Quoi qu'il en soit, AltaVista peut indexer les images d'une autre façon afin de les rendre accessibles.

    Retour en haut de la page 


    7. Le texte contenu dans les fichiers multimédia (audio et vidéo) ne peut être indexé, à moins de recourir à la fonction MP3/Audio et Vidéo.

    8. Les informations générées moyennant les applets Java ou en code XML ne peuvent être indexées.

    9. Il en va de même pour les fichiers .pdf (Acrobat). Cependant, il existe une technique qui permet à AltaVista de convertir ces fichiers en d'autres formats compatibles avec l'indexation. AltaVista recherche Intranet software est en mesure d'indexer ce type de fichiers. Toutefois, si vous souhaitez faire indexer vos pages au plus vite, publiez une version HTML et faites-la connaître grâce à la fonction Ajouter une URL.

    10. Les commentaires, autrement dit les textes entre chevrons , en code HTML ne peuvent être indexés. Ces informations sont de toute façon destinées aux visiteurs qui peuvent les visualiser en cliquant sur "Affichage/Source" ou bien sur "Affichage/HTML".

    11. Lorsque la connexion au site est lente ou lorsque celui-ci comprend des pages d'une grande complexité, l'indexateur, au terme d'un certain délai, renonce à récupérer l'ensemble du texte.

    12. Si la structure du site dépend des répertoires ou présente une forme arborescente, vous devez insérer les informations plus importantes au niveau supérieur. En effet, les moteurs de recherche estiment que les informations ainsi disposées sont prioritaires. Par ailleurs, les indexateurs arrêtent parfois leurs recherches au troisième, quatrième ou cinquième niveau.

    13. En règle générale, il est préférable de faire en sorte que les non-voyants, qui représentent une bonne tranche des utilisateurs d'Internet, puissent avoir accès à votre site. Ils utilisent des navigateurs de type textuel et des convertisseurs vocaux. Cela implique que vous devez offrir si possible une version texte de votre site, même si vous avez publié une version " plus graphique " de celui-ci. Sachez, en outre, que les obstacles qui entravent l'accès aux non-voyants représentent autant de difficultés également pour les indexateurs.

    Retour en haut de la page 


    2.2.4 Gare au " spamming " !

    Ce terme anglais se réfère au comportement incorrect de certains webmasters qui faussent l'indexation des moteurs de recherche afin de faire apparaître leurs pages en tête des résultats. Les tactiques employées par ces " spammers " peuvent être diverses. Retenons simplement un exemple, hélas fréquent : l' insertion d'un grand nombre de mots clés racoleurs et sans rapport avec le contenu du site (exemple : utiliser le mot " sexe " dans les balises Meta ou en couleur de fond sur toutes les pages du site).

    La première conséquence de ces manoeuvres est que l'internaute se sent floué lorsqu'il se rend sur une page sans rapport avec ce qu'il demandait, ce qui est non seulement inefficace, mais qui plus est, mauvais en terme d'image.

    La seconde conséquence est que les moteurs de recherche et AltaVista en particulier sont maintenant très au courant de ces techniques de " triche " et sont en mesure de les contrer facilement. Le risque pour tout spammer est alors de se voir banni à jamais du ou des moteurs concernés et de diminuer par là-même considérablement ses chances de générer du trafic sur son site web. Ceci implique aussi que vous devrez être très vigilant dans le choix de votre hébergeur. En effet, si ce dernier héberge des spammers et des sites pornographiques, votre site sera pénalisé, ou mis de côté, simplement parce que tous les domaines auront la même adresse IP.

    2.3 Contrôlez le référencement de votre site web

    Une fois vos pages indexées par AltaVista, vous pouvez vous servir de la recherche pour vérifier l'efficacité du référencement effectué. Pour contrôler le nombre de pages qui ont été indexées, il vous suffit de saisir host: suivi du domaine (par exemple, host:rcs.fr). Le repérage des titres, des descriptions qui manquent à l'appel, des documents obsolètes ou des doublons est une opération simple, à condition que la liste ne soit pas interminable.
    Prenons un exemple fictif : si vous souhaitez vérifier la sécurité de votre entreprise vous pouvez par exemple taper la phrases-clé suivante :
    host : nom de domaine AND " confidentiel ". Grâce à ce procédé, vous pouvez également vérifier la mise à jour des pages. Lorsqu'il y a plus de 200 pages, il est conseillé de passer par la Recherche avancée : la fonction Contrôler plusieurs résultats permet en effet de visualiser toutes les pages en question.



  • host:altavista.fr AND ("zone réservée" OR secret Connexion Internet recquise
    OR confidentiel OR privée)



    Si vous avez modifié le nom de votre domaine, fichier ou répertoire, il vous suffit de saisir "link:" suivi de l'ancienne adresse afin de savoir s'il existe encore des pages (à l'intérieur du site ou ailleurs) reliées aux anciennes adresses. Si vous souhaitez contrôler plus de 200 résultats, nous vous conseillons de recourir pour cela à la Recherche avancée. De plus, pour effectuer cette recherche complexe, vous devez bénéficier d'une connexion Internet assez rapide car le comptage des pages prend un certain temps. Il vaut mieux également effectuer ces recherches en dehors des " heures de pointe ", c'est à dire après 22 heures.

    " link : " vous permet par ailleurs de savoir combien de pages web sont reliées à votre site, afin d'une part d'en sonder la popularité, et d'autre part de vérifier les descriptions des pages auxquels ces liens donnent accès. Pourquoi ? Parce que l'image véhiculée par le site est un point important. La cohérence entre le contenu de votre site et celui relayé par les autres sites est donc fondamentale.

    N'oubliez pas non plus l'ancre (anchor : ) , autrement dit, le texte mis en évidence dans les liens. Si vous voulez attirer les internautes et faire indexer vos pages, l'ancre doit contenir des termes clairs et précis.

    Retour en haut de la page