Quan executeu un lloc d'informació o si teniu altres motius pels quals es pot duplicar un document, és important dir als cercadors quina còpia és la còpia mestra o, a l'argot, la còpia "canònica". Quan un motor de cerca indexa les vostres pàgines, es pot dir quan s'ha duplicat el contingut. Sense informació addicional, el motor de cerca decidirà quina pàgina millor s'adapti a les necessitats dels seus clients. Això podria estar bé, però hi ha moltes instàncies de motors de cerca que ofereixen pàgines antigues i obsoletes perquè van triar el document equivocat com a canònic.
Com especificar la pàgina canònica
És molt senzill dir als motors de cerca l'URL canònic amb meta dades en els vostres documents. Poseu el codi HTML següent a la part superior de la vostra
HEAD element a cada pàgina que sigui no canònic:
Si teniu accés als encapçalats HTTP (com ara .htaccess o PHP), també podeu establir l'URL canònic en fitxers que no tenen HTML
HEAD, com un PDF. Per fer-ho, estableixi els encapçalaments per a pàgines no canòniques com aquesta:
Enllaç: < URL de la pàgina canònica >; rel = "canonical"
Com funciona Canonical Tag i quan no ho fa
Les dades meta canòniques s'utilitzen com a suggeriment als motors de cerca quant a quina pàgina és la màster. Els motors de cerca fan servir aquesta opció per actualitzar el seu índex per fer referència a la còpia mestra com a còpia principal i quan lliuren els resultats de la cerca, proporcionen la pàgina que creuen que és canònica.
Però la pàgina canònica que especifiqueu pot ser que no sigui la pàgina que ofereixen els motors de cerca. Hi ha molts motius pels quals això podria passar:
- Si l'URL que especifiqueu no es troba en 404, els motors de cerca intentaran trobar la segona adreça URL més rellevant per lliurar
- Si el motor de cerca considera que el vostre lloc ha estat piratejat per afegir un URL canònic fals, no l'usarà (per descomptat, tindreu problemes més grans en aquest cas)
- Si col·loqueu l'enllaç a l'etiqueta, o hi ha alguna raó per creure que la
HEAD L'etiqueta no estava tancada. Això es deu a que molts llocs web permeten als usuaris editar el contingut de la pàgina (dins de la
COS element) i, com que una referència canònica sospitada, no seria fiable tampoc.
El que no és la Rel = etiqueta canònica
Molta gent creu que si l'afegiu
Rel = canònic enllaç a una pàgina, llavors aquesta pàgina serà redirigida a la versió canònica, com ara una redirecció HTTP 301. Això no es cert. El
Rel = canònic L'enllaç proporciona informació als motors de cerca, però no afecta la forma en què es mostra la pàgina ni fa cap redirecció al nivell del servidor.
L'enllaç canònic és, en definitiva, només una pista. Els motors de cerca no han d'honrar-ho. La majoria dels motors de cerca intenten respectar els desitjos dels propietaris de pàgines, però al final del dia, els resultats de cerca són el que fan i, si no volen servir a la seva pàgina canònica, no ho faran.
Quan s'utilitza l'enllaç Canonical
Com he dit anteriorment, haureu d'utilitzar l'enllaç a cada pàgina duplicada que no sigui canònica. Si teniu pàgines similars però no idèntiques, de vegades té més sentit canviar un d'ells per ser més diferent que fer-ne una canònica. Està bé marcar dues pàgines que no són del tot idèntiques que canòniques. Han de ser semblants, però sí mai simplement apunta totes les pàgines a la teva pàgina d'inici. Canonical vol dir que la pàgina és la còpia mestra d'aquest document, no cap tipus d'enllaç mestre del vostre lloc.
Crec que és important repetir aquest darrer moment: mai no haureu d'assenyalar totes les vostres pàgines a la vostra pàgina d'inici com a pàgina canònica no importa la temptació de fer-ho. Fent això, fins i tot per accident, pot provocar que totes les pàgines que no siguin canòniques (és a dir, totes les pàgines que no siguin la vostra pàgina d'inici i que tinguin
Rel = canònic enllaç en ell) per eliminar-se dels índexs de motors de cerca. Això no és Google (o Bing o Yahoo! o qualsevol altre motor de cerca) que sigui maliciós. Estan fent el que han demanat que facin, considerant totes les pàgines un duplicat de la vostra pàgina d'inici i retornant tots els resultats a aquesta pàgina. A continuació, com els clients es frustren acabant a la vostra pàgina d'inici en comptes d'un document més rellevant, aquesta pàgina serà menys popular i es reduirà als resultats de la cerca. Fins i tot si solucioneu el problema, podeu matar els resultats de la vostra cerca durant mesos després i no hi ha cap garantia de que es recuperin els vostres llocs.
No hauríeu de fer una pàgina canònica que s'hagi exclòs de la cerca per algun motiu (com ara el
noindex metaetiquetatge o exclòs del fitxer robots.txt). Perquè un motor de cerca pugui fer referència a una pàgina com a canònica, ha de ser capaç de referir-lo, en primer lloc.
Bons llocs per utilitzar el
Rel = canònic L'enllaç inclou:
- Llocs amb URL dinàmics: podeu usar-lo per definir quin format d'URL preferiu
- Llocs de comerç electrònic, especiall en llistes de productes: quan els vostres clients canvien els criteris de classificació, aquesta nova URL no necessita ser indexada
- Contingut sindicat: els editors que utilitzin el contingut que vau escriure han d 'incloure
Rel = canònic enllaç a les pàgines que apunten al document original
Quan no s'utilitza l'enllaç canònic
La primera opció hauria de ser una redirecció de 301. Això no només indica al motor de cerca que l'URL de la pàgina ha canviat, sinó que també porta a la gent la versió més actualitzada (i s'atreveix a dir, canonicol?) De la pàgina.
No siguis mandrós.Si esteu canviant l'estructura de l'URL, utilitzeu alguna forma de manipulació de capçalera HTTP (com ara .htaccess o PHP o un altre script) per afegir les redireccions de 301 automàticament. Tot i que podeu utilitzar el
Rel = canònic link, que no treu les pàgines més antigues. Perquè qualsevol pugui arribar a ells en qualsevol moment. De fet, si un client té una pàgina marcada i canvia l'URL però només actualitza els motors de cerca utilitzant
Rel = canònic link, aquest client ho farà mai vegeu la nova pàgina.
El
Rel = canònic L'enllaç és una eina útil per a llocs amb molts continguts duplicats. En entendre com funciona, podeu utilitzar-lo de manera efectiva. Però, en definitiva, és una eina que els cercadors van publicar per ajudar-los ells mantingueu actualitzats els índexs de cerca. Si no manteniu els vostres servidors netes i actualitzats, els vostres clients es veuran afectats i el vostre lloc podria estar afectat. Utilitzeu-lo de forma responsable.