Etiqueta rel=“Canonical” en SEO: 
Qué es y cómo usarla de forma correcta.

Este post, vamos a hablar sobre la etiqueta Rel=»canonical», y vamos a mirar de explicarte todo lo que implica utilizar esta etiqueta a nivel de SEO.
Además al final del post tendrás un video donde podrás ver todos los detalles y además podrás ver ejemplos con casos reales.

¿Qué es la etiqueta rel=“canonical”?

La etiqueta rel=“canonical” es la forma que tenemos para indicar a Google, cuál es la página más representativa de un conjunto de páginas duplicadas de nuestro sitio web.

A través de esta etiqueta, conseguiremos que los motores de búsqueda identifiquen la página que deben de indexar, frente a las páginas duplicadas o similares que no deberían de indexar.

El ejemplo más sencillo y representativo de una página canónica, sería cuando tenemos varias URL que dirigen a un mismo contenido, como por ejemplo:

  • http://www.dominio.com?categoria=ordenadores
  • http://www.dominio.com/categoria/ordenadores

En este caso, Google solo debería mostrar una URL de las dos como canónica, ya que las dos páginas tienen el mismo contenido, por tanto, Google determina qué página selecciona en base a su criterio, que puede ser por supuesto distinto al nuestro.

Así que para que Google seleccione la página que a nosotros nos interesa posicionar, le definiremos a través de la Etiqueta rel=“canonical” en todas las páginas duplicadas, cuál es la página principal, de esta forma, no dejamos la decisión en manos de Google, sino en nuestras manos.

A partir de este momento, Google rastreará con mayor frecuencia la página canónica, ya que es la página que se considera principal, mientras que las otras versiones no se rastrearán tan a menudo, para de esta forma reducir la carga de rastreo de Google en nuestra web.

Es importante tener en cuenta que las páginas no tienen por qué ser exactamente iguales, ya que no se consideran páginas únicas si incluyen cambios poco importantes, como podría ser la ordenación de los elementos de la página.

Además si las páginas son similares, desde el punto de que hablan sobre temas similares, pero en cambio, no usan las mismas palabras, los motores de búsqueda pueden ignorar la etiqueta en cuestión.

Cómo debemos de insertar la etiqueta rel=“canonical” en nuestra página

Cómo debemos de insertar la etiqueta rel=»canonical» en nuestra página web

La sintaxis a la hora de generar la etiqueta rel=“canonical” es realmente sencilla, simplemente debemos de situarla dentro del elemento <head> del código fuente, y debe de tener el siguiente formato

 <link rel=“canonical” href=”http://www.dominio.com/seo.htm”/> 

El Tag rel=“canonical” solo se debe de utilizar en las páginas que presentan un contenido idéntico al de la página original, en caso contrario, Google podrá ignorar su función.

http://www.dominio.com/seo.html
http://www.dominio.com/seo.html?session_id=1235d32vsd3

Es importante destacar que cuando hay más de un rel=“canonical” en una página, todos los rel=“canonical” serán ignorados por parte de Google.

¿Se puede utilizar la etiqueta rel=“canonical» con documentos PDF ?

Si la URL principal es un documento PDF o cualquier otro tipo de documento compatible con Google, la etiqueta canónica se debe de implementar a través de los encabezados HTTP en vez de la etiqueta HTML

Para ello, deberemos de configurar nuestro servidor para que indique la URL canónica de estos documentos que no son HTML mediante encabezados HTTP rel=“canonical” como el que aparece a continuación, en las URL duplicadas para indicar al robot de Google la URL canónica del archivo PDF:

<http://www.dominio.com/descargas/informe-seo.pdf>; rel="canónica"

http://www.dominio.com/descargas/informe-seo
http://www.dominio.com/descargas/informe-seo.pdf

En este caso, la segunda url es la que debería considerarse como fuente original . Por tanto al ser un documento PDF, la etiqueta canónica se sitúa en la cabecera del la url que enlazará al documento PDF, indicando así a Google que este documento PDF es el estándar para la indexación.La forma de implementara la etiqueta a través de cabeceras HTTP del servidor son:

La forma de implementara la etiqueta a través de cabeceras HTTP del servidor son:

  • Usando programación PHP
  • Usando el .htaccess que sería de la siguiente forma:
<Files "archivo.pdf">
Header add Link "<http://www.dominio.com/archivo.html"; rel=\"canonical\""
</Files>

¿ Recomendaciones a la hora de implementar la etiqueta rel=»canonical» ?

A la hora de implementar la etiqueta rel=“canonical” debemos de tener algunas cosas en cuanta para que todo funcione correctamente. 

  • Utilizar Urls absolutas. Aunque podemos utilizar urls absolutas y relativas, John Mueller nos recomendó a través de uno de sus tweets que recomendaba utilizar urls absolutas en las etiquetas rel=“canonical” para que estemos seguros que Google interpreta la información correctamente.
  • Utilizar urls en Minúsculas. Cómo Google puede tratar las Urls en mayúsculas y en minúsculas de forma diferente, es una buena práctica tener todas las URLs en minúsculas para evitar posibles problemas. De esta forma siempre tendremos que usar las urls en minúsculas en las etiquetas rel=“canonical”.
  • Utiliza siempre la versión correcta del protocolo: La primera recomendación es utilizar https, ya que Google busca protocolos seguros, por tanto ten toda la web con el protocolo https, y haz todas las llamadas a la etiqueta rel=“canonical” en formato seguro. Obviamente si al final no tienes la web de forma segura, pon los enlaces en formato http.
  • Utiliza la etiqueta canonica autoreferenciandote. Esta recomendación puede parecer un poco absurda, pero John Mueller de Google dice que, aunque no es obligatorio, las etiquetas canónica autorreferenciales son recomendadas. El motivo según John Mueller, es que usar la canónica autorreferencial deja claro a Google qué página queremos que se indexe, o cuál debería ser la URL que indexe. 

¿ La etiqueta rel=“canonical” sirve para todos los motores de búsqueda ?

La etiqueta rel=“canonical” está soportado por los principales motores de búsqueda, como Yahoo!, Bing y Google.

Métodos alternativos para canonizar un contenido

Aunque en este artículo estamos hablando de la etiqueta rel=“canonical”, os voy a explicar otras formas de canonizar un contenido, que aunque no son formas oficiales, sí que indican a Google nuestro interés por canonizar un contenido.

1. Configurar canónicas en el HTTP header

Como ya hemos comentado anteriormente existe una forma de canonizar los documentos PDF y es a través de las cabeceras HTTP, pues bien, esta forma también nos va a permitir hacerlo para páginas html.

2. Configurar canónicas a través del sitemap

Como también hemos comentado anteriormente, Google considera las páginas insertadas en el sitemap como páginas canónicas sugeridas. Además Google afirma que las páginas no-canónicas no deberían ser incluidas en sitemaps. 

3. Configurar páginas canónicas con redirecciones 301

En el fondo la lógica de la redirecciones 301 es canonizar el contenido, ya que lo que hace es derivar el tráfico de una página a otra, y transferir las propiedades de la primera a la última.

Imaginemos que podemos acceder a nuestra home a través de estas URLs:

  • dominio.com
  • dominio.com/index.php
  • dominio.com/home/

Como tendremos tres urls con el mismo contenido, esto quiere decir que tendremos contenido duplicado, así que deberemos de elegir un URL como la canónica y redirecciona las otras URLs hacia esta.

Por supuesto, hay varios casos standards a nivel de redirecciones 301 que deberíamos de controlar:

  • Misma versión para páginas  HTTPS/HTTP 
  • Misma versión en dominios con www y sin www de tu sitio. 

En estos casos, lo que deberemos de hacer es eligir una versión canónica y redirecciona las otras hacia ella.

4. Configurar páginas canónicas a través de enlaces internos

El último método para enviar señales a Google para determinar las páginas canonizadas es a través de los enlaces internos.

A través de los enlaces Internos, vamos a enviar señales al buscador, para que entienda cuales son las páginas importantes, de esta forma a los motores de búsqueda les resultará más fácil determinar tu URL canónica preferida.

Factores que tiene en cuenta Google para determinar la mejor página canónica

Debemos de tener en cuenta siempre, que la etiqueta rel=“canonical” es una recomendación, por lo que puede ser que Google o el motor de búsqueda en cuestión no coja la página canónica que le hemos indicado por que de alguna forma no la considera como principal.

Por este motivo, es importante saber cuales son los factores más relevantes por parte de Google, para determinar cual es la página canónica en cuestión:

  • La página se publica mediante http o https:

    Actualmente las páginas con extensión https tienen prioridad sobre las http.

  • La calidad de la página:

    La calidad de la página es fundamental, por lo que la página más completa será la canónica para el buscador.

  • Si la URL está en un sitemap:

    Google entiende que las páginas que insertamos en el sitemap se consideran como las principales, aunque también es verdad, que este factor posiblemente sea el que menos valor da para Google.
  • Si la página incluye la etiqueta rel=“canonical”:

    Aunque como hemos comentado anteriormente esta etiqueta es una recomendación por lo que es posible que Google elija otra página como canónica, si considera que otra página es más completa y relevante.

¿Por qué debería elegir una URL canónica?

Como has visto anteriormente Google seleccionará cual es la página Canónica mas adecuada en cada caso, pero es importante que nosotros le indiquemos cuál es para nosotros la mejor página, para que de alguna forma nos tenga como factor, y para que en casos donde las dos páginas son exactamente iguales, Google coja la que deseamos posicionar nosotros.

Además, en webs de gran tamaño el crawleo de la web por parte del robot de Google tiene unos costes muy altos (Crawl Budget), por tanto mal gastar el tiempo en páginas duplicadas es una forma de tirar dinero y recursos.

¿En qué casos debería utilizar rel=“canonical”?

A parte del punto anterior, tenemos otros factores que nos recomiendan utilizar la etiqueta canónica sobre un conjunto de páginas duplicadas o similares:

  • El contenido duplicado no aporta valor.

    Si el contenido duplicado no aporta valor para el usuario por qué debería de aportar para Google, siempre debemos de tener la premisa de simplificar y eliminar todo lo superfluo, y el contenido duplicado siempre es algo que no aporta.
  • Para indicar la URL que quieres que se muestre en los resultados de búsqueda.
    En los casos que tenemos dos o más páginas que pueden ser exactamente iguales o excesivamente similares, nos interesa indicar a Google cuál es la url que queremos que nos indexe y nos muestre en sus SERPs.

      
    https://www.dominio.com/categoria?categoria=seo&nivel=avanzado
       https://www.dominio.com/categoria/seo/avanzado.html
       https://www.dominio.com/categoria/seo/avanzado.html?gclid=ABCD
  • Para consolidar las señales de los enlaces de páginas similares o duplicadas.
    Todos sabemos de lo importante que es la autoridad para posicionar una página, y todos sabemos que el factor principal para captar autoridad, es la transferencia de autoridad a través de enlaces que apuntan a nuestras páginas.

    A través del Tag Canónica, los motores de búsqueda agruparán en una única URL, las señales y en concreto la autoridad de las páginas duplicadas o similares.

    Es decir, los enlaces de webs externas que apunten a la url   https://www.dominio.com/categoria/seo/avanzado.html?gclid=ABCD y https://www.dominio.com/categoria?categoria=seo&nivel=avanzado se consolidarán con los enlaces que llevan a https://www.dominio.com/categoria/seo/avanzado.html

    Además, gestionando bien las páginas duplicadas, podremos mejorar nuestra distribución de LinkJuice entre las páginas que sí aporten valor.
  • Para gestionar el contenido sindicado. 
    Si permites que tu contenido se publique en otros dominios, te recomendamos que le indiques a estos sitios que utilicen el Tag Canónica en sus páginas. Obviamente esto es difícil de realizar, pero hay que decir que Google considerará contenido duplicado este nuevo contenido, por lo que de alguna forma es recomendable gestionarlo.
  • Tener versiones imprimibles de las páginas por separado.
    Existen muchas webs que tienen la opción de imprimir el contenido y a veces esta funcionalidad se realiza a través de otra página nueva que está generando contenido duplicado.

    Por ejemplo:
     dominio.com/tutorial-canonica
     
    dominio.com/print/tutorial-canonica

¿ Qué errores podemos cometer al utilizar la etiqueta Canónica ?

A la hora de utilizar la etiqueta rel=“canonical”, hay varios factores que vamos a explicar a continuación qué debemos de tener en cuenta.

  1. Usar noindex en paginas con canónica: Según John Mueller, mezclar noindex y rel=“canonical”, son instrucciones contradictorias, y aunque Google suele dar prioridad a la etiqueta canónica sobre la etiqueta ‘noindex’.Sigue siendo una mala práctica. Si no quieres indexar y a la vez canonizar una URL, usa una redirección 301. De lo contrario, usa rel=“canonical”.
  1. Utilizar las etiquetas noindex , disallow ni nofollow en combinación con las urls canónicas, es un error ya que debemos de recordar que Google transfiere las “propiedades”
  2. Utilizar rel=“canonical” con paginaciones que utilicen parámetros rel=”next” y rel=”prev” , no tiene sentido utilizar las etiquetas canónica ya que, desde el punto de vista técnico, no se considera contenido idéntico.
  3. Insertar la etiqueta rel=“canonical” en el cuerpo del HTML es un error, siempre debe de estar en el <head>  del documento. Además, para facilitar el análisis del HTML, es bueno incluir el atributo rel=“canonical” tan pronto como sea posible en el <head>. Esto quiere decir, que cualquier otra ubicación de la etiqueta rel=“canonical” que no esté dentro de las etiquetas <head> no se tendrá en cuenta.
  4. Insertar más de una etiqueta rel=“canonical” por página, en caso de que exista más de una por página, los motores de búsqueda ignorarán todas las etiquetas rel=canonica.
  5. Bloquear la URL canonizada a través de robots.txt Bloquear una URL a través del robots.txt impide que Google lo rastree, lo que significa que no podrán ver ninguna etiqueta canónica en esa página, por lo que tampoco podrá transferir autoridad a la página canónica.
  6. Canonizar todas las páginas paginadas a la principal. Como hemos comentado con anterioridad, las páginas paginadas no deben ser canonizadas a la primera página paginada de la serie. En su lugar, se deben usar canónicas autorreferenciales en todas las páginas paginadas.
  7. Canónica apuntando a página 4XX Esta advertencia se activa cuando una o más páginas son canonizadas a una URL 4XX. Esto es un problema, por que los motores de búsqueda no indexan páginas 4XX.. Como resultado, ignoran cualquier etiqueta canónica que apunte a tales páginas.
  8. Canónica apuntando una página 5XX. Esta advertencia se activa cuando una o más páginas son canónicas a una URL 5XX. Debemos de tener en cuenta que los códigos de estado HTTP 5XX indican problemas en el servidor, que dan como resultado una página canónica inaccesible. Es poco probable que Google indexe páginas inaccesibles, por lo que podría ignorar el código canónica.
  9. Canónica apuntando a  una redirección Las canónicas deben siempre señalar la versión con mayor autoridad de una página. Este no es el caso con la redirección de URLs. Como resultado, los motores de búsqueda pueden malinterpretar o ignorar la etiqueta.
  10. Utilizar la etiqueta rel=“canonical” en artículos paginados

    Este caso se refiere a aquellos artículos que están divididos en varias páginas, es decir, aquellas páginas en las que hemos determinado que sería mejor tener el contenido separado en varias páginas

    dominio.com/articulo-seo?story=errores-etiqueta-canonica&page=1
    dominio.com/articulo-seo?story=errores-etiqueta-canonica&page=2

    Especificar un rel=“canonical” de la página 2 (o cualquier otra página posterior) a la página 1 no es correcto. Y no es correcto por qué estas páginas no son páginas duplicadas, sino que es un artículo que se ha dividido en diferentes páginas.

    Indicar rel=“canonical” en un caso así , causaría que el contenido de la página 2 no se indexen en absoluto.

    En casos de contenido paginado, recomendamos que el rel=canonica en las páginas de la serie apunte a una versión en la que esté todo el artículo entero, o si no deseamos tener este artículo, recomendamos utilizar el marcado de paginación creado específicamente para estos temas.

¿Cuál es mi URL canónica según Google?

Google a través de Google Search Console, nos puede indicar cuál es la página canónica de cada url.   

Ten en cuenta que, aunque selecciones específicamente una página canónica, Google puede elegir otra distinta a la tuya por varios motivos como hemos comentado anteriormente.

Y hasta aquí todo lo relacionado con el tag rel=“canonical”, si crees que podemos completar el artículo con alguna información más por favor, déjanos un comentario y lo completaremos.

Video del post con casos de ejemplo

En el siguiente video podrás tener un resumen de todo este post y en la parte final, podrás encontrar unos ejemplos en casos reales sobre la utilización de la etiqueta rel=»Canonical»