La canonical es una etiqueta vital para indicar cuál es la página principal, evitar problemas de contenido duplicado y mejorar la indexación.
Google define una url canónica como aquella considerada como dirección principal de un grupo de urls. Esto puede hacerlo de forma automática pero también puedes ser tú quien controle (no siempre) cuál es la url que debe tener el peso y, por tanto, la que debe ser indexada. Estos son los dos escenarios posibles:
No indicas cuál es la url canónica a través de la etiqueta correspondiente. ➡️ Google decide por ti. ➡️ Puede considerar que todas ellas tengan la misma importancia y por tanto perderá tiempo de rastreo en cada una y además todas aparecerán en los resultados de búsqueda sin que haya una página clara para posicionar por un término concreto.
Indicas cuál es la url canónica vía código. ➡️ Google lee la etiqueta (aunque tendrá en cuenta otras consideraciones). ➡️ Fomentas un mejor rastreo de la página canónica y tienes un mayor control sobre la apariencia de los resultados de búsqueda sin que varias páginas se peguen entre sí a la hora de mostrar un resultado claro para una búsqueda.
Veámoslo con un ejemplo. Es muy frecuente que un gestor de contenidos genere urls con parámetros de búsqueda o ID de sesión al activarse determinados filtros dentro de una página, como por ejemplo:
- https://www.midominio.com/faldas/
- https://www.midominio.com/faldas#azul/
- https://www.midominio.com/faldas#tallamediana/
- https://www.midominio.com/faldas?gclid=1344/
Ocurre también, por ejemplo, cuando hablamos de url diferentes para cada dispositivo (m.midominio.com/faldas o midominio.com/faldas/amp).
En buena parte de los casos, el contenido que se muestra en cada página es muy similar pero también hay veces en que es idéntico. ¿Qué hacer para que Google no las considere versiones duplicadas de la fuente original? Elegir una url como versión canónica. En la práctica, con ello procuramos que rastree con mayor frecuencia la url «buena» y que no pierda tiempo rastreando continuamente las duplicadas (sí las rastreará por si hubiera cambios pero lo hará menos veces y además en principio no las mostrará en los resultados de búsqueda).
? Ojo: la canonical no es una «obligación», es una indicación que Google puede considerar válida o no. En algunos casos, pese a marcar mediante la etiqueta canonical la url «favorita» el bot puede elegir otra distinta por el contenido o el rendimiento de la página.
Principales utilidades SEO de la etiqueta canonical:
- Indicar a Google qué url quieres que aparezca en los resultados de búsqueda
- Optimizar el tiempo de rastreo para que el bot de Google visite las páginas que son realmente importantes
- Consolidar las señales que se reciben a través de backlinks: aunque haya enlaces apuntando a /faldas?gclid=1344 Google seguirá entediendo que /faldas es la url preferida.
¿Cómo saber cuál es la url canónica?
Para saber cuál está tomando Google como canónica (más allá de lo que diga la etiqueta, que como ya hemos visto no siempre manda) puedes consultarlo a través de Google Search Console mediante la herramienta de inspección de urls.
Cómo indicar la url canónica
Existen varios métodos para ofrecer información a Google de nuestra url preferida dentro de un grupo de páginas idénticas o similares; nosotros sólo te explicaremos la etiqueta pero vamos a enumerar el resto de opciones para que las conozcas.
La etiqueta que iría en la sección <head> de las variantes de una página principal que no quieres indexar sería como ésta:
<link rel=»canonical» href=»https://midominio.com/faldas/» />
Como ves, la dirección que se indica es la de la página considerada como principal. Esta url debe ser absoluta.
Otros métodos de indicar la url canónica:
- Mediante encabezados HTTP rel=»canonical» configurando el servidor. Esto permite indicar la url canónica de archivos que no sean HTML como, por ejemplo, los PDF.
- A través de Google Search Console indicando el dominio preferido (por ejemplo, https://www.midominio.com frente a https://midominio.com)
- A través del sitemap: indica únicamente a través de este archivo cúales son las páginas canónicas, no incluyas nunca las que no lo sean para no confundir al bot
- Las redirecciones 301 indican que una página se ha trasladado de forma permanente a otra url. Así, si tienes varias versiones de una misma página pero sólo quieres que los usuarios y los buscadores accedan a una de ellas, es la mejor forma de que no se desperdiguen las visitas
Y algunos errores a evitar:
Los errores a la hora de utilizar la canonical son muy frecuentes y variados, así que los vamos a resumir en los más comunes.
Comprueba que la url indicada como canónica exista y no dé 404. A veces por un error de transcripción pero también en ocasiones porque ha cambiado la web sin tener en cuenta la etiqueta canonical, este fallo es relativamente frecuente aunque fácil de subsanar.
Indica sólo una rel=canonical por cada página o Google las ignorará y comprueba que esté en el <head>.
No uses la canonical en las paginaciones: es un error habitual hacerlo pero en realidad en lugar de estar evitando contenido duplicado estás entorpeciendo que el contenido de calidad incluido más allá de la página 1 se indexe correctamente. Google hasta ahora recomendaba gestionar este tipo de contenido mediante las etiquetas rel=”prev” y rel=”next”. Después de que haya anunciado que no tiene en cuenta estas etiquetas (¡¡desde hace años!!) no hay una recomendación clara:
Spring cleaning!
As we evaluated our indexing signals, we decided to retire rel=prev/next.
Studies show that users love single-page content, aim for that when possible, but multi-part is also fine for Google Search. Know and do what’s best for *your* users! #springiscoming pic.twitter.com/hCODPoKgKp— Google Webmasters (@googlewmc) 21 de marzo de 2019
Usa direcciones absolutas, no relativas, o de lo contrario Google entenderá que indicas como canónica la versión en http.
No cofundas redirecciones 301 con canonical o de lo contrario tus usuarios no podrán entrar en las páginas: una cosa es que no quieras que se indexen y otra que las visite un usuario.
Y si utilizas etiquetas hreflang porque tu web está traducida a varios idiomas, Google dice que debes usar la canonical. Hazlo con una página específica en el mismo idioma de tal manera que coincida con el hreflang de la versión en la que estés.
Bibliografía
Ayuda oficial de Google sobre uls canónicas
Errores más comunes con la etiqueta canonical (en inglés)
El uso de canonical con otras etiquetas
Muy buenas;
Tengo una duda, si tenemos dos páginas que tratan sobre algo parecido, escogemos una de ellas como la canonical y google lo acepta. ¿Que está ocurriendo exactamente?
A) Google tiene en cuenta el contenido de las dos páginas para el tema SEO, pero muestra solo la versión canonical
B) Google no tiene en cuenta el contenido de la página no canonical y no suma en el tema SEO. Sería como eliminarla completamente a ojos de Google.
Muchas Gracias
Buenas tardes Carlos,
El atributo canonical es simplemente una recomendación que Google puede o no tener en cuenta y cuyo uso resulta muy recomendable sobre todo en tiendas Online de cara a evitar el contenido duplicado.
Con respecto a tu pregunta: Si tenemos varios productos muy similares (por ejemplo, prendas de ropa que difieren únicamente en el color), lo ideal es definir una prenda principal (por ejemplo, la más vendida o representativa) y establecer un canonical desde el resto de prendas “hermanas” hacia esta.
Google va a seguir rastreando todas las páginas y estas no serán contenido duplicado. Con el paso del tiempo es muy probable que las prendas “hermanas” dejen de aparecen en los resultados de búsqueda, pero continuarán traspasando PageRank interno a la principal.
Esperamos que te sirve la respuesta.
Un saludo