Índice de contenido
Entre los diferentes factores a tener en cuenta a la hora de posicionar una web, uno de los más importantes es el de tener un site limpio de errores y que facilite la correcta navegación de los robots a través de él. Muchas veces, aunque pensemos que nuestra web está limpia, nuestra manera de gestionar los propios contenidos de la web puede hacer que aparezcan errores: productos que ya no están pero los seguimos enlazando, artículos del blog que hemos eliminado o simplemente contenidos que fueron indexados por Google en su momento y a los que actualmente, por un motivo u otro, ya no puede acceder a ellos.
Una de las maneras que tiene Google para avisarnos sobre la existencia de este tipo de errores es mediante Search Console. En este artículo haremos un listado de los principales errores que podemos encontrarnos, qué significa cada uno y sobretodo cómo aprender a solucionarlos.
¿Dónde encuentro los errores de rastreo de mi web?
Para poder acceder a los errores de rastreo de tu web, primero tendrás que acceder a tu cuenta de Search Console. Una vez en ella, tendrás que seleccionar el proyecto en cuestión y hacer click en Rastreo => Errores de rastreo.
Una vez dentro de esta sección, encontraremos dos tipos de errores de rastreo.
Errores del sitio web
Se trata de errores de rastreo que afectan a toda la web en su conjunto y no a urls específicas. En este caso, en nuestro proyecto no contamos con ningún error en los últimos 90 días pero, ¿qué errores podríamos encontramos?
ERRORES DE DNS
Son aquellos errores que afectan a nuestra web debido a que Google, por una cuestión de DNS, no puede acceder a la misma. Esto se debe principalmente a que el dominio está apuntando por DNS a un servidor erróneo. Para solucionarlo, necesitas acceder a tu gestor del dominio y modificar las entradas DNS, de modo que apunten al host donde tienes la web.
ERRORES DE CONECTIVIDAD DEL SERVIDOR
Se diferencian de los errores DNS en que en estos casos Google sí consigue acceder a la web pero al llegar recibe un error de carga o el contenido tarda demasiado en cargarse.
Si tienes este tipo de problema, probablemente la solución esté en una mala configuración de tu servidor o que este no es lo suficientemente potente para los contenidos o el tráfico de tu web. Contacta con tu proveedor de hosting para que te de algún tipo de solución.
ERRORES DE INFORMACIÓN DE ROBOTS.TXT
Se trata de un error por el cual Google nos avisa de no haber podido acceder al archivo robots.txt de nuestro site. Este documento es importante, ya que informa a los buscadores sobre qué contenidos deben indexar y cuáles no.
Para solucionar este error, debes crear un archivo robots.txt (si no lo tuvieras) y subir a la raíz de tu FTP. Aquí podrás obtener información sobre cómo configurarlo. Si el problema es que Google no lo encuentra, poder mandárselo a través de la sección robots.txt del propio Search Console.
Errores de URL
Son aquellos que afectan específicamente a determinadas urls de nuestro site, no a la web en su conjunto. Generalmente se producen porque la url ha sido eliminada del site sin redireccionarla hacia otro contenido, porque la url ha sido enlazada desde otro site pero devuelve un error 404 o errores de tiempo de carga. Como verás, hay tres pestañas que indican si el error afecta únicamente o la versión desktop, smartphones o teléfonos de gama baja.
Los tipos de errores de url que podemos encontrar son:
ERRORES 404 LEVES
Son aquellos que indican que una url que, en algún momento ha existido y Google ha indexado, está devolviendo un error 404. Generalmente esto ocurre porque ciertos contenidos de la web se han eliminado, se han generado por algún tipo de error de programación sin saberlo o porque algún enlace externo apunta a una página de nuestro site que no existe. Este tipo de errores se catalogan como leves porque la cabecera http de dicha url indica que la url se está mostrando o debería mostrarse correctamente.
Para solucionarlo, lo mejor sería realizar una redirección 301 de todos los errores hacia los nuevos contenidos si los hubiera o hacia la home.
ERRORES 404
Son idénticos a los anteriores pero en estos no cabe duda de que la web devuelve una 404.
Para solucionarlos, utilizaremos también las redirecciones.
ACCESO DENEGADO
Este tipo de error (de tipo 403) se debe a que el servidor donde está alojada la web no está permitiendo el acceso a los robots de Google. En este caso, no es un problema de que no queramos que se indexe o no el contenido (como con el robots.txt), sino que es el servidor el que no está permitiendo la consulta.
Este problema puede deberse a que nuestro proveedor de hosting está limitando el acceso a determinadas IPs, por lo que tendremos que contactar con él y explicarle el problema, o bien ciertas secciones requieren de contraseña y realmente la denegación del paso está siendo correcta.
URLS NO SEGUIDAS
Este tipo de error indica que Google no ha podido rastrear una URL en concreto. Suele ser a causa de algún Flash, JavaScript o similar que dificulta el acceso e indexación de los robots. Para solucionarlo, hay que revisar la programación para evitar este tipo de enlazados internos.
ERRORES DE SERVIDOR
Son aquellos que surgen debido a que el tiempo de espera a la hora de hacer la petición a una url específica ha sido demasiado largo. Muchas veces pueden deberse a problemas puntuales del servidor, por lo que no hace falta solucionarlos. Sin embargo, si el problema persiste, tendrás que hablar con tu proveedor de hosting y explicarle el problema.
Consultor SEO desde 2014, a lo largo de mi carrera he liderado el SEO de grandes webs tanto a nivel agencia como inhouse y actualmente freelance.
Divulgador y ponente, también colaboro desde hace años como profesor en varios máster SEO, así como en masterclasses y cursos para diferentes plataformas.