En un reciente post en Linkedin Gary Illyes ha informado acerca de los errores soft 404 y sus importancia en el comportamiento del bot de rastreo de Google.
A continuación te explico un poco más en detalle ya que esta no es la primera vez que hablamos de errores 404 en nuestros posts. De hecho tienes disponible este post con los errores web tipo 404 más frecuentes y cómo solucionarlos.
Qué es un error soft 404
Un error soft 404 es un fenómeno que ocurre cuando un servidor web devuelve un código http 200 ok para páginas que no existen o contienen errores en su contenido.
El principal problema de estos errores es que en un gran número pueden «engañar» a los bots de búsqueda de Google que inspeccionan nuestro sitio web.
Se trata de un problema de gasto de recursos innecesarios por parte de Google. Algo que desde hace años es prioritario para Google. Cuanto menos recursos pueda «gastar» Google en tu web, mejor.
Suele haber al menos dos causantes típicos de los soft 404.
- Por un lado las url creadas de forma dinámica. Por ejemplo paginaciones, filtros, URLS que «crea» el usuario a través de sus acciones…
- Por otro lado problemas en tus servidores pueden generar soft 404
El tema es que tener 2 errores soft 404 en el total de tus urls no es un gran problema. El problema es grande cuando este comportamiento escala y afecta a muchas urls.
Tienes que entender que el tiempo que pierdan los bots de Google en estas url no lo están «gastando» en tus url que realmente valen la pena.
Puntualizar también que en algunas herramientas como Screaming Frog se les denomina a estos errores «error 404 leve»
Soft 404 en Google Search Console
Los soft 404 los puedes encontrar fácilmente con la herramienta Google Search Console. Aquí te enseño un ejemplo de dónde los puedes encontrar.
Para llegar a ellos desde Google Search Console tan sólo necesitas ir al menú de Indexación > páginas y revisar tanto las indexadas como las no indexadas.
Soft 404 en Screaming Frog
Si prefieres verlos con Screaming Frog «en tiempo real» a la vez que haces un crawl de tu web tendrás que finalizar el crawl y exportarlos en este menú que te indico en la imagen.
Los soft 404 pueden generar errores de indexación
Como avanza Illyes , el problema de los soft 404 es que los bots rastreadores de Google pierden tiempo continuamente en esa url con soft 404 ya que el http devuelve un código 200 a pesar de que haya errores en la página o que no haya contenido.
De hecho , como apunta el autor en el post de LinkedIn, Google acaba por no mostrar estas urls en las que sus bots pasan tanto tiempo en los resultados de búsqueda.
Qué hacer para solucionar los errores soft 404
Monitorizar constantemente tus urls es fundamental para esto. Con Screaming Frog o SeoCrawl lo puedes hacer de una manera bastante sencilla.
Al final la solución pasa por hacer que si realmente en esas url hay un error, hacer que muestren un error 404 para que el bot lo tenga en cuenta y no gaste recursos.