Inicios del JavaScript en SEO
El 23 de Mayo de 2014 Google anuncia en el blog para webmasters una noticia de gran importancia en SEO y es la capacidad de ejecutar JavaScript e indexar ese contenido (y aplicar CSS). Era una noticia esperada. Era normal que no quisiera quedarse atrás ante la creciente riqueza y dinamismo de los sitios webs. A partir de entonces, es capaz de ver ese contenido, cómo hacen los navegadores modernos.
Anteriormente la araña sólo veía el contenido textual bruto y no interpretaba aquel prestado con JavaScript que el navegador sí podía ver. Pero entonces, empezaron a trabajar en entender mejor las páginas web y su sistema de indexación empieza a renderizar un número sustancial de páginas web que usan JavaScript.
No obstante, explican que puede no funcionar, con el consiguiente impacto negativo en los resultados de búsqueda, por los siguientes motivos:
- Si los recursos JavaScript o CSS, en archivos separados, son bloqueados desde el archivo robots.txt. Esto tiene especial importancia cuando se trata de sitios móvil, dónde estos recursos externos (JavaScript y CSS) ayudan a los algoritmos a entender que las páginas están optimizadas para móvil.
- Si tu servidor es incapaz de manejar un volumen elevado de peticiones de rastreo.
- Si el JavaScript es demasido complejo o arcano para ejecutarlo, en cuyo caso no podrán renderizar la página completa y adecuadamente.
- Si el JavaScript hace la función de eliminar contenido en lugar de añadirlo, impedirá a los robots indexar dicho contenido.
- No obstante, tu sitio debería estar preparado para que los usuarios pudieran disfrutar de tu contenido, aunque utilizaran un navegador que no soportase JavaScript o lo tuviera deshabilitado.
Pocos días después de anunciar dicha noticia, Google lanza una herramienta en Webmaster tools que ayuda a los webmasters a entender mejor como Google presta el contenido de un sitio web.
Fuente: http://googlewebmastercentral.blogspot.co.uk/2014/05/understanding-web-pages-better.html
Mayo, 2015: Test de indexación de contenido JavaScript
SearchEngineLand publica una serie de tests asociados a diferentes funciones JavaScript que demuestran como son ejecutadas por GoogleBot,e indexado su contenido:
«We Tested How Googlebot Crawls Javascript And Here’s What We Learned»
Mayo, 2018: Explicación de Google y anuncio del renderizado dinámico
Google nos explica como indexa «JasavaScript powered pages», que puede resumirse en el siguiente proceso:
- Tan pronto como el contenido es renderizado en el servidor, Google indexará la página para mantener el index lo más «fresco» posible.
- Si el sitio web usa renderización del lado del cliente (páginas con contenido dinámico, etc), dicho contenido no será indexado en esa primera fase, dado que requiere recursos adicionales.
- Por tanto, la renderización de ese contenido será diferida hasta que Google tenga recursos disponibles para procesar dicho contenido. Y ese contenido será indexado más tarde, incluso días después.
- Eso implica que algunos detalles pueden perderse. Por tanto, no confíes en que algo será renderizado en el lado del cliente, porque la segunda fase de indexación que lleva a cabo Google en estas páginas, no coteja la etiqueta canonical (entre otros aspectos) Esto implica que no podemos usar soluciones como Google Tag Manager para inyectar dicho contenido.
A su vez, en dicha presentación, Google lanza una nueva propuesta para la indexación de páginas basadas en JavaScript. Un renderizado dinámico que detecte el user-agent de Google y le ofrezca una versión web para ser completamente renderizada (y por tanto indexada) del lado del servidor.
Si has leído este artículo, puede que te interese leer sobre la forma óptima de utilizar tecnología AJAX para SEO y lograr que Google acceda e indexe dicho contenido.
Cuanto trabajo nos va ahorrar esto… Gran noticia.
Habrá que ver en qué medida lo hace por eso de la complejidad en determinados casos que comenta