Excepcional infografÃa que cubre cómo algún artÃculo de un blog, o noticia en una página web, termina dentro de los resultados que obtenemos de Google.
Resulta cautivante ver todos los pasos que se toman para que, finalmente, podamos ver un link hacia una página como resultado de búsqueda. Por supuesto, todo esto está basado en lo dicho por Google y por algunas estimaciones. Después de todo, Google no ha revelado, hasta ahora, el algoritmo exacto que utiliza.
Resumen de los pasos realizados en una búsqueda en Google:
- Al escribir un texto en la caja de búsquedas de Google esta le llega a un servidor web de Google. Google recibe más de 1000 peticiones de búsqueda cada segundo de todos los dÃas del año.
- Se envÃa la consulta a los servidores de Ãndices de Google. Cada Ãndice está formado por una relación entre una palabra y la dirección del servidor de documentos de Google donde se almacenan las páginas que contienen dicha palabra, conteniendo una parte de las páginas web. Son necesarios varios servidores trabajando en paralelo para calcular el resultado de la búsqueda.
- Con la información obtenida de los Ãndices, se accede a los servidores de documentos de Google que contienen una copia de cada web indexada.
- Se aplica el algoritmo de PageRank para ordenar los resultados de la búsqueda por relevancia.
- Con toda esta información se crea y muestra al usuario la conocida página de resultados (SERP).
En todo este proceso se tienen encuenta aspectos como los atributos “nofollow” de los enlaces y los controles anti-spam.
Algunos datos sobre las búsquedas en Google:
- Sobre los servidores de Google:
- Google está formado por una red de más de 10.000 equipos trabajando en paralelo.
- Cada servidor de la red de Google es extremadamente sencillo y económico.
- El bajo coste del hardware es la base del modelo de negocio de Google y lo que le permite ofrecer la mayorÃa de sus servicios de manera gratuita.
- Cada servidor falla una vez cada tres años.
- Cada dÃa fallan dos servidores.
- Si se produce cualquier problema de hardware, el software de Google lo hace imperceptible para sus usuarios.
- Google no ha sufrido un fallo general desde el año 2000.
- Google contiene más de 4000 millones de páginas, por cada página almacena 10KB de información, lo que supone 40 Terabytes de información.
- Google dispone de 50 mirrows (replicas) por cada servidor.
No hay comentarios:
Publicar un comentario
bienvenid@ a kanlop.com
agradezco que dejes tu comentario y hacer saber tu opinión al respecto.