lunes, 1 de abril de 2013

Cómo funciona un buscador por dentro. PageRank


Las búsquedas avanzadas pueden ayudarnos a encontrar más eficientemente lo que queremos ya que nos permiten manejar varios parámetros de la búsqueda.

¿Cuándo debemos utilizar las búsquedas avanzadas? La respuesta inicial es obvia: cuando no encontremos lo que buscamos con la búsqueda normal. Si aprendemos a utilizar la búsqueda avanzada puede que en ciertas ocasiones la experiencia nos aconseje ir directamente a ella sin pasar por la búsqueda normal previa.

Es conveniente conocer las opciones de la búsqueda avanzada, con el tiempo intuirás en cada caso cuál es la más oportuna en cada caso. Por ejemplo, una opción de la búsqueda avanzada es buscar sólo dentro de un dominio determinado, a veces es preferible utilizar esa opción que utilizar el buscador que proporciona el sitio web, ya que algunos de estos buscadores son lentos y poco precisos.

Vamos ver las posibilidades de este tipo de búsqueda a partir de la página de búsqueda avanzada de Google, que es una de las más completas. Aunque otros buscadores como Yahoo o Bing también disponen de búsquedas avanzadas similares.



 Opciones generales de una búsqueda avanzada.

Para abrir la búsqueda avanzada tienes que ir a la búsqueda normal de Google y a la derecha del cuadro de búsqueda verás un enlace que pone Búsqueda avanzada.

Ahora que ya hemos aprendido el manejo básico de un buscador podemos entrar a ver cómo funciona internamente. Sólo veremos los conceptos básicos ya que es un tema complejo y los buscadores tampoco dan mucha información al respecto para no dar pistas a la competencia.

Para comprender mejor la tarea de un buscador pensemos primero qué hay en Internet, como está organizada la información. A continuación hablaremos de la propia estructura del buscador para adaptarse a la estructura de los datos de Internet.



 Estructura de datos en Internet.

Ya vimos en la unidad 1 que cualquiera puede introducir información en Internet. Simplemente tiene que disponer de un servidor donde alojarla. Cada nueva página que se crea en Internet tiene una dirección única. Por ejemplo, http://www.aulaclic.es/internet/t_4_7.htm. Cuando alguien decide crear un sitio web elige el nombre que le parece apropiado, y también da el nombre que quiere a las carpetas y páginas que va creando. De forma que los millones de páginas que existen en Internet no tienen porque tener una estructura común ni una relación prefijada entre ellas.

Si comparamos Internet a una gigantesca biblioteca, donde cada libro representa un servidor, no habría manera de colocar los libros en las estanterías de forma que respondiesen a un orden lógico según su contenido. Tampoco habría una forma estándar de ordenar las páginas dentro de cada libro.

Puesto que un servidor puede contener páginas de diferentes temas, y que dentro de un tema las páginas están agrupadas de distinta forma. Si tomamos una página cualquiera de Internet pueden darse diferentes situaciones, desde que sea una página aislada, que esté relacionada con una anterior y una siguiente, o que esté relacionada con millones de páginas.

Así como cuando se cataloga un libro existe una clasificación de materias aceptada universalmente dentro de la cual se puede ubicar un libro según su tema, en Internet no existe esto. Lo más parecido son las categorías del proyecto DMOZ, algunos directorios especializados como los de Universia y de buscadores como Google, pero incluir una página en estos buscadores es algo voluntario por lo que no todas las páginas de Internet están incluidas en ellos.

No hay comentarios:

Publicar un comentario