viernes, 24 de agosto de 2012

Uso avanzado de un buscador de internet





Motor de búsqueda

Saltar a: navegación, búsqueda
Un motor de búsqueda, también conocido como buscador, es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero otros lo hacen además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas.
Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo.


Clasificación

Se pueden clasificar en dos tipos:
  • Índices temáticos: Son sistemas de búsqueda por temas o categorías jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado.
  • Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda en la red.

Clases de buscadores

Buscadores jerárquicos (Arañas o Spiders)

  • Recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas que residan en el servidor.
  • Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.
  • Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.
  • Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la búsqueda estén desactualizados.
  • Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -arañas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.
  • Si se paga, se puede aparecer en las primeras páginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados esponsorizados o patrocinados. Hasta el momento, aparentemente, esta forma de publicidad es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.
  • Ejemplos de arañas: Google, Bing, Hotbot.

Directorios

Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.
  • Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.
  • Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.
  • Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.
  • Su tecnología es muy barata y sencilla.
Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios[cita requerida].

Metabuscador

Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados, según un orden definido por el sistema estructural del metabuscador.

FFA - Enlaces gratuitos para todos

FFA (acrónimo del inglés "Free For All"), Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces no son permanentes.

Buscadores verticales

Los buscadores verticales o motores de búsqueda temáticos, son buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas. Es importante resaltar que utilizan índices especializados, para, de esta manera acceder a la información de una manera más específica y fácil. Algunos ejemplos de estos buscadores son: Nestoria, Wolfram Alpha.
Existen distintos tipos de estos buscadores, algunos son especializados en una rama de una ciencia, y algunos abarcan todo tipo de materias. También existen motores de búsqueda que solo entregan resultados sobre música, ropa o distintos temas.

Historia

El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento. El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler fue también el primero en darse a conocer ampliamente entre el público. También apareció en 1994 Lycos (que comenzó en la Carnegie Mellon University).

Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek, Inktomi, Northern Light y Altavista. De algún modo, competían con directorios (o índices temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron o se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.
Antes del advenimiento de la Web, había motores de búsqueda para otros protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor de búsqueda Verónica, para el protocolo Gopher.
En la actualidad se aprecia una tendencia por parte de los principales buscadores de Internet a dar el salto hacia entornos móviles creando una nueva generación de buscadores: los buscadores móviles.









¿Por qué uso avanzado?

Bien, los buscadores habituales no permiten encontrar multitud de páginas web sobre un determinado tema, el hecho de conocer una serie de modificadores a la hora de realizar búsquedas nos facilita mucho la búsqueda de "información especifica".
Cabe decir que casi todos los buscadores actuales, traen la posibilidad búsqueda avanzada que ofrece todo lo que vamos a ver en este manual de una manera mas gráfica, pero, como cabe esperar es de una edición de búsquedas mas lenta, ya que por lo general debemos rellenar varios cuadros de texto, seleccionar opciones de listbox, etc.
También debo decir que aunque estos modificadores para las búsquedas son muy generales y están muy extendidos, pero no todos los buscadores los usan, de hecho hay algunos que tienen sus propios criterios para búsqueda avanzada.
¿Cuál es el uso simple de un buscador de Internet?
La misión de estas páginas web es localizar a su vez mas páginas web registradas en su base de datos o en servidores de paginas web de Internet. Antiguamente, su búsqueda se basaba en palabras específicas incluidas dentro de un código dentro de las paginas web denominado META TAG CONTENT, donde se ofrecían las palabras claves que identificaban el contenido de web. Pero claro, esto se sustituyo recientemente por otro tipo de búsqueda ¿por que? Por las siguientes razones:
Algunos espabilados se dieron cuenta de que por ejemplo, una de las palabras mas solicitadas en los buscadores es pokemon (esto, en la fecha en que se escribió este documento ;) , pues bien si en esos META TAGS incluía la palabra pokemon, tratara del tema que tratara bajo la búsqueda de la palabra pokemon aparecería, primero, beneficiándose el creador de la web debido al aumento de visitas, pero creando gran confusión.
Otros espabilados se dieron cuenta de que si en el META incluían aparte de palabras muy buscada s la palabra repetida varias veces, el sistema buscador mostraba repetidas veces la web en el buscador, una tontería, pero tu buscas pokemon, y ves que la respuesta del buscador te da 10 veces la misma web y dices pues que importante es...
¿En qué se basan búsquedas usan los buscadores actuales?
Bien dejar claro que lo anterior se está dejando de usar y por eso cuento ese tipo de información, de la cual ni esta web, ni yo como autor me responsabilizo de su uso.
Los nuevos sistemas de búsqueda se basan en una lectura completa sobre el texto del espacio web registrado en su base de datos, de tal manera que se puede encontrar información mas especifica que sabemos que la web lo contendrá en su cuerpo de texto.
Para realizar una búsqueda basta con escribir en el cuadro de texto disponible el tema sobre el que queremos información, fíjate en el siguiente ejemplo:
Buscamos la palabra toros, ¿qué es lo que nos puede o debe aparecer? Pueden aparecernos muchas cosas, razas de toros, plazas de toros, el toro de osborne :) Y tu dices jarl, pero ¿tengo que recorrer todas esas web para encontrar algo específico? En principio si, perooooo hay gente que ya ha pensado eso y han ideado unos sistemas de búsqueda avanzada para conseguir la información de manera mas exacta.
¿Qué ofrece una búsqueda avanzada?
Con una búsqueda avanzada podemos buscar cadenas integras en el cuerpo de la web, que contenga una serie de palabras, aunque estén separas, que contenga unas u otros, unas si, otras no... Pero vamos a verlo despacio.
* Usando "AND"
AND significa y en ingles, y puesto que la delantera en la informática la lleva este idioma en la mayoría de los buscadores funcionará AND, aunque en algunos españoles su puede usar y. ¿para que sirve AND? Sirve para buscar varias palabras, las cuales obligatoriamente se deben encontrar dentro del texto de la web, aunque no estén juntas. Ej:
Si en un buscador escribimos: pokemon and pikachu solo nos mostrara paginas que contengan esas dos palabras, y no las que contengan solo una.

* Usando OR

OR significa o y su uso se basa en la búsqueda de unas palabras u otras, Ej:
Si en buscador escribimos: pokemon or teletubbies, nos devolverá paginas que contengan o teletubbies o pokemon o las dos, esto nos facilita las búsquedas por que sin no deberiamos haberlas realizado una a una.
* Usando "cadena"

Las comillas fuerzan al buscador a buscar paginas que contenga la cadena de texto de manera integra Ej: (seguimos con los pokemon)
Si buscamos "pikachu el mejor pokemon" Solo nos devolverá paginas que contengan esa cadena, este es posiblemente el modificador mas útil.
* Usando NOT
Not significa no ;) y su uso principal es el de descartar palabras. Ej:
Si buscamos Pikachu not pokemon, buscará paginas que contengan pikachu pero no pokemon, lo cual rebaja machismo la respuesta del buscador.


Estos son los mas importantes, hay algunos mas pero no tienen apenas utilidad, ya digo no siempre funcionará pero por regla general si, y facilitan machismo la localización de web o datos.


Ah! No me gustan los pokemon :)
Un saludo...
 "Aprender no tiene por que ser aburrido"
WaKe@irc-bios.net

1 comentario: