Title Image

Blog

¿Qué es un Motor de Búsqueda?

  |   SEO   |   No comment

Escriba una palabra o frase en un cuadro de búsqueda y haga clic en un botón. Espere unos segundos y aparecerán miles (o cientos de miles) de referencias a páginas, tras lo cual sólo tiene que hacer clic en ellas para encontrar lo que busca. Pero, ¿qué es exactamente un motor de búsqueda? ¿Qué hay detrás de este concepto general de buscar-encontrar?
Es un poco complicado. En el back-end, un motor de búsqueda es un programa que utiliza aplicaciones que recogen información de páginas Web. El programa suele recoger palabras clave o frases que son posibles indicadores de lo que contiene la página Web, como un todo (el URL de la página, el código que conforma la página y los enlaces entrantes y salientes). Luego se indexa esta información y se almacena en una base de datos.
En el front-end, el programa tiene una interfaz de usuario en la que los usuarios introducen un término de búsqueda (una palabra o frase) para encontrar una información determinada. Cuando el usuario hace clic sobre el botón de búsqueda, un algoritmo examina la información almacenada en la base de datos del back-end y devuelve un conjunto de enlaces a páginas Web que parecen coincidir con el término de búsqueda introducido por el usuario.
El proceso de recoger la información de las páginas Web lo realiza un agente llamado rastreador (crawler), araña (spider), o robot. El robot rastrea todos los URL de la Web y recoge las palabras clave y las frases de las páginas, que luego incluye en la base de datos que impulsa un motor de búsqueda. Teniendo en cuenta que el número de sitios Web sobrepasó los cien millones hace algún tiempo, y que se está incrementando a un ritmo de un millón y medio de sitios cada mes, este funcionamiento se parece a nuestro cerebro, que cataloga todas las palabras que leemos, ya que cuando necesitamos saber algo, pensamos en una palabra y todas las referencias a ella vienen a la mente.
En una palabra, abrumador.

Anatomía de un buscador

Por ahora, lo más probable es que tengamos una imagen difusa de cómo funciona un buscador. Hay mucho más que la descripción básica que hemos visto hasta ahora. De hecho, los motores de búsqueda tienen varias partes y, lamentablemente, es difícil encontrar una explicación acerca del funcionamiento, y esa información es de vital importancia para tener éxito en la optimización para motores de búsqueda, SEO (Search Engine Optimization).

Rastreadores, arañas y robots

La interfaz de búsqueda es la única parte del buscador que ve el usuario; las demás partes están detrás de las cámaras, fuera de la vista de las personas que lo utilizan cada día. Esto no quiere decir que sea menos importante, sino todo lo contrario: el back-end es la parte más importante del motor de búsqueda.

Si alguna vez hemos navegado por Internet, seguramente habremos oído hablar de las arañas (spider) , los rastreadores (crawler) y los robots. Estas pequeñas criaturas son programas que literalmente rastrean la Web, catalogando los datos para que se puedan buscar. En el sentido más básico, estos tres programas, rastreadores, arañas y robots, son esencialmente la misma cosa: todos recogen información de las Web. Luego esta información se cataloga, de acuerdo al URL en el que se encuentran y se almacena en una base de datos. A continuación, cuando un usuario utiliza un buscador para encontrar algo en la Web, se buscan las referencias de la base de datos y se devuelven los resultados de búsqueda.

Bases de datos

Los buscadores contienen o se conectan a un sistema de bases de datos donde se almacenan los datos de los URL de la Web (que recogen los rastreadores, arañas o robots). Estas bases de datos son áreas de almacenamiento masivas que contienen múltiples puntos de datos a cada uno de los URL.
Los datos se pueden organizar de varias formas y se ordenarán de acuerdo a un determinado método de clasificación y recuperación de datos, que generalmente es propiedad de la empresa propietaria del buscador.

Algoritmos de búsqueda

Todas las partes del motor de búsqueda son importantes, pero el algoritmo de búsqueda es el elemento que hace que todo funcione. Quizás seria más correcto decir que el algoritmo de búsqueda es la base sobre la cual se construye todo lo demás. El funcionamiento del buscador se basa en el algoritmo de búsqueda, o en la forma en que el usuario descubre los datos.
En términos muy generales, un algoritmo de búsqueda es un procedimiento de resolución de problemas que toma un problema, evalúa un número de posibles respuestas y devuelve la solución del problema. El algoritmo de búsqueda de un motor toma el problema (la palabra o frase de búsqueda), examina la base de datos que contiene las palabras clave catalogadas, así como los URL con los que esas palabras están relacionadas y entonces devuelve las páginas que contienen la palabra o la frase de búsqueda, tanto en el cuerpo de la página como en el URL que apunta a la página.
Este pequeño y atractivo truco se implementa de manera diferente, según el algoritmo que se utilice. Los algoritmos de búsqueda se pueden clasificar de varias maneras y cada buscador utiliza algoritmos ligeramente diferentes. Ésta es la razón por la que la búsqueda de una palabra o frase da resultados diferentes en los distintos motores de búsqueda. Los algoritmos de búsqueda más habituales son los siguientes:

  • Búsqueda en lista: Este algoritmo recorre los datos buscando una clave.
    Los datos se buscan de forma lineal, siguiendo una lista. El resultado de esta búsqueda suele ser un único elemento. La búsqueda a través de miles de millones de sitios Web puede consumir mucho tiempo, pero se obtiene un resultado más pequeño.
  • Búsqueda en árbol: Pensemos en un árbol. Ahora, examinemos este árbol desde la raíz hasta las hojas; así es cómo funciona este algoritmo de búsqueda. El algoritmo busca un conjunto de datos. Los conjuntos de datos son como los árboles: piezas de información que pueden expandirse, en ramas, hacia otras piezas de datos. La Web se ha creado así, y los árboles de búsqueda son útiles para hacer búsquedas en ella, aunque hay otras maneras de buscar datos.
  • Búsqueda SQL: Uno de los inconvenientes de la búsqueda en árbol es que trabaja de forma jerárquica, en el sentido de que se recorren de un punto a otro, según la clasificación de los datos que se buscan. Una búsqueda SQL permite buscar los datos de forma no jerárquica, lo que significa que se pueden buscar en cualquier subconjunto.
  • Búsqueda informada: Un algoritmo de búsqueda informada busca una respuesta específica a un problema concreto en un árbol de datos. La búsqueda informada, a pesar de su nombre, no es siempre la mejor opción para las búsquedas en la Web, debido a la naturaleza de las respuestas que se solicitan. La búsqueda informada es mejor para hacer consultas concretas en conjuntos de datos específicos.
  • Búsqueda opuesta: Un algoritmo de búsqueda opuesta busca todas las soluciones posibles a un problema, como la búsqueda de todas las soluciones de un juego. Es difícil utilizar este algoritmo para las búsquedas en la Web porque el número de soluciones a una palabra o frase de búsqueda es casi infinito.
  • Satisfacción de restricciones: Al buscar una palabra o frase en la Web, es probable que este algoritmo lo haga correctamente. En este tipo de algoritmo de búsqueda, la solución se calcula a partir del cumplimiento de un conjunto de limitaciones. Los datos se pueden buscar de varias formas diferentes que no tienen por qué ser lineales. Estos algoritmos pueden ser muy útiles para la búsqueda en la Web.
Éstos son sólo algunos de los diferentes tipos de algoritmos que se utilizan cuando se crea un buscador. Muy a menudo se utiliza más de un tipo de algoritmo de búsqueda o, como sucede en la mayoría de los casos, se crean algoritmos de búsqueda en propiedad. La clave para maximizar los resultados del buscador está en comprender un poco cómo funcionan los diferentes buscadores que usa. Sólo cuando se entiende esto se optimizan los resultados, al cumplir con los requisitos de búsqueda de ese motor.

Recuperación y clasificación

Para un buscador, la recuperación de los datos es una combinación de las actividades del rastreador, la base de datos y el algoritmo de búsqueda. Estos tres elementos trabajan en equipo para recuperar la palabra o frase que el usuario introduce en la interfaz del motor de búsqueda. Y, la forma en que todo esto funciona puede ser una combinación propietaria de tecnologías, teorías y código.
La parte realmente dificil viene con la clasificación, o ranking, de los resultados. En la clasificación invertiremos también la mayor parte del tiempo y del esfuerzo. Nuestro ranking, en un motor de búsqueda, suele determinar cómo ve la gente nuestra página, lo que afecta a todo: desde nuestros ingresos hasta nuestro presupuesto publicitario. Desafortunadamente, la forma en que el motor de búsqueda clasifica las páginas es una dura ciencia sujeta con pinzas.
Lo que más se puede esperar, la mayoría de las veces, es intentar adivinar cómo clasifica el buscador nuestros resultados y, a continuación, tratar de adaptar la página para satisfacer esos resultados. Pero debemos tener en cuenta que, aunque la recuperación y la clasificación figuran aquí como temas independientes, en realidad son parte del algoritmo de búsqueda. El objetivo de esta separación es ayudar a comprender mejor cómo funcionan los buscadores.
Como la clasificación juega un papel muy importante en la optimización de buscadores, se verá con frecuencia en este libro y la abordaremos desde todas las perspectivas antes de llegar a la última página. Pero, de momento, echemos sólo un vistazo a lo que afecta a la clasificación. Tengamos en cuenta, sin embargo, que los distintos motores de búsqueda utilizan diferentes criterios de clasificación, así que la importancia que juega cada uno de estos elementos puede variar.

  • Localización: No nos referimos aquí a la localización (como en el URL) de una página Web, sino a la localización de palabras clave y frases en la página Web. Así, por ejemplo, si un usuario busca «cachorros» (puppies), algunos motores de búsqueda ordenarán el resultado basándose en el lugar de la página donde aparece la palabra «cachorros». Obviamente, cuánto más arriba aparece la palabra en la página, la página aparece más arriba en el ranking. Por lo tanto, es más probable que un sitio Web que contenga la palabra «cachorros» en la etiqueta del título, aparezca más arriba en el ranking, que otro sitio Web que hable de cachorros, pero que no tenga la palabra en la etiqueta del título. Esto significa que un sitio Web que está diseñado sin el SEO en mente, probablemente no aparecerá en el lugar del ranking que esperamos. El sitio www. . puppies . com ilustra esto perfectamente. En una búsqueda en Google aparece en el quinto lugar y no en el primero, posiblemente porque no contiene la palabra clave en la etiqueta del título.
  • Frecuencia: La frecuencia con la que el término de búsqueda aparece en la página también puede afectar a la clasificación de los resultados de búsqueda. Por ejemplo, en una página de cachorros, se puede posicionar mejor una que utiliza la palabra cinco veces que otra que la usa sólo dos o tres veces. Cuando la frecuencia de las palabras se convirtió en un factor importante, algunos diseñadores de sitios Web empezaron a utilizar, cientos de veces, palabras ocultas en las páginas, tratando de inflar artificialmente el posicionamiento de la página. La mayoría de los motores de búsqueda reconocen esto como spam de palabras clave e ignoran, o incluso se niegan a listar, las páginas que utilizan esta técnica.
  • Enlaces: Uno de los factores de posicionamiento más recientes es el tipo y el número de enlaces a una página Web. Se tienen en cuenta los enlaces del sitio, los que entran en el sitio ylos que salen del sitio. Podría resultar que el que tiene más vínculos a su página, o tiene más enlaces entrantes, posicionaría mejor que otras, pero, una vez más, no tiene por qué ser así. Concretamente, el número de enlaces entrantes relevantes, el número de enlaces relevantes dentro de la página y el número de enlaces salientes relevantes, tendrán influencia en el lugar que ocupa la página en los resultados de búsqueda.
  • Cick-through: El último elemento que puede determinar la forma en que su sitio se posiciona en una búsqueda es la cantidad de clics (click-through) que tiene su sitio, con respecto a los click-throughs de otras páginas. Como el motor de búsqueda no puede controlar el tráfico de los sitios, algunos hacen el seguimiento del número de clics que recibe cada resultado de búsqueda. Los ranking pueden cambiar en una búsqueda futura, basada en esta interacción con los usuarios.

El Page Ranking (PR) es una ciencia muy precisa y es diferente en cada buscador. Para crear el mejor SEO para nuestro sitio, es necesario comprender cómo construyen sus motores de búsqueda objetivo estos ranking. Podemos utilizar y tener en cuenta estos factores en el momento de crear, cambiar o actualizar el sitio Web que queremos optimizar.

Características de la búsqueda

Comprender cómo funciona un motor de búsqueda puede ayudamos a entender cómo se posicionan nuestras páginas en el buscador; cómo se encuentran las páginas es otra historia completamente diferente donde entra en juego el elemento humano. La búsqueda puede significar varias cosas para personas diferentes. Por ejemplo, una persona busca en Internet utilizando las mismas palabras y frases que utiliza cuando habla con alguien sobre ese tema, e incluso utiliza a veces la pregunta exacta que haría a una persona. Eso es el lenguaje natural. Otra, sin embargo, que estudió algo de búsqueda, utiliza técnicas de búsqueda booleanas. Esta persona utiliza una sintaxis muy distinta cuando escribe un término de búsqueda. Cada uno de ellos devuelve un resultado diferente, incluso cuando se utilizan en el mismo buscador.
Las características de la búsqueda se refieren a la forma en que los usuarios buscan en Internet. Esto abarca todo, desde la heurística que utilizan cuando crean un término de búsqueda, hasta la selección que hace el usuario (y cómo se hacen esas selecciones) cuando se han devuelto los resultados de la búsqueda. Un hecho interesante es que más de la mitad de los adultos norteamericanos buscan en Internet cada vez que se conectan. De hecho, hay más personas que buscan en Internet que personas que utilizan las páginas amarillas para encontrar números de teléfono y direcciones de negocios locales. Esta riqueza es un terreno fértil para los objetivos SEO. Cuanto mejor se comprenda cómo y por qué los usuarios utilizan los buscadores y cómo funcionan los motores de búsqueda, será más fácil alcanzar el SEO que está persiguiendo.

Visión general de Google

Los principales motores de búsqueda difieren en algún aspecto los unos de los otros. Google es el rey de los buscadores, en parte debido a la precisión con la que saca los resultados de una consulta. Aunque Google ofrece todo tipo de extras, como correo electrónico, una página principal personalizada e incluso aplicaciones de productividad, estos servicios de valor añadido no son los que han hecho popular a Google.
Lo que ha convertido a Google en una familia es la precisión con la que devuelve los resultados. Esta precisión se desarrolló cuando los diseñadores de Google combinaron las búsquedas de palabras clave con la popularidad de los enlaces. Esta combinación de palabras clave y popularidad de enlaces a páginas es más exacta que el solo uso de palabras clave.
Sin embargo, es importante entender que la popularidad de los enlaces y las palabras clave son sólo dos de los cientos de criterios que utilizan los buscadores para clasificar la relevancia de las páginas Web.

 

 

 

No Comments

Post A Comment