Así puedes llegar a páginas viejas que ya no aparecen en Google

Esto lo he dicho varias veces: para muchas personas, Internet es Google. No conciben otra forma de navegar en la red sin hacer una búsqueda en el navegador. Sin embargo, antes la cosa era distinta: tenías que saber la dirección de la página a la que querías ingresar y escribirla correctamente para poder llegar a ella.

Pero, entonces, apareció algún héroe sin capa con una idea millonaria que nos facilitó la vida: un directorio en donde se pudieran encontrar las páginas más interesantes, útiles o visitadas, con solo hacer una búsqueda. Es posible (y casi seguro) que otros tuvieron la misma idea antes, pero el primer gran buscador, que creó ese directorio para el público masivo, fue Yahoo, que nació como un proyecto universitario en 1994. Si hay algún experto en historia de Internet leyendo esto, no me molesto si me corrige.

Con el paso del tiempo, esos directorios se volvieron más sofisticados porque la cantidad de páginas crecía con el tiempo y tuvieron que usar algoritmos más complejos para que las búsquedas fueran más personalizadas y las personas encontraran justo lo que querían, lo más rápido posible. El rey de eso ha sido Google, que nació en 1998.

Google comienza a perder la memoria

Desde que el buscador apareció en el mapa, casi todo el mundo lo usa en sus búsquedas. El problema es que el algoritmo de ese buscador define cuáles son las páginas más relevantes para las búsquedas de una persona, tiene una inteligencia artificial que aprende de la forma en la que navegan los usuarios y rápidamente muchas páginas dejan de ser indexadas y básicamente navegamos en un número limitado de sitios web, que tiene todas las características para que el algoritmo de Google los tenga en cuenta.

De hecho, ya algunas personas, como el bloguero Tim Bray, reportaron que Google dejó de indexar por completo las páginas más antiguas. Bray afirma que, incluso sabiendo exactamente lo que uno busca, no puede encontrarlo, si está en una página vieja, incluso usando las palabras clave correctas o el título exacto de lo que buscas, siguiendo los pasos de una buena búsqueda.

El bloguero explica que indexar todo Internet es muy costoso, porque cada día se crea nueva información que comienza a perder relevancia para el algoritmo del buscador, porque no se actualiza ni tiene nuevos comentarios. Entonces, para ahorrar memoria y costos, están dejando de prestarle atención a muchos sitios.

Navegar en el lado oscuro de la web

Entonces, para poder encontrar esa nota específica en un sitio viejo, lo mejor es usar otros navegadores que parecen tener indexado todo Internet, como DuckDuckGo o Bing, aunque, en mi experiencia personal, DuckDuckGo es un servicio mucho más útil para búsquedas y páginas en inglés que en español u otro idioma. Pero, en una de esas te funciona, como a Bray.

Pero, ¿qué hacer cuando queremos con búsquedas menos específicas, pero en las que nos serviría mucho una página o un artículo anterior a 2009. Mejor dicho, qué hacer para encontrar las páginas no indexadas por Google con una búsqueda básica. El portal Hacker News tiene la respuesta. Para navegar en la red más amplia, en los lados más profundos, necesitas de otros navegadores poco conocidos.

Lee más sobre motores de búsqueda en este enlace.

Ese sitio sugiere el uso de tres motores de búsqueda: Million Short, que permite hacer una búsqueda mucho más personalizada, removiendo algunas características de la búsqueda, como los resultados más populares, los e-commerce o los sitios con chat. Incluso puedes buscar sitios específicos de un país (aunque Colombia no aparece en la lista) o limitarlo por tiempo, aunque estos dos los tiene Google.

También aconsejan el uso de Wiby.me, que se especializa, precisamente, en buscar páginas viejas o clásicas. Y Pinboard, que, por 11 dólares anuales (unos 34.000 pesos) irá creando un archivo de todas las páginas favoritas que guardes. Por lo que podrás encontrarlas después, incluso cuando Google las deje de indexar.

Sin embargo, ya hay un archivo de Internet, llamado WayBackMachine, que guarda los sitios antiguos y en la que puedes hacer una búsqueda de páginas viejas que ya no encuentras en Google. Así te sentirás como todo un hacker que tiene las herramientas para buscar y encontrar las partes más oscuras y profundas del extenso Internet.

Imágenes: Prykhodov (vía: iStock).

Fernando Mejía

Fernando Mejía

Quise ser músico, cineasta, astronauta, científico y poeta, cuando supe que solo me alcanzaba para la última, me hice periodista en el Externado para al menos escribir de todo eso y no defraudar al niño que fui.

View all posts

Archivos