« Mars Express: tubos de lava en Pavonis Mons Portada Descubierta la primera pista que relaciona el cáncer con el envejecimiento »

25 mayo 2006


La nueva generación de buscadores en Internet

Ambrosio

buscador SwoogleA pesar de su enorme popularidad, Google y otros buscadores similares como Yahoo! están lejos de ofrecer una respuesta directa a las preguntas de sus usuarios. Si hacemos una consulta como “hoteles en la playa por menos de 50 euros” en Google, las tres primeras entradas nos llevan a una bitácora sobre viajes, diversos directorios de hoteles y el alojamiento para estudiantes de la Universidad Jaime I. Varias búsquedas sucesivas pueden llevarte a la información pero se requiere cierta habilidad y experiencia para hacerlo con rapidez. La publicidad de los laterales, insertada por humanos, es mucho más precisa para ofrecernos lo que queremos.

El problema es que los buscadores utilizan algoritmos de clasificación relativamente sencillos. Y, dado que la inteligencia artificial todavía parece estar muy lejos de nuestro alcance, hay investigadores que intentas atacar el problema por otro lado. Su objetivo es organizar los contenidos de Internet para hacer más fácil la búsqueda y clasificación de la información.

La alternativa se llama “web semántica”. De difícil definición, la idea es añadir a los contenidos de cada página web una serie de etiquetas. Mediante estas etiquetas se busca representar con el máximo detalle el contenido de la página web. La idea básica seria similar a las etiquetas de del.icio.us o Technorati pero con un nivel de complejidad muchísimo mayor. De esta forma, Internet podría convertirse en una enorme base de datos que permitiría realizar búsquedas complejas, combinando diferentes etiquetas.

Ya existen páginas desarrolladas siguiendo este modelo mediante diferentes tecnologías desarrolladas para ello. Y un buscador, Swoogle, capaz de sacar el máximo partido a esta organización de la información. El potencial es enorme pero la pregunta es, ¿se desarrollaran suficientes contenidos para que tengan información que buscar? Y si funciona, una base de datos tan completa y tan perfectamente relacionada ¿no se convertirá en una amenaza para la intimidad de todos nosotros?

Vía | BBC Tecnología
Más información | Swoogle

Más noticias sobre:  Telecomunicaciones
Comentarios (7) | Trackback


Comentarios

Creo que el problema de la web semántica será cómo controlar que la gente usa las etiquetas correctamente; por ejemplo si yo tengo un blog que quiero promocionar, podría añadir etiquetas como "sexo" o "beckham" o cualquier otra búsqueda típica. Es algo que hace tiempo que usa la gente para promocionar un fake por las redes p2p o entre los videos de youtube por poner algun ejemplo.

#1 | Escrito por Arnoia | 25 may 2006 02:11:51

que me perdonen pero este buscador no sirve para nada para mi que no es mas que una web y un boton search que no va a ninguna parte , o tal vez solo va a un contador que registra cuantos buludos hacen click en esta pagina jeje

#2 | blood maul | 25 may 2006 03:23:10

Swoogle es un proyecto del departamento de ingenieria electronica y ciencias de la computación de la Universidad de Maryland. Puede encontrarse mas documentación en el FAQ de la pagina.

Arnoia, estoy de acuerdo en que se puede abusar del sistema igual que con los actuales. El tiempo dirá si es posible controlar los abusos como intenta hacer Google con las busquedas o acaba siendo algo tan frustrante como el spam en el correo electrónico.

#3 | Escrito por Ambrosio | 25 may 2006 09:05:00

La web semántica hoy por hoy no es la respuesta.
Por otra parte, decir que el algoritmo Page Rank es sencillo...
De hecho no son públicos todos los detalles (es más, no se sabe mucho sobre él) sobre el algoritmo, pero vamos, es todo un prodigio en el campo de la IA.

Tan sólo hay que saber qué buscar, utilizar operadores correctos, y encontrarás lo que buscas en la primera línea ;)

#4 | César Saiz | 25 may 2006 15:00:48

Cesar tienes razón en que la web semántica aun esta verde pero parece que es la dirección en que nos estamos moviendo con servicios como los que he mencionado.

Sobre Page Rank no he dicho que sea sencillo. Solo relativamente sencillo. O expresándolo mejor, demasiado sencillo para la complejidad del problema. Sin duda, Page Rank es un algoritmo impresionante.

Por otro lado, utilizar los operadores adecuados te puede llevar inmediatamente a la solución pero muchos usuarios corrientes no los conocen. Al final es cuestión de aportar inteligencia y conocimientos a las búsquedas. Bien por el lado del usuario o de los programas.

Gracias por tu comentario, así he podido puntualizar esos temas.

#5 | Escrito por Ambrosio | 25 may 2006 15:51:52

Jejeje, y me alegro de que lo hayas hecho, porque no podía estar más de acuerdo contigo :)

#6 | César Saiz | 26 may 2006 02:08:59

Tal y como comenta Arnoia el problema es el uso que durante años hemos dado a las metaetiquetas de toda la vida que ha tenido varias consecuencias entre ellas que buscadores como Google ha decido por una parte no tener en cuenta algunas metaetiquetas, se dice que solo considera "title" y "descriptión" pero no "Keywords", por otra sancionar aquellas webs que presentan una repetición artificial de determinados criterios de busqueda en sus metaetiquetas.
Además hay otros tipos de buscadores que tecnológicamente no estan preparados para ofrecer mas resultados que los basados en la densidad de keywords, son los llamados buscadores de interés, son evidentemente faciles de posicionar y desvirtuan los resultados globales del resto de buscadores.
Pienso que una solución podría ser que algún organismo internacional tipo wc3 o internic certificara unas metaetiquetas anualmente, previo pago por analizar la web.

#7 | Escrito por Costa del Sol | 27 sep 2006 17:00:08

¡Añade tu comentario!


Noticias relacionadas

15 julio 2008 | Internet de alta velocidad para el Reino Unido en el 2012
07 marzo 2008 | 7 de Marzo: Graham Bell se lleva el gato al agua
30 mayo 2007 | Nueva guía del CSIC, La Información Especializada en Internet
26 febrero 2007 | La telefonía móvil lucha contra la radiación electromagnética
25 enero 2007 | La ESA acelera su proyecto de radio multimedia

 
Web www.genciencia.com