La nueva generación de buscadores en Internet
A pesar de su enorme popularidad, Google y otros buscadores similares como Yahoo! están lejos de ofrecer una respuesta directa a las preguntas de sus usuarios. Si hacemos una consulta como “hoteles en la playa por menos de 50 euros” en Google, las tres primeras entradas nos llevan a una bitácora sobre viajes, diversos directorios de hoteles y el alojamiento para estudiantes de la Universidad Jaime I. Varias búsquedas sucesivas pueden llevarte a la información pero se requiere cierta habilidad y experiencia para hacerlo con rapidez. La publicidad de los laterales, insertada por humanos, es mucho más precisa para ofrecernos lo que queremos.
El problema es que los buscadores utilizan algoritmos de clasificación relativamente sencillos. Y, dado que la inteligencia artificial todavía parece estar muy lejos de nuestro alcance, hay investigadores que intentas atacar el problema por otro lado. Su objetivo es organizar los contenidos de Internet para hacer más fácil la búsqueda y clasificación de la información.
La alternativa se llama “web semántica”. De difícil definición, la idea es añadir a los contenidos de cada página web una serie de etiquetas. Mediante estas etiquetas se busca representar con el máximo detalle el contenido de la página web. La idea básica seria similar a las etiquetas de del.icio.us o Technorati pero con un nivel de complejidad muchísimo mayor. De esta forma, Internet podría convertirse en una enorme base de datos que permitiría realizar búsquedas complejas, combinando diferentes etiquetas.
Ya existen páginas desarrolladas siguiendo este modelo mediante diferentes tecnologías desarrolladas para ello. Y un buscador, Swoogle, capaz de sacar el máximo partido a esta organización de la información. El potencial es enorme pero la pregunta es, ¿se desarrollaran suficientes contenidos para que tengan información que buscar? Y si funciona, una base de datos tan completa y tan perfectamente relacionada ¿no se convertirá en una amenaza para la intimidad de todos nosotros?
Vía | BBC Tecnología
Más información | Swoogle
Comentarios
WSL Weblogs SL
Tecnología
Entretenimiento
Motor y deportes
Por temas
- Ahorro
- Apple
- Bebés
- Belleza
- Ciencia
- Cine
- Cocina
- Competición
- Consumo
- Cultura Alternativa
- Decoración
- Deportes
- Economía
- Empresas
- Empresas TIC
- Fútbol
- Famosos
- Fans
- Fotografía
- Gadgets
- Gays
- Golf
- Literatura
- Lujo
- Móviles
- Música
- Moda
- Moda hombres
- Motor
- Motos
- Niños
- Noche
- Software
- Televisión
- Viajes
- Vida Sana
- Videojuegos
Destacado
Top 10
Lo+leido
- Algunas curiosidades sobre las manzanas
- Los perros se lamen las heridas porque no han estudiado medicina
- Donde acaba el hombre... y empieza la máquina
- Batman vivía en la Luna, según el 'New York Sun'
- Richard Dawkins propone unas colonias ateas
- La razón de la organización decimal y otras alternativas para contar muchas cosas (y II)
- Se busca alimentador de piojos (1 de 2)
- Se busca alimentador de piojos (2 de 2)
- Más agua en el Sistema Solar
Lo+votado
Lo+comentado
- La razón de la organización decimal y otras alternativas para contar muchas cosas (y II)
- Los perros se lamen las heridas porque no han estudiado medicina
- Richard Dawkins propone unas colonias ateas
- Donde acaba el hombre... y empieza la máquina
- Algunas curiosidades sobre las manzanas
- Más agua en el Sistema Solar
- Batman vivía en la Luna, según el 'New York Sun'
- Se busca alimentador de piojos (1 de 2)
- Se busca alimentador de piojos (2 de 2)
- El cuaderno escocés (2 de 2)
Autores / Comentaristas
Autores
Secciones
general
- Antropología
- Astronomía
- ¿Sabías que...?
- Biodiesel
- Biología
- Cambio Climático
- Clima
- Computabilidad
- Computación
- Evolución
- Física
- Genética
- Genciencia
- Geología
- Matemáticas
- Materiales
- Medicina
- Medio ambiente
- Nanotecnología
- No te lo creas
- Otros
- Paleontología
- Programación
- Psicología
- Química
- Quién es...
- Quiz Genciencia
- Robótica
- Salud
- Tecnología
- Telecomunicaciones


Creo que el problema de la web semántica será cómo controlar que la gente usa las etiquetas correctamente; por ejemplo si yo tengo un blog que quiero promocionar, podría añadir etiquetas como "sexo" o "beckham" o cualquier otra búsqueda típica. Es algo que hace tiempo que usa la gente para promocionar un fake por las redes p2p o entre los videos de youtube por poner algun ejemplo.
que me perdonen pero este buscador no sirve para nada para mi que no es mas que una web y un boton search que no va a ninguna parte , o tal vez solo va a un contador que registra cuantos buludos hacen click en esta pagina jeje
Swoogle es un proyecto del departamento de ingenieria electronica y ciencias de la computación de la Universidad de Maryland. Puede encontrarse mas documentación en el FAQ de la pagina.
Arnoia, estoy de acuerdo en que se puede abusar del sistema igual que con los actuales. El tiempo dirá si es posible controlar los abusos como intenta hacer Google con las busquedas o acaba siendo algo tan frustrante como el spam en el correo electrónico.
La web semántica hoy por hoy no es la respuesta.
Por otra parte, decir que el algoritmo Page Rank es sencillo...
De hecho no son públicos todos los detalles (es más, no se sabe mucho sobre él) sobre el algoritmo, pero vamos, es todo un prodigio en el campo de la IA.
Tan sólo hay que saber qué buscar, utilizar operadores correctos, y encontrarás lo que buscas en la primera línea ;)
Cesar tienes razón en que la web semántica aun esta verde pero parece que es la dirección en que nos estamos moviendo con servicios como los que he mencionado.
Sobre Page Rank no he dicho que sea sencillo. Solo relativamente sencillo. O expresándolo mejor, demasiado sencillo para la complejidad del problema. Sin duda, Page Rank es un algoritmo impresionante.
Por otro lado, utilizar los operadores adecuados te puede llevar inmediatamente a la solución pero muchos usuarios corrientes no los conocen. Al final es cuestión de aportar inteligencia y conocimientos a las búsquedas. Bien por el lado del usuario o de los programas.
Gracias por tu comentario, así he podido puntualizar esos temas.
Jejeje, y me alegro de que lo hayas hecho, porque no podía estar más de acuerdo contigo :)
Tal y como comenta Arnoia el problema es el uso que durante años hemos dado a las metaetiquetas de toda la vida que ha tenido varias consecuencias entre ellas que buscadores como Google ha decido por una parte no tener en cuenta algunas metaetiquetas, se dice que solo considera "title" y "descriptión" pero no "Keywords", por otra sancionar aquellas webs que presentan una repetición artificial de determinados criterios de busqueda en sus metaetiquetas.
Además hay otros tipos de buscadores que tecnológicamente no estan preparados para ofrecer mas resultados que los basados en la densidad de keywords, son los llamados buscadores de interés, son evidentemente faciles de posicionar y desvirtuan los resultados globales del resto de buscadores.
Pienso que una solución podría ser que algún organismo internacional tipo wc3 o internic certificara unas metaetiquetas anualmente, previo pago por analizar la web.