Tag clouds y Desarrollos Caóticos/Personalizados
Empecemos por lo fácil: Un tag cloud es una representación gráfica de keywords que resalta algunos aspectos de la lista total. Desde popularidad, hasta eficiencia (referente a ciertos aspectos también, ejemplo Bounce Rate, etc) o el más conocido que es el porcentaje de aparición de palabras en una página o portal. En general los elementos en un tag cloud son links que refieren a links donde se usan/definen tales keywords.
La biblioteca pública de Nueva York en su página de Laboratorio (wow! a ver si eso alguna vez llega a México. Tendrá la Biblioteca Pública página propia?) están aprovechando el nuevo Google Analytics API (otra vez con manzanas: Google Analytics es el mejor programa gratuito para llevar estadísticas de un sitio web y esto lo digo por todo el agregado de estadísticas que se pueden lograr. El API es sólo un set de herramientas para que se puedan usar los datos sin tener que entrar a su página, es decir se pueden manipular en una aplicación/página propias) para entender diferentes aspectos del uso de la página de la Biblioteca Pública.
Entre estos usos decidieron hacer tag clouds con lo que los usuarios buscan y luego se dieron cuenta que pueden diferenciar y crear las listas para tales tag clouds basados en el lugar donde están los usuarios, es decir que alguien en New Jersey vería un tag cloud diferente a alguien en California.
De ahí entraron a debate de que tanto esto es válido (legal y moralmente) pues es una manera de controlar lo que las personas hacen, si ya saben que un tema es popular en una región es más probable que eso genere clicks de gente de esa región si les enseñan los links.
Ellos dicen que al usar el agregado de los datos no hacen esto de manera personal, aunque cualquiera que sepa un poco de estadísticas se daría cuenta que si una sola búsqueda se hace en una región y esa misma persona vuelve a usar la aplicación estaría viendo datos que el mismo genera, es decir TOTALMENTE personalizados.
Bueno, esto es exactamente lo que yo quiero hacer para TrotaMexico: quiero llevar un perfil por usuarios (más que por regiones) de popularidad, eficiencia, uso y desuso, etc. (y no sólo para el portal, sino también para mails! Esto si que sería algo nunca antes visto). De manera que las diferentes imágenes, links y hasta contenidos sean DIFERENTES para cada persona que entra al portal y sean preferentes para que esa persona siga haciendo click o se mantenga en el sitio.
¿Por qué? ¿Cómo? - El cómo aún no lo tengo pero ya lo estoy trabajando, el por qué pues es casi obvio (y también maquiavélico) si yo logro conocer a mis usuarios al punto que sé donde hacen click, cuando se quedan, qué los intriga, qué los demanda, qué los invita puedo ofrecer mis servicios de manera ESPECÍFICA buscando una eficiencia del 100% (no se asusten yo no tengo que hacer millones de calculos al minuto, eso lo hace el sistema). Y esto la verdad no es tan raro, Google Adsense ya lo está haciendo con su programa de Interest Based Ads.
La época de las páginas estáticas está por llegar a su fin y es hora de empezar a crear páginas cuyo contenido es dinámico y no me refiero a canalizar contenidos según un catálogo sino a crear páginas vivas que se visten y generen según lo que el usuario pide, según lo que ha enseñado que quiere y según lo que su región demuestra más popular.
Saludos,
Gorka
Nota.- Aún no encuentro otro nombre para este tipo de desarrollos.
P.D. - Aqui está el link al artículo de la NYPL: Visualizing search data whats the right amount of visibility
May 3rd, 2009 at 5:13 pm
Yo he implementado esto de los “tag clouds” y poco a poco se ven en mas sitios. La aplicacion mas comun que he visto es cuando toman los 20 o 30 terminos con mas “relevancia” (usando las formulas tipicas de los search engines) y las muestran en un recuadro usando diferentes tamanios de “font” dependiendo de que tan relevante sea comparado con los otros terminos. Avisame si necesitas ayuda!
May 3rd, 2009 at 5:56 pm
Muchas gracias, la verdad es que no quiero hacer la típica implementación del tag cloud como un recuadro sino que lo que quiero es que el contenido de la página (digamos imágenes sólo por ejemplo) sea diferente según el usuario, es decir que si tu en TrotaMexico normalmente haces más click en imágenes con links a artículos de playa entonces a tí te voy a enseñar más veces imágenes de playas porque eres más propenso a usarlas. Lo mismo con la manera de desplegar menús y otroas herrameintas del sitio web, si tu usas más el menú en la parte inferior o de lado entonces en esos lugares voy a poner links a información que ya sé que tú usas más, esto para impulsar más tu interacción con el sitio buscando que a)no te vayas, b) encuentres lo que buscas si es que lo tengo, y sino lo tengo, saber que lo debo agregar y c) por sistema ir analizando cada perfil de usuario para que esto funcione con eficacia al 100%.
Saludos y gracias por el apoyo,
Gorka
May 3rd, 2009 at 6:12 pm
Creo que el mejor ejemplo de esto mismo es Amazon. Cuando entras una segunda vez (generalmente después de haber comprado algo) te presenta exclusivamente a ti la oferta exacta que te hace decir “ah no mames, lo quiero”. Esto hace un par de años que lo estuve checando se llamaba algo así como “targeted content”, se basaba en historial de búsquedas y de compras, dándole evidentemente más peso a las compras que a las búsquedas.
Con respecto al tag cloud, en español tendrías que hacer modificaciones de diferentes implementaciones, que ya las hay, pues si utilizas sistemas ya hechos (hay un montón de tesis de análisis de textos en inglés y alemán sobre todo), tienes que ver las diferencias de los idiomas. Por ejemplo eliminar palabras de suma repetición como son pronombres, preposiciones, … que aparecen a madres en todos los textos, pero no representan una correcta idea del contenido. Para esto checa una distribución probabilistica que se llama “zipfs” o “zipf’s” que determina, dependiendo el número de repetición de las palabras su relevancia en el texto.
Saludos
beco
May 3rd, 2009 at 6:48 pm
Así es, Amazon es un gran ejemplo porque ya tienen un perfil de compras de cada uno de sus usuarios, yo lo que busco es hacer un perfil de actividad de cada usuario, es decir, tomar decisiones de como enseñar el contenido del website dependiendo de las estadísticas que genera cada usuario.
Lo del tag cloud, hahaha, creo que tendre que rescribir el post, porque NO QUIERO HACER UN TAG CLOUD, de hecho sólo lo use para ejemplificar lo que la New York public Library está haciendo similar a lo que yo quiero hacer. Y además para este tipo de análisis se usa Lógica Difusa y Redes/ Filtros Bayesianos (<- una vez quise hacer una tésis que me hizo investigar esto).
Saludos,
Gorka
P.D. - beco que gusto saber de tí, cada tanto entro a tu pag, saludos.