En internet hay quien manipula los
datos para engañar a otros y hacerle creer que su proyecto es
la repanocha y que han reinventado internet (N.0). Otros símplemente
ignorant lo que son los webtrends o son incapaces de saber con quien
comparar para saber “si su web tiene muchas visitas”. Los peores
son los que se inventan su propio sistema contable y se lo creen,
estos son los homo-emtricos.
De estos hay algunos y para que tengan
algunas lecciones básicas de webtrends, de visitas y de la
importancia de los diversos sistemas de contavilización por
internet, realizo este humilde post.
¿Mi web es la mas visitada?, esa
es una de las primeras preguntas que se plantea el homo-emétrico,
el maníaco de las visitas, los hits, los Gbytes de
transferencia y las páginas cargadas. Una sublimación
de “yo soy el que la tiene mas larga” o “mi tribu es la que mas
acojona de todas”, que ha ido adoptando formas variadas: las de
fantasma de discoteca, la de matón de barrio o la de
emperador. Hoy en dia se sublima toda la testosterona excedente en
forma de “mis webtrends son mas grandes que los tuyos”. Pero en
el fondo esa respuesta es de muy difícil respuesta.
La única manera de responder es
que los señores que montan las webs con las que te quieres
comparar utilicen el mismo sistema de contabilizar Y además te
pasen sus datos para que nuestro homo-emétrico se quiere
comparar. Entonces podras verlo, y aún así la cosa
tiene su enjundio, ya que aún un mismo sistema de webtrends
tiene respuestas distintas para webs distintas.
Me explico, primero tienes los llamados
“hits”. Que son un número que te cagas de grande. Siempre
los miras y ves “hoy he tenido 1.000 hits” que crack que soy..
Bill Gates me va a comprar mi web de aquí a poco. Luego te
acojonas cuando sabes que las webs mas normales, en idiomas
minoritarios, pueden rondar con facilidad los 500.000 “hits”
mensuales sin despeinarse demasiado. ¿Porqué los “hits”
son tan altos?, francamente, porques son una forma tramposa de
contabilizar las visitas de un portal. Un hit es cualquier demanda de
información al servidor. Si cargas tu página principal
y allí tienes una imagen de cabecera, 12 banners de publicidad
a tu derecha, un fichero (o 2 o 3) de CSS, unos cuantos ficheros
javascript, el PHP, HTML, JSP o ASP de inicio... pues un solo señor
que venga, o un robot de google que te visite de golpe te mete 20 o
30 hits con solo cargar la página. Puede haber entonces
discrepancias. Una página que tenga 4 o 5 imágenes, un
único CSS y ningún fichero más cargará 7
u 8 hists por visita, en cambio las páginas “navidad” que
parecen un tutti-fruti de imágenes, le meten 30 hits así
de golpe.
Mala cifra la de los hits, que además
se corrompe si por ejemplo la gente que te visita es muy habitual y
lo que hace es almacenar las imágenes en “caché”
del navegador y en lugar de solicitarlas al servidor lo que hace es
cargarla de la caché y no cuenta como hit. Problema que se
acrecenta, si esa página tiene una imagen en el servidor y
otra le hace un link directo lo que ocurrirá que cuando se
haga una visita a esta segunda página lo que pasará es
que le contabiliza un hit a la anterior.
Con lo cual los hits solo te sirven
para compararte contigo mismo, si la web no la tocas demasiado la
bajada o subida de hits te pueden dar una idea de tu evolución
pero no sirve para compararte con otras páginas. Por ejemplo
Google, tiene pocos hits en comparación a sus visitas reales.
Control por IP, “visitantes únicos”,
otro aspecto que algunos miran es “este mes me han visitado 5.000
tíos”, bueno, no es exáctamente así, mas bien
debería decirse “mi servidor a controlado 5.000 sesiones de
IP distintas”, si el contador lo tengo configurado que cada 5
minutos considere al navegante como algo distinto te sumará
otro, si lo tienes configurado que cada 24 horas, este señor
no te cuenta como “un visitante único” más hasta
que no te visite al dia siguiente. Lo mismo pasa con los controles
por Cookie. Pero además el primero tiene un defecto adicional.
Si te visitan todos los trabajadores del mismo centro de trabajo
puedes tener decenas de visitantes que solo cuenten como uno, ya que
salen por la misma IP a través de una LAN. El control por
Cookie también puede estar viciado, si yo no dejo que me metan
una Cookie el contador me estará controlando como un señor
diferente con cada click.
Por tanto el control de “visitantes
únicos” tiene su validez pero poco contrastable, además
al contabilizar mensualmente no significa que 5.000 tíos te
hayan visitado, sino que has tenido 5000 sesiones distintas en
bloques de 24 horas. O sea que lo único que puedes saber que
te han visitado 5000 máquinas diferenciables distribuidas en
30 días. O sea pueden ser 5000 distintas que te han visitado
en todos el mes un solo día o bien 500 que te han visitado 10
veces ese mes o cualquier combinación. Además el
problema de la IP genera discrepancias serias, colaboro en una web
que tiene muchas visitas de un grupo de centros de trabajo muy
limitado, y se fehaciéntemente que unos pocos cientos de
usuarios reales marcan 4 ó 5 únicas sesiones de usuario
por día, porque salen de las mismas LAN's.
Un factor importante pero tampoco
decisivo es el “páginas servidas”, este tiene el defecto
de no decirte “cuantos usarios y visitas tienes” pero sí
te dice “la intensidad de uso del portal”. Si el webtrends esta
bien diseñado te suma +1 al contador solo cuando hay una
solicitud de una página nueva, o sea un click o una carga
externa de la web. Lo que te pone en duda el valor es por ejemplo con
los agregadores o los planets. Estos tienen la virtud de que los
enlaces cargan FUERA y por tanto sus páginas servidas suman
casi exáctamente al número de veces que se carga la
página principal (descontamos las páginas de
administración). En este aspecto tambien puede ser un
indicador negativo, si la página está diseñada
con el culo un usuario tendrá que hacer mil clicks antes de
encontrar la información que le interesa, si está bien
diseñada no, pero puede indicar tal vez que el usuario le ha
gustado tanto la página que sigue urgando por dentro buscando
mas y mas información, con lo cual este contador hay que
observarlo con 4 y con 8 ojos, a pesar de ser el que considero mas
interesante.
Pero a todo esto le podemos sumar que
la gente se puede hacer trampas al solitario, si compulsívamente
el homo-emétrico se dedica a pulsar F5 con su página
cargada irá sumando hits, páginas servidas, etc... Ese
comportamiento estúpido se suele dar en el homo-emétrico
cuando ha de justificar que su proyecto es el que tiene el pene mas
largo... digo mas visitas. Es ineficaz cuando son proyectos de cierta
volada, pero para paginas de menos de 500 paginas servidas.
Lo de “información
transferida” tampoco es algo serio, si tienes un portal con miles
de documentos en PDF super-pesados tu transferencia se disparará.
Si tu página de incio tiene miles de millones de imágenes
supercargadas. Conozco un portal que tiene mas de 200 Kbytes, solo en
imágenes de los banners principales, banners laterales y
imágenes del diseño (ya no hablo de las que se puedan
poner en los contenidos), esta dispara sus visitas por las nuves.
¡Ja, ja, tengo 2 Gbytes de transferencia y tu solo 1,5!, vamos
con esos 200 Kbytes de imágenes son menos de 20.000 páginas
cargadas... en cambio la segunda página con 40 Kbytes (y casi
todas en caché de quien le visita) ese 1,5Gbytes puede
corresponder a 100.000 páginas cargadas.
Otra cuestión para valorar si
“la página es la mas visitada” es no ir de sobrado hasta
conocer datos reales de la competencia (y no los datos de Alexa no
son datos fiables, si yo tengo la “barrita de navegación”
mis nedstats mejorarán como la espuma, si además se la
pone mi prima, mi hermana y me la pongo en el curro no te digo como
eso mejora). Si los conoces ya puedes hacer valoraciones, si alguien
anuncia “tengo 1000 visitas” hay que saber de que habla, si habla
de “hits”, “páginas servidas” o “usuarios únicos
(o sea IP's)”. Por lo normal no me suelo creer a quien dice que
tiene “miles de visitas” diarias y no le causa problemas al
servidor. Coordino un proyecto que sí las tiene y tenemos que
hacer virguerías para no dejar frita la base de datos y eso
que trabajamos con Oracle, pero 2000 demandas simultáneas
tumban muchos servidores. Normálmente si alguien dice “tengo
miles de visitas” habla de hits. Pero vamos.. que sin tener los
webtrends es difícil decirlo. Pero lo peor que puede hacer el
homo-emétrico es teniendo esos datos no analizarlos con
frialdad.
Conozco un homo-emetrico peculiar.
Tiene un proyecto que sirve poco mas de 500 páginas al día,
tiene defectos de diseño que hace que cada “pageload”
signifique el envío de 250 Kbytes (o +), transfiere lo que no
llega a 2 Gbytes mensuales, y cada vez que cargas la página te
hace unos 30 hits/solicitudes y lo anuncia como el mas visitado de su
especie. De hecho puede ir a otro de la misma honda y consultar sus
webtrends publicados: páginas servidas, unas 2000 diarias, 1,3
Gbytes mensuales pero con una página que pesea poco mas de 30
Kbytes. Ah.. y con mas usuarios distintos y datos de estos.
A pesar de ello este homo-emétrico
no conoce la aritmética básica. Para él tener la
cuarta parte de páginas servidas significa ser “el primero”.
Lo mas triste es que con la que puede comparar es la segunda página
mas pequeña del grupo. Pero insiste que su página es la
mas visitada. Cuando profundizas en sus webtrends descubres algo más,
las 5 URL's mas visitadas no son páginas ordinarias (portada,
algun apartado) sino las de administración, es decir es una
página cuya mayor actividad la tiene en la “cocina”. O sea
casi toda la actividad la hace el propio homo-emétrico.
Pero claro, si hablamos que el
homo-emetrico normalmente no sabe que Google no te indexa por visitas
sino por los enlaces que tienes y la calidad de estos (y que tu
página no tenga penalizaciones “google”, como por ejemplo
la mala gestión de tus palabras clave, o por ser una “granja
de enlaces”), o que Alexa solo cuenta las visitas de los que tienen
la susodicha barra de navegación, no le digas que vive en la
inopia. El homo-emetrico tiene otro defecto: es delusivo, se cree sus
propias falacias para intentar creerse un nuevo gurú de
internet.
Pero es mas, ¿es importante
tener mil visitas mas que tus rivales?, para el homo-emetrico sí,
da igual que venda videos porno y quien le visite sean miles de
monjes nestorianos para poder poner a prueba sus votos de castidad, y
que la de al lado les visiten tan solo 200 rijosos que van a dejarse
hasta su último € en el nuevo vídeo que haya subido.
El problema del homo-emetrico es de conceptualización de un
proyecto de internet, algo que no saben diferenciar de la solución
tecnológica o del desarrollo y evolución del proyecto,
¿para que hablarle de que sus números son humo si ni
siquiera sabe diferenciar la paja del grano?. Hablarle a un
homo-emetrico de “contenidos” y que si no tiene contenidos de
calidad NO hay visitas es como hablarle a un granjero Amish las
virtudes del vehículo de hidrógeno, da igual eso no va
con ellos. Como dije en mi anterior post sobre “la importancia de
estar enlazados” los homo-emetricos ni siquiera se plantean la
importancia que te enlacen aunque sea para meterse contigo, de que
una buena web recive casi la mitad de sus visitas del Google y del
resto una parte importante por mecanismos de sindicación de
contenidos, que tan importante es que te visiten el rss.xtml como el
index.html o el index.php, y que si no tienes credibilidad en
internet no tienes nada. Y la credibilidad son enlaces y enlaces y
mas enlaces.