Qué es el muestreo en Analítica Web y cuáles son sus consecuencias

por | 20 Nov 2018 | Analítica para Growth | 0 Comentarios

¡Enhorabuena! Le dice la doctora al padre. ¿Cómo va a llamarle? Pues Bill. Ah, ¿algún Bill en la familia? No, no. Es que Bill es garantía de éxito. ¿Qué quiere decir? Hombre, fíjese que muchas personas exitosas se llaman Bill: Bill Clinton, Bill Cosby, Bill Gates, Bill el niño… El pequeño Bill no sabe lo que le espera.

En otro lugar del mundo, una psicóloga escuchaba cómo él narraba la razón por la que pidió a su pareja que fuesen a terapia. “Es que nuestro matrimonio es súper aburrido, apenas hacemos nada. Todo es día a día, obligaciones. Entro en Facebook y veo a gente feliz, besándose, de viaje, de bodas, de fiesta, cenando en bonitos restaurantes o yendo al cine. Todos los días ves gente feliz en Facebook, toda la gente es feliz y nosotros, si acaso, tenemos plan 4 o 5 veces al mes”…

¡Buenos, buenísimos días! ¿Cómo estás? ¡Espero que bien! Seguro que si. Yo también estoy bien. Contento por las fechas que se acercan, la ilusión de vivirlo en familia, contento por mi nuevo pequeño-gran lanzamiento que está funcionando muy bien y sobre todo contento por estar aquí escribiendo para ti.

Hoy me apetecía compartir contigo la reflexión surgida tras una pregunta que un cliente me ha hecho, al verse en una situación agridulce: superar l0s 10 millones de hits al mes

¿Por qué es una sensación agridulce? ¿Qué se esconde tras ese hito? ¡Vamos!

Lo que Google Analytics te dice cuando superas los 10 Millones de páginas vistas al mes

Imagina que tu estás ahí, celebrando que cada mes tus métricas crecen, tu volumen de tráfico está en constante crecimiento y, por consiguiente, tu negocio también.

Un buen día, entras en Google Analytics (como sueles hacer) y te aparece el mensaje con sabor agridulce:

“Tu volumen de datos (xM hits) excede el limite de 10 M de hits por mes que especificados en nuestro Términos de Uso del Servicio. Si continúa excediendo el límite, podría perder datos en el futuro”.

¿Cómo? ¿Que qué? Entonces te pones a buscar artículos sobre el tema y llegas a la ayuda de Google Analytics, donde explica el caso.

Resulta que la versión free de Google Analytics tiene un límite de 10 M de hits al mes y lo has excedido. Esto significa (de ahí el agridulce) que tienes un súper proyecto y seguro que estás generando mucho dinero porque, la solución según los de Google, es comprar Google Analytics 360 que cuesta por ahí por unos 120.000 € al año. ¡Toma ya!

Bueno, eso o aceptar un muestreo de datos que ronda el 7% en adelante y que, a partir de ese momento, tus datos … igual no son del todo fiables.

Así que ese buen día, lo que iba a ser un “bien hecho” se convierte en el planteamiento de una decisión que supone una inversión de 120.000 €.

¿Qué hacer ahora?

¿Qué significa que se aplicará un muestreo?

Para explicártelo de forma sencilla, piensa en las encuestas en las elecciones. Cuando se dice que un partido político obtendrá x escaños, en realidad no es el resultado de preguntar a todos los ciudadanos sino más bien en coger una muestra más o menos representativa y extrapolarlo al total. Preguntamos a 1.000 y lo que sale, lo multiplicamos e intuimos que será lo que pasará.

Y, bueno, pues no siempre aciertan ni tampoco se acercan. ¿Verdad?

El muestreo de datos en analítica web es exactamente lo mismo. Significa que Google Analytics no cogerá el total de los datos que le enviemos sino una muestra “más o menos representativa” de los mismos.

Al mismo tiempo, tampoco tenemos garantías que la muestra sea equitativa. ¿Cuánta información podríamos esta perdiéndonos? ¿Cuan fiables son las conclusiones a las que podemos llegar con esos datos? No lo tenemos claro.

Lo que tenemos que saber que este cambio no debe analizarse desde una perspectiva cuantitativa.

De hecho, y es lo más normal, lo primero que pensaremos es que, bueno, perder un 10% de la información tampoco es tan grave. Podemos asumirlo y luego, pues sumarle un 10 % a los reportes y listo.

Total, hasta ahora nos ha ido bien analizando los datos que teníamos, no necesitamos más.

Pero luego entramos a Analytics y empezamos a ver cambios significativos en las métricas. La pregunta: ¿será por el muestreo? La respuesta: imagino que si.

Y ahí es donde está el problema: hemos pasado de usar los datos para evitar conjeturas a conjeturar sobre la valía de los datos. Catapum.

¿Podemos hacer algo al respecto?

¡Claro! Faltaría más. Existen varias posibles soluciones o al menos acciones que llevar a cabo para intentar minimizar el problema:

  • Pasarnos a Google Analytics 360. Sin duda es la solución más cómoda, porque basta con poner la tarjeta y poco más. Pero … ejem. Es una pasta.
  • Controlar el sesgo por nuestra parte. Otra opción es que aceptemos la limitación y decidamos, por nuestra cuenta, qué información deseamos perder. Por ejemplo, podríamos conocer una parte de la web que no nos interesa analizar y, por tanto, excluirla de Google Analytics (o moverla a otra propiedad) para que el total de datos no supere los 10M de hits y así no exceder el límite.
  • Dividir los datos en distintas cuentas. Aunque podría ser una posible solución, el hecho de trocear nuestro sitio web en distintas propiedades para que ninguna exceda el límite, a mi personalmente no me gusta porque nos lleva a perder la parte de visión general. Además, intentar configurar esto es bastante complicado.
  • Pasarnos a Yandex Métrica. En la web de Yandex sostienen que nunca cobrarán, que no hay muestreo ni tampoco limitación. Yandex métrica es una alternativa muy bien valorada por muchas personas del círculo SEO porque tiene funciones muy chulas como mapas de calor. Sin embargo, en mi humilde opinión, cuando empiezas a analizar en serio te empiezan a faltar cositas.
  • Implementar Matomo (Piwik) free. Matomo es una herramienta de analítica basada en software libre que últimamente ha despertado mi curiosidad y que, conforme más la pruebo, más me enamoro de ella. Para probarla basta con disponer de un buen servidor que sea capaz de atender todas las peticiones, si tenemos mucho tráfico. El coste, salvo que tengas buenos aliados de infraestructura, es que necesitas equipo técnico para el mantenimiento de ese servidor.
  • Implementar Piwik Pro. La alternativa de pago a Matomo es Piwik Pro, un servicio gestionado en la nube que implementa todas las funciones de Matomo y, además, otras muy interesantes de pago como su propio Tag Manager (para el de Google, aquí tienes una guía completa), mapas de calor, análisis de funnels, etc. Piwik Pro es mucho más barato que Google Analytics 360, del orden del 55% menos de precio, pero aun así es un desembolso a tener en cuenta.

¿Hay más alternativas? ¡Seguro! Adobe, Microsoft… muchos gigantes tienen su propia oferta de analítica digital que podría ser una buena alternativa.

Conclusión: ¿qué harías tú?

Ains, menudo dilema, ¿eh? Claro, yo pensando que igual cuando llegue yo a esos volúmenes … Nah, nunca voy a llegar a esos volúmenes con este humilde blog. Jajaja.

Pero ya conocía otros casos y ahora tengo clientes en este punto y he entendido cual es el dilema. Y la respuesta parte de esta pregunta:

¿Qué suponen los datos en tu negocio? Conozco negocios que les va muy bien pero que el uso de estos datos es más superficial, indicándoles principalmente que el tráfico está creciendo o decreciendo. No hay serias decisiones de negocio detrás del análisis de los mismos. Si no se te da bien analizar las métricas, si no vas más allá del simple vistazo a visitas y conversiones, quizás deberías aceptar el muestreo.

Sin embargo, tus próximos cambios de producto o la inversión de un año en Marketing podría estar condicionada por el análisis de estos datos, porque lo haces de forma activa.

En la respuesta a esa pregunta está la justificación de una inversión de 120.000 € al año o la de implementar un servidor propio. Se trata de pensar en cuán importantes son los datos y cuanto vas a explotarlos.

En el caso de mi cliente, por si te picaba la curiosidad, mi recomendación va más por explorar la solución combinada de Matomo, con algunos plugins de pago y un fuerte acuerdo con un proveedor que nos gestione el servidor y nos garantice que todo funciona bien. La inversión, por debajo de 10.000 € / año. Las ventajas … muchas…

Y ahora, llegados a este punto, después de este post (sin chistes, pero es que estoy flojo) … ¿Tú qué opinas? ¿Alguna vez te has visto en esta situación? ¿Qué decisión tomarías? ¿Conoces alguna alternativa a las que he planteado? ¿Crees que Rick volverá pronto? ¡Cuenta, cuenta!

5/5 - (4 votos)

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.