Web analytics

Web analytics: pourquoi vos données ne sont pas exactes à 100%?

Aucun système de WA offre des données exactes à 100%. Mais sans données fiables pas d’analyse de qualité de l’activité ayant lieu sur le site. Mieux comprendre les facteurs affectant l’exactitude des données permet d’améliorer la compréhension des rapports et de réduire les erreurs.

 Le Web est un média fantastique quand il s’agit d’approcher les consommateurs et de leur vendre des produits et services. Pour ce faire, il faut comprendre le comportement des visiteurs.

Les données fournies par un outil de Web analytics (WA) permet d’exécuter des analyses assez détaillées de leurs passages sur votre site afin d’évaluer les performances du site Web, notamment de ses contenus, et d’orienter la stratégie e-business.

« Rien n’est pire que de baser des décisions stratégiques sur des données erronées. »

“Les biais éventuels liés au fait que tous les utilisateurs ne sont pas repris dans les données WA ne posent pas de problème puisqu’ils sont entièrement exclus des données et ne représentent qu’une part minime du total”, assure Kelly Halfin de l’agence Semitis.

De plus, un grand nombre d’erreurs courament commises lors de la collecte des données peuvent être évitées.

Si les inexactitudes sont réduites au maximum, alors les WA demeurent un outil très éfficace pour mesurer le succès des actions en ligne.

Les problèmes affectant les données

Pour réduire les erreurs il faut connaitre les sources d’erreurs les plus fréquentes. Le type d’erreurs pouvant affecter vos données dépend du type de méthode utilisé par votre système analytics pour collecter le données.

Il en existe deux: les fichiers de logs du serveur et les tags insérés dans les pages. Il s’agit ici de présenter les problèmes liés à l’utilisation de la deuxième méthode.

« Le but est d’arriver à un niveau acceptable de données exactes. « 

Cette dernière est exploitée, entre autres, pour les solutions analytics de Google, d’Omniture, de WebSideStory et d’IBM (Unica). Cette méthode consiste à collecter les données via le navigateur Web des visiteurs et à envoyer ces informations sur un serveur appartenant au fournisseur. L’utilisateur du service analytics consulte les rapports à partir de ce serveur.

Les informations sont habituellement capturée via des codes javascript (connus par l’appelation “tags”) placés sur chaque page du site. Pendant le processus de collection, des cookies sont placés sur l’ordinateur des visiteurs permettant leur identification.

Dans le passé, la méthode utilisant les fichiers de logs était la plus courante. Mais, ces dernières années la facilité d’installation des tags a contribué à populariser la seconde méthode.

– 1ère cas: tags mal installés

Il s’agit d’une des erreurs les plus fréquemment commise selon Gérald Claessens de Knewledge. La méthode des “pages tags” requiert que le webmaster ajoute le code de tracking à chaque page. Des pages peuvent être ignorées (même si des systèmes de gestion du contenu permettent d’automatiser ce processus). Si des tags sont manquant ou mal placés sur des pages, cela signifie qu’aucune donnée (‘pageview’) ne sera collectée pour cette page.

C’est pourquoi la plupart des agences de WA débute leur mission par un audit afin de controler que toutes les pages du site sont bien taguées. “Pour qu’il soit complet, cet audit doit inclure les mini-sites, les pages de destinations spécifiques, les pages de choix de langues souvent oubliées car n’étant pas dans le CMS principal” souligne Claessens.

– 2ème cas: utilisateurs bloquant les dispositifs de tracking

Depuis quelques temps, la possibilité est donnée aux utilisateurs d’échapper au tracking des systèmes analytics présents sur les sites qu’ils visitent. Comment? Il existe des Add-ons de certains navigateurs, comme le noScript, disponible sous Firefox qui permet, par exemple, de bloquer des scripts. Sous Internet Explorer 9, il existe l’option ‘Do Not Track’. Google permet de procéder à un opt-out permettant à quiconque de se soustraire à son propre système d’analytics.

Heureusement, ceux-ci ne sont qu’une très petite minorité de l’ensemble des utilisateurs d’Internet à avoir recours à ce genre de pratique (environ 1 à 3 pourcent bloque les scripts, selon Dennis R. Mortensen, expert en WA).

Cependant, ils sont une plus grande proportion à rejeter ou effacer leurs cookies (au moins 30 pourcent des utilisateurs le font chaque mois, selon des études conduites par plusieurs sociétés de consultance dont Nielsen & Jupiterresearch).

Les cookies sont un moyen très simple et ayant fait ces preuves pour suivre les visiteurs. Mais cette simplicité est aussi à l’avantage des utilisateurs. Car quiconque peut les retirer. Néanmoins, l’information fournie par les cookies est à la base du fonctionnement des systèmes analytics basés sur les tags. Il permet d’identifier les visiteurs, les sources de traffic d’où ils proviennent et d’autres données liées à la consultation des pages.

Cette source de biais est, donc, au centre des préoccupations dans les cercles d’experts. D’autant plus qu’une nouvelle loi européenne visant à obliger les entreprises du Web à demander le consentement des visiteurs avant qu’il soit placé des cookies sur leur ordinateur risque bien de menacer plus gravement cette méthode de collecte des données.

– 3ème cas: firewalls bloquant les tags ou le placement des cookies

Des firewalls mis en place par des sociétés ou des particuliers peuvent empêcher des dispositifs de tag d’envoyer des données vers les serveurs analytics. Par ailleurs, il se peut aussi que les firewalls rejettent ou éliminent les cookies automatiquement.

Pour protéger des informations sensibles, Facebook peut, par exemple, altérer certains paramètres des URLs taguées pour les campagnes. Pour éviter que ce problème ait un impact sur ses statistiques, Yves Ferket (consultant chez Nascom) utilise un raccourcisseur d’URLs (TinyURL ou Bit.ly). Cela permet d’envoyer les clicks provenant de Facebook et de retrouver les données des URLs telles que paramétrées dans Google Analytics.

– 4ème cas: erreurs d’exécution (ou non exécution) de Javascript

Des problèmes peuvent aussi provenir du fait que d’autres Javascripts placés au-dessus du code analytics en question sur la même page s’exécutent mal. Si une erreur se produit lors du décryptage de la page par le navigateur, les tags placés en-dessous ne s’exécuteront pas.

Dans certains cas aussi, le passage trop rapide d’un visiteur d’une page à une autre ne donnera pas assez de temps au javascript pour s’exécuter.

– 5ème cas: même visiteur utilisant plusieurs ordinateurs ou plusieurs utilisateurs utilisant le même ordinateur

Une personne accédant de deux ordinateurs à un même site implique que deux cookies seront installés. Dès lors, les systèmes de WA compteront deux visiteurs uniques biaisant ainsi les données. Le problème est identique, même si le biais est inversé, lorsque plusieurs utilisateurs se servent du même ordinateur pour accéder à un site.

« Il faut revenir à la définition de ‘visiteur’.« 

Pour Gérald Claessens, il n’est pas possible d’éviter ce phénomène. Par conséquent, il conseille de revenir à la définition de ‘visiteur’. Un visiteur ne doit plus être considéré comme un individu unique, mais comme un ‘visiteur/machine’, avec les limites que cela comporte.

Source/plus d’infos: www.advanced-web-metrics.com/blog/2010/04/23/understanding-web-analytics-accuracy/

Olivier De Keyser

Publicités
Par défaut

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s