Google analytics et la Commission Charbonneau : rectifions les faits.

Écrit par le 22 fév 2012 dans Analytics

Aujourd’hui, un article est paru sur Cyberpresse concernant le respect de la confidentialité et la sécurité des informations qui transigent par le nouveau site Web de la commission Charbonneau.

Malheureusement, si certaines inquiétudes sont fondées (celles qui concernent l’utilisation d’un formulaire de transmission de données confidentielles sur un site non sécurisé), d’autres relèvent carrément de la science-fiction.

Puisque ce n’est pas mon domaine d’expertise, je laisserai la discussion concernant le certificat SSL du formulaire à d’autres. (Je mentionnerai seulement au passage que, depuis la parution de l’article, le formulaire a été retiré. Pourtant, il aurait été préférable de simplement sécuriser le site, et cela aura pu être fait très rapidement.)

Quel est le problème avec les données supposément transmises par Google analytics?

Le problème, c’est que la manière dont l’article est écrit laisse entendre que Google Analytics permet aux propriétaires d’un site de savoir, personnellement, qui visite le site et quelle informations il transmet. C’est complètement faux, et même loufoque.

Google accumule bien sûr des données lors des passages des usagers : dans les règles de confidentialité de Google Analytics , voici ce qu’on déclare :

« Informations de connexion : lorsque vous accédez à des services Google avec un navigateur, une application ou tout autre dispositif, nos serveurs collectent automatiquement certaines informations. Ces fichiers journaux du serveur peuvent comporter les informations suivantes : votre requête de recherche Web, vos interactions avec un service, votre adresse IP, le type et la langue de votre navigateur, la date et l’heure de votre requête, et un ou plusieurs cookies permettant d’identifier votre navigateur ou votre compte de façon unique. »

Donc oui, Google accède à plusieurs informations vous concernant. Il n’y a là aucun mystère ni complot. C’est connu.

Le hic avec le doute semé par l’article, c’est que Google accumule ces données de manière complètement confidentielle, et que les propriétaires de sites Web n’ont pas accès aux données relatives aux adresses IP.

Tout ce qu’un propriétaire de site peut voir, c’est :

  • Le type d’ordinateur que vous utilisez;
  • La version de système d’exploitation utilisée, sa langue, ainsi que la résolution de l’écran, de même que la version du plug-in Flash installé;
  • Une certaine information géographique, mais floue : on peut savoir dans quelle ville vous êtes, mais c’est tout. Et encore, si votre fournisseur d’accès à Internet héberge ses serveurs de relais à Toronto et que vous êtes à Québec, Google Analytics dira que vous êtes à Toronto, parce que les adresses IP du fournisseur y sont aussi. (Ce n’est pas toujours le cas et un peu plus compliqué que ça, mais il est néanmoins impossible de savoir si vous êtes dans le quartier St-Roch, sur la rue Caron, au 3e étage du 2e immeuble à gauche. Ça, c’est de la pure science-fiction.)
  • Et un tas d’autres informations sans aucune pertinence pour vous identifier (de quel site vous avez suivi un lien pour arriver sur le site actuel, etc.)

Remarquez bien : il n’y a aucune, absolument aucune information nominative permettant d’identifier un individu. Rien. Niet. Nothing. Pas possible. Si ça se pouvait, pensez-vous vraiment que les experts en marketing n’auraient pas exploité ça avant? Vraiment?

La seule chose qui peut être identifiée, c’est l’adresse IP de votre organisation si vous travaillez pour une institution ou une entreprise qui a une adresse IP fixe. Le ministre Vic Toews a d’ailleurs appris cette semaine à quoi ça pouvait servir, mais vous remarquerez justement qu’il n’est pas possible de savoir qui est à l’origine de ces fuites, mais seulement qu’elles proviennent de la Chambre des communes.

Et encore : sachez que les informations recueillies par Google analytics sont transmises de manière sécuritaire :

« Google Analytics protège les transactions relatives au suivi de votre site Web grâce à la norme technologique SSL (Secure Socket Layer). Les données de vos visiteurs sont également protégées, sachant que vos rapports ne contiennent aucune donnée personnelle les concernant. »

Donc, rien de très stressant quant à l’identification d’éventuels délateurs, quand on prend le temps de faire ses devoirs et de se renseigner un tout petit peu…

Oui mais si…

Maintenant, si nous poussons la paranoïa plus loin, et que nous supposons que, puisque Google enregistre les adresses IP des utilisateurs (sans les transmettre aux propriétaires de sites) et qu’il est par conséquent possible que ces données soient transmises à une tierce partie…

  • Il vous faudra un mandat policier pour les obtenir, et encore. Il en faudra un (valide aux États-Unis) pour que Google transmette l’adresse IP, et un autre pour que le fournisseur d’accès au Web identifie à qui appartenait cette adresse IP au moment où le délateur se sera rendu sur le site. On ne peut pas téléphoner chez Google tout bonnement un vendredi après-midi et demander, comme ça, « Salut mes potes, vous pourriez pas me dire qui était sur notre site jeudi passé à 14:48:53, il me faut ça pour ma recherche à l’école… »
  •  Si votre organisation est moindrement frileuse, Google permet d’empêcher tout enregistrement des adresses IP précises des utilisateurs de votre site. Il suffit d’ajouter un tout petit bout de code (méthode _gat._anonymizeIp(), détails disponibles sur cette page) qui permet d’éliminer complètement la dernière section de l’adresse IP des Internautes qui visitent le site. C’est l’équivalent de montrer, sur un afficheur téléphonique, les 3 chiffres du code régional et les 3 suivants, mais pas les 4 derniers. Impossible de savoir qui appelle…

D’autres gouvernements l’utilisent à bon escient : le gouvernement fédéral américain, le gouvernement fédéral du Canada, etc, etc. (Remarquez, le gouvernement du Canada spécifie qu’il n’utilise pas Google analytics sur des sites sécurisés. Que les raisons soient bonnes ou mauvaises, on comprend qu’on touche une zone sensible. Mais cela ne concerne QUE LES SECTIONS SÉCURISÉES DES SITES.)

Quelles alternatives?

Il y en a 2 : on n’installe aucun système d’analyse des données, et on perd du coup tous les avantages qui viennent avec.

Ou alors on installe un système d’analyse de données permettant d’accumuler les données sur les serveurs du gouvernement directement. Et c’est 100 fois pire pour les paranoïaques, parce que les données concernant les adresses IP détaillées seront alors disponibles, sans filtre, pour les propriétaires du site. Et encore pire pour les contribuables, parce que ces logiciels coûtent cher, et n’apportent pas plus (et en fait souvent moins) d’informations que Google analytics…

Comment la commission Charbonneau pourrait utiliser Google analytics de manière sécuritaire pour ses usagers?

  1. Ne pas installer Google analytics pour éviter les doutes, ou alors l’installer sur les sections qui n’ont pas à être sécurisées. Comme pour les sites des banques, seules les sections où transigent des informations confidentielles devraient être sécurisées. Les sections qui servent seulement à diffuser des informations n’ont pas à l’être.
  2. Configurer le script de manière à éviter la collecte de l’adresse IP complète. Ça prendrait bien un gros 20 minutes…

Et pour les autres sites gouvernementaux?

À moins que de l’information confidentielle ne transige par des formulaires (qui devraient être sécurisés), il n’y a AUCUNE raison de paniquer avec cette histoire qui concerne le cas très particulier d’un site visant la dénonciation de criminels.

L’utilisation de systèmes comme Google analytics a de nombreux avantages pour les propriétaires de sites, mais aussi pour les citoyens : en comprenant comment les gens utilisent le site, on peut voir ce qui fonctionne, mais aussi ce qui doit être amélioré. On peut connaître les contenus les plus populaires, et en fournir davantage de la même nature. On peut aussi évaluer la réussite d’une campagne promotionnelle ou d’autres actions sur le Web.

Bref, les avantages sont trop grands pour qu’on puisse s’en passer, et les alternatives sont coûteuses, moins précises et surtout, offrent encore plus de données aux propriétaires de site.

Donc…

Cette simili-controverse n’a pas lieu d’être, et il serait dommage que des mauvaises décisions soient prises à cause de la peur de mal paraître des organisations publiques.

Au lieu de paniquer, il serait préférable de se renseigner à des personnes compétentes et de communiquer clairement avec les citoyens à ce sujet au lieu de jeter le bébé avec l’eau du bain.

 facebooktwittergoogle_pluslinkedinfacebooktwittergoogle_pluslinkedinby feather

Laisser un commentaire