Netflix espionne les choix des utilisateurs qui regardent Bandersnatch
Netflix enregistre tout ce que font les utilisateurs sur son site, y compris leurs choix dans le film intéractif Black Mirror Bandersnatch. Le chercheur en sécurité Michael Veale, à l'origine de cette information, a en réalité pris pour prétexte la série événement de Netflix pour éduquer les utilisateurs : leur apprendre comment obtenir des grandes firmes les données qu'elles collectent sur eux sans toujours le dire, grâce au RGPD. Et encourager les grandes firmes du web à mettre davantage à disposition ces données. Netflix explique utiliser ces données à la fois pour améliorer la plateforme et les recommandations personnalisées des utilisateurs.
Plutôt Frosties ou Sugar Puffs ? Le blog Motherboard relaie la démarche d'un chercheur de l'University College de Londres, Michael Veale. Son but ? Eduquer les internautes et les grandes firmes du web autour de la collecte de données et de ses implications à l'aune du RGPD. Pour cela, il s'est intéressé au cas de Black Mirror Bandersnatch, un film interactif de la plateforme au cours duquel l'utilisateur doit choisir à de nombreuses reprises sur quelle ligne narrative poursuivre. Plus précisément aux données collectées par Netflix lors du visionnage. Avec une théorie : celle que Bandersnatch est en fait une expérience de data mining.
Comment Netflix exploite vos choix dans Bandersnatch
“J'ai utilisé mon droit d'accéder à ces données en vertu du RGPD pour en savoir plus”, explique le chercheur dans un tweet. Le réglement général de protection des données permet en effet à tout citoyen européen d'exiger d'une plateforme qu'elle lui communique toutes les données collectées sur lui et ses interactions avec le service. Netflix a fait suite à sa demande de façon plutôt exhaustive via une réponse par mail et un lien vers ses données (chiffrées) dans un autre message. Ainsi la plateforme confirme évidemment que chaque choix permet de choisir quelle vidéo montrer par la suite : “un exemple simple de cela c'est si vous choisissez pour Stefan les céréales ‘Frosties' plutôt que les ‘Sugar Pus'. Après ce choix vous verrez un segment vidéo dans lequel le père de Stefan lui tend un paquet de ‘Frosties' pour le petit déjeuner” explique Netflix dans un mail au chercheur.
Lire également : Netflix – top 10 des meilleures séries du catalogue
Mais les données collectées servent à bien plus que cela. Ainsi, “à un niveau individuel, vos interactions […] informent les recommandations personnalisées que vous verrez lors de vos futures visites sur le site”, ajoute la firme de Los Gatos. Par ailleurs, “avec tous les titres sur notre plateforme, nous suivons à un niveau agrégé les interactions avec un titre (comme le nombre total de vues) à des fins analytiques”. La firme poursuit : “nous faisons la même chose pour des choix faits pour passer d'une ligne narrative à une autre, encore une fois à un niveau agrégé – par exemple pour nous aider à déterminer comment améliorer ce modèle de narration dans le contexte d'une série ou d'un film”.
Un accès aux données encore complexe
En plus de cette réponse, le chercheur a obtenu les données collectées dans Bandersnatch, sous la forme d'un PDF avec une notice explicative, et un fichier .csv avec tous les choix réalisés, la date, la plateforme, et si Michael Veale avait ou non déjà visionné tel ou tel segment vidéo. Le chercheur souligne dans un tweet que Netflix a répondu à sa demande d'accès aux données de manière satisfaisante et intelligible. Motherboard raconte néanmoins qu'obtenir ces données s'est avéré moins simple qu'on ne pourrait l'imaginer. Le chercheur raconte “c'était compliqué, je devais poser ces questions de façon spécifique” pour obtenir ces données très détaillées.
Lire également : Vie privée – Apple jugé moins bon que Microsoft, Facebook et Amazon parmi les pires entreprises
Reconnaissant ne pas savoir si les données fournies par Netflix sont là par défaut dans le cas où un utilisateur demande simplement que la plateforme lui communique “toutes ses données”, il remarque : “savoir ce que ‘toutes vos données' veut dire, et ce que la définition de ‘toutes les données' par l'entreprise ne comprend pas, est le défi principal”. Entre autres questions en suspens, il y a celle de la durée de conservation de ces données – absente des documents fournis par Netflix. Sachant que le fait que Netflix puisse fournir ces documents sur une base individualisée montre que ces données ne sont pas anonymes. A aucun moment, par ailleurs, celui qui visionne Bandersnatch n'est informé d'une collecte.
Michael Veale préfèrerait que des plateformes comme Netflix obtiennent un consentement explicite lors d'une telle collecte. Il souhaite également inciter les internautes à faire comme lui et demander leurs données auprès de Netflix et plus largement des plateformes auxquelles ils se connectent : “lorsque les entreprises ont de plus en plus de demandes, elles sont forcées de rationaliser le processus pour des questions d'économies, ce qui, par ricochet, bénéficie à tous les utilisateurs”. Avez-vous récemment fait des demandes d'accès à vos données en vertu du RGPD ? Partagez votre retour dans les commentaires.
Netflix claim they only use individual choices to inform which video segments to show, although they do learn from aggregate choices, as would be expected. pic.twitter.com/T5us7JoWbB
— Michael Veale @mikarv@someone.elses.computer (@mikarv) February 12, 2019