Empreinte numérique : Comment cela fonctionne exactement

Imaginez ceci : La collaboration classique entre David Bowie et Queen, “Under Pressure”, vous vient à l’esprit. Vous ne l’avez pas entendue depuis des années et, soudain, vous ne pensez plus qu’aux paroles.

Mais vous ne vous les rappelez pas toutes, alors vous sautez instinctivement sur Internet pour rechercher la chanson et l’écouter. Où allez-vous en premier ? Vous pourriez aller sur iTunes, où vous trouverez peut-être la chanson disponible sous forme de MP3 à 99 cents. Mais au lieu de cela, vous allez sur YouTube. Et puis vous voulez partager votre trouvaille avec vos amis, alors vous postez un lien sur Twitter. En quelques minutes, une douzaine de personnes écoutent cette même chanson sans payer un centime.

C’est le genre de situation que les créateurs de contenu numérique n’apprécient pas trop. Quelqu’un détient les droits sur la plupart des contenus disponibles sur le Web, et trop souvent, ils sont distribués sans autorisation. Comment les entreprises peuvent-elles monétiser quelque chose qui est si facilement (et fréquemment) dupliqué et partagé gratuitement ?

L’une des réponses est un processus appelé empreinte numérique. La technologie d’empreinte numérique s’appuie sur une analyse informatique complexe pour identifier un élément de média comme une chanson ou un clip vidéo. C’est ici que naît l’analogie avec les empreintes digitales : Tout comme chaque personne possède une empreinte digitale unique, chaque média possède des caractéristiques d’identification qui peuvent être repérées par un logiciel intelligent. Mais à quoi sert réellement ce type d’identification ? Des sites comme YouTube peuvent scanner des fichiers et comparer leurs empreintes numérique à une base de données de matériel protégé par le droit d’auteur et empêcher les utilisateurs de télécharger des fichiers protégés par le droit d’auteur. Cela semble simple, non ? Étonnamment, les gens confondent souvent l’empreinte numérique avec le filigrane ou n’ont pas une idée claire de ce que cette technologie implique.

Lire aussi :  Business : Les bénéfices liés à un ERP

Le problème vient en partie du fait que le terme “empreinte numérique” peut en fait faire référence à deux choses totalement différentes. La première signification, nous l’avons déjà abordée, mais la seconde repose sur une analogie plus traditionnelle avec les empreintes digitales, assimilant votre ordinateur personnel à une empreinte digitale en ligne qui peut être utilisée pour suivre votre activité en ligne. Les deux concepts font référence à un identifiant unique, mais avec des fonctionnalités complètement différentes — cette deuxième signification n’a rien à voir avec le repérage de chansons ou de vidéos protégées par le droit d’auteur. Ni l’un ni l’autre n’implique le balayage de véritables empreintes digitales, mais il s’agit tout de même de technologies plutôt cool. Voyons comment elles fonctionnent.

Filigrane et empreintes numérique

Il est facile de confondre une empreinte numérique et un filigrane numérique, mais il s’agit de deux technologies très différentes dont les objectifs sont quelque peu similaires. Dans la culture populaire, les empreintes numérique sont le plus souvent évoquées dans les films d’espionnage ou les mystères, en tant que marques d’identification visibles que les gens laissent derrière eux. Eh bien, ce n’est pas ainsi que fonctionne une empreinte numérique : vous ne verrez jamais de preuve visible de l’existence d’une empreinte numérique. Le terme filigrane, en revanche, fait généralement référence à un marquage totalement visible sur un fichier numérique. Les filigranes servent à freiner la diffusion illégale de contenu par ennui plus que par une technologie intelligente.

Un filigrane est un logo ou un autre marquage d’identification placé sur une image ou une vidéo et visible à tout moment. Le filigrane vise à décourager les internautes de prendre une photographie ou une vidéo d’un site Web et de l’utiliser à leurs propres fins sans en reconnaître la source. Il est assez difficile de prétendre qu’une photo vous appartient lorsqu’elle porte le logo de quelqu’un d’autre ! Malheureusement, rien ne garantit vraiment l’efficacité d’un filigrane. Les pirates peuvent toujours partager des vidéos filigranées, et certaines photos avec des filigranes plus petits peuvent facilement être recadrées pour cacher l’identité de leur propriétaire légitime. Une deuxième forme de filigrane ajoute un bit de données imperceptible à un fichier qui peut être utilisé à des fins de suivi. Bien que cela puisse sembler encore moins utile qu’un filigrane visible, cela permet en fait aux propriétaires de contenu de suivre l’origine d’un fichier grâce à son filigrane unique.

Lire aussi :  Faut-il plutôt utiliser Facebook ou Google pour se connecter à d’autres sites ?

L’empreinte numérique offre un moyen encore plus prometteur de restreindre la diffusion de matériel protégé par le droit d’auteur. La composition même d’un fichier, que l’on pourrait appeler son ADN, peut être analysée et reconnue par un programme informatique conçu pour filtrer le matériel sous licence. Cette empreinte digitale représente l’équivalent numérique d’un drapeau rouge : lorsqu’un système informatique sait comment interpréter son message, il agit comme un avertissement qui dit “Je suis sous copyright !”. Bien sûr, ce n’est pas aussi simple. La page suivante se penche sur la technologie qui déclenche ce drapeau rouge.

Technologie d’empreinte numérique

Contrairement au filigrane, l’empreinte numérique n’implique jamais la modification d’un fichier. L’utilisation la plus prometteuse de l’empreinte numérique est préventive plutôt que basée sur le suivi. Pour que l’empreinte digitale fonctionne, le logiciel doit être capable d’identifier avec précision un élément du média et de relier ce fichier à une base de données externe. Pour ce faire, le logiciel d’empreintes digitales échantillonne un fichier audio ou vidéo pour en extraire de minuscules parties qui sont uniques à ce média. Ces échantillons peuvent être une poignée de pixels rouges qui constituent le chapeau d’un personnage à la 57e minute d’un film ou la hauteur exacte de la voix d’un chanteur 30 secondes après le début d’une chanson. Il s’agit là d’exemples extrêmement simplistes. L’empreinte digitale implique l’échantillonnage de multiples critères pour former une représentation précise du média en question.

Lire aussi :  Votre agence de communication dans l’Indre (36) pour quels services ?

L’une des principales entreprises d’empreinte numérique, Audible Magic, travaille pour d’énormes fournisseurs de contenu, dont NBC Universal, Sony Music et 20th Century Fox. Audible Magic se vante que sa technologie CopySense peut identifier la source d’un clip vidéo dans les cinq secondes qui suivent la lecture et peut identifier un fichier audio dans les dix secondes. Et soi-disant, c’est dans n’importe quelles conditions. Non seulement le logiciel d’Audible Magic est conçu pour identifier une copie immaculée d’un film, mais la société affirme que son logiciel peut reconnaître un média qui a été, disons, enregistré sur l’écran d’un cinéma avec une caméra portable.

L’identification est basée sur ce qu’Audible Magic appelle “les caractéristiques perceptuelles de l’audio et de la vidéo”. Le système est suffisamment intelligent pour voir les modifications apportées aux fichiers audio et vidéo, de sorte que le transcodage entre les formats de fichiers, l’égalisation de l’audio, le recadrage d’une image ou même le floutage d’une image ne peuvent tromper CopySense.

Cela signifie-t-il qu’Audible Magic peut identifier chaque élément de contenu sur Internet ? Non, l’empreinte digitale ne fonctionne qu’avec des médias qui ont été analysés et dont le fichier de référence a été téléchargé dans une base de données. Ce fichier contient toutes les caractéristiques perceptives qu’Audible Magic utilise pour identifier une chanson ou une vidéo. La base de données du registre mondial des droits d’Audible Magic couvre des millions de fichiers de ses clients.

Et voilà l’essentiel de l’empreinte numérique comme moyen de protection contre la copie. Prochainement : comment un deuxième type d’empreinte digitale peut suivre votre identité en ligne.

Lire aussi :  Pourquoi utiliser un logiciel de gestion de maintenance GMAO ?

L’empreinte numérique et votre identité

La page précédente a abordé la technologie de l’empreinte numérique telle que nous la concevons habituellement, mais ce terme fait parfois référence à une forme totalement différente de suivi des données. Cela peut être assez déroutant. Nous savons tous ce que signifie normalement la prise d’empreintes digitales (nous n’avons qu’un seul jeu d’empreintes digitales !), mais l’entrée dans le monde numérique ouvre la voie à l’ambiguïté. Ces dernières années, l’empreinte numérique a été utilisée pour décrire une méthode de suivi d’identité – essentiellement, chaque ordinateur a une empreinte digitale unique qui le rend traçable sur Internet.

Vous avez probablement entendu parler des adresses IP, les numéros uniques associés à chaque ordinateur sur Internet. Une adresse IP n’est pas une carte d’identité exacte pour un ordinateur. Les empreintes digitales réelles ne changent jamais, mais les fournisseurs de services Internet (ISP) peuvent modifier les adresses IP des utilisateurs. L’empreinte numérique tient compte d’autres détails pour déterminer l’identité de votre ordinateur. Et c’est là que les choses deviennent un peu effrayantes : il est incroyablement facile pour les sites Web de lire divers éléments de données sur votre ordinateur et de savoir qui vous êtes. L’adresse IP n’est que la première étape – elle indique qui est votre fournisseur d’accès et dans quel pays vous vivez. L’identité de connexion que vous choisissez sur un site Web peut être un autre indice. Si vous utilisez le même identifiant sur plusieurs sites, ce nom peut être facile à retrouver avec une simple recherche sur Google. Le système d’exploitation installé sur votre ordinateur, qu’il s’agisse de Windows, de Mac OS X ou de Linux, resserre l’étau. Même le navigateur Web que vous utilisez (et la version spécifique que vous exécutez, comme Google Chrome 11.0.696.60 ou Firefox 3.6.17) ajoute des détails à votre empreinte numérique.

Lire aussi :  Se procurer une coque pour smartphone

Comme vous pouvez le constater, la technologie existe pour suivre vos activités sur Internet. Mais est-ce vraiment une mauvaise chose ? Eh bien, cela dépend de la valeur que vous accordez à votre vie privée. Une des utilisations de cette technologie réside dans la publicité ciblée, qui tiendrait compte de vos données pour vous proposer des annonces plus susceptibles de vous intéresser. Si vous avez déjà remarqué que Google Ads récupérait des mots-clés d’une page que vous consultez pour vous proposer des annonces plus actuelles ou si vous avez été surpris lorsque des sites Web identifient mystérieusement la ville dans laquelle vous vivez, vous avez vu une version de base de cette technologie à l’œuvre. Comme ce type de suivi devient de plus en plus courant, les sociétés de publicité et de suivi sont censées proposer des sites Web d’exclusion (un peu comme les listes de numéros de téléphone exclus des télévendeurs) qui protégeront votre anonymat. Néanmoins, vous devez toujours être conscient de la facilité avec laquelle votre identité peut être tracée.

Les raisons de l’empreinte numérique

Les deux dernières pages ont établi que le terme “empreinte numérique” s’applique à deux technologies totalement différentes. Ce qu’elles ont en commun, bien sûr, c’est une forme d’identification informatisée. Maintenant que nous avons établi le fonctionnement de chaque technologie, examinons comment chacune est utilisée. YouTube constitue un point de départ facile. La violation des droits d’auteur menace constamment le site vidéo. En 2007, Viacom a intenté un procès à Google pour un milliard de dollars concernant des clips disponibles sur YouTube. Google n’a pas téléchargé les clips lui-même, mais il n’a pas non plus empêché les utilisateurs de télécharger les clips. Contrôler un site aussi vaste que YouTube est un défi de taille : comment Google peut-il empêcher le contenu sans licence d’entrer ?

Lire aussi :  Java et JavaScript : connaissez-vous vraiment leur différence

Grâce aux empreintes numériques. Google utilise un logiciel appelé YouTube Video Identification pour trier les vidéos téléchargées et reconnaître les contenus protégés par des droits d’auteur. Il donne également aux détenteurs de droits d’auteur la possibilité de refuser les téléchargements ou même de monétiser leur contenu. Cette forme d’empreinte numérique a en fait deux objectifs : Elle protège Google contre les poursuites judiciaires dommageables et limite la diffusion sans licence de matériel protégé par des droits d’auteur. Dans l’idéal, cela signifie que tant les entreprises qui détiennent les droits d’auteur que celles qui hébergent ce contenu en ligne sont protégées par le fingerprinting. Le contenu n’est pas diffusé illégalement et les sites comme YouTube évitent les poursuites judiciaires désagréables.

Bien sûr, l’empreinte numérique n’est pas forcément une technologie restrictive. Un autre excellent exemple d’empreinte digitale à l’œuvre est Shazam, l’application d’identification musicale qui peut faire correspondre l’échantillon audio d’une chanson à une base de données musicale. Sur les téléphones intelligents, Shazam utilise un microphone pour capter l’audio d’une chanson, l’analyse et utilise ces données pour trouver une correspondance. Shazam fait ensuite apparaître une page d’informations sur la chanson et l’artiste et fournit un accès rapide à un magasin de musique où l’on peut acheter un MP3 de la chanson.

Nous avons décrit comment l’empreinte numérique peut être utilisée pour suivre des PC sur Internet en fonction de diverses caractéristiques qui composent une empreinte numérique. Cette même technologie de suivi peut également être utilisée pour la sécurité. Les pirates et les internautes qui téléchargent du matériel illicite peuvent être identifiés, suivis et même arrêtés grâce à la puissance de l’empreinte numérique. Et comme l’identification ne repose pas uniquement sur une adresse IP, les pirates qui accèdent à Internet à partir de différents endroits sur le même appareil peuvent toujours être épinglés.

Lire aussi :  Service public : des organismes injoignables ?

De toute évidence, la traque des criminels est une noble utilisation de l’empreinte numérique – mais si cela commence à ressembler à une invasion de la vie privée pour vous, vous pourriez être sur la bonne voie.

Légalité

Comme vous l’avez probablement compris à ce stade, l’empreinte numérique peut être une technologie puissante, voire envahissante. Aimez-vous l’idée que chacun de vos mouvements en ligne soit suivi, même si c’est uniquement à des fins de publicité ciblée ? Voici une meilleure question : Est-ce même légal ?

Le suivi d’identité par empreintes digitales s’appuie sur un terrain éthique fragile qui pourrait être jugé trop invasif et illégal à l’avenir. Mais comme il s’agit d’une technologie en développement, ces questions juridiques sont encore en cours de résolution. Et comme l’Internet est un réseau mondial, les lois concernant les empreintes numériques peuvent évoluer de manière totalement différente d’un pays à l’autre.

Selon les directives du Canada, une empreinte numérique constitue probablement une information personnelle, de sorte que l’utilisation de cette information pourrait être en violation des lois canadiennes sur la protection de la vie privée. Les organisations canadiennes sont tenues d’épuiser toutes les méthodes non invasives possibles d’identification personnelle avant de recourir à des méthodes comme les empreintes digitales. Étant donné que la prise d’empreintes digitales “peut recueillir plus d’informations que nécessaire pour identifier les répondants frauduleux et en double dans les recherches en ligne”, les organisations canadiennes pourraient avoir des ennuis pour avoir suivi des personnes sans avoir reçu la permission ou épuisé toutes les autres possibilités.

La première forme d’empreinte numérique que nous avons abordée – la mise en correspondance des caractéristiques d’identification des médias protégés par le droit d’auteur avec une base de données – ne présente pas les mêmes problèmes éthiques que le suivi d’identité. Les détenteurs de licences ont le droit de protéger leur contenu, et rien dans cette forme d’empreinte digitale ne porte atteinte à la vie privée de l’utilisateur. Idéalement, l’empreinte digitale diminuera réellement le nombre de procès pour violation du droit d’auteur en arrêtant la diffusion illégale de médias sous licence. Le procès intenté par Viacom contre YouTube, pour un montant d’un milliard de dollars, a été rejeté par le tribunal en 2010, car Google a été jugé en conformité avec le Digital Millennium Copyright Act (DMCA). Comme le site a retiré les vidéos illégales lorsqu’il en a été informé, il était protégé par le DMCA et n’a pas été tenu responsable des actions de ses utilisateurs. Avec une meilleure technologie d’empreintes digitales, le procès n’aurait peut-être jamais eu lieu du tout. Cette déclaration met beaucoup de foi dans la technologie des empreintes digitales, ce qui nous amène à notre dernier sujet : Dans quelle mesure fonctionne-t-elle vraiment ?

Lire aussi :  Gérer les congés des salariés via un logiciel

Efficacité des empreintes numériques

L’empreinte numérique semble être la technologie parfaite pour lutter contre le piratage sur Internet. Elle empêche les utilisateurs de diffuser du contenu protégé par le droit d’auteur et évite potentiellement les tracas et les dépenses liés aux poursuites judiciaires. Une fois mise en œuvre par une organisation, l’empreinte numérique est un système largement automatisé, ce qui signifie moins de travail pour les fournisseurs de contenu et les sites de médias. Bien sûr, tout ce confort suppose une chose essentielle : que l’empreinte numérique fonctionne réellement.

L’empreinte numérique doit être capable d’identifier des milliers ou des millions d’éléments de contenu — un contenu qui peut être diffusé dans de nombreux formats de médias, recadré ou édité de manière inattendue, ou même enregistré sur un écran de cinéma. Les éléments vidéo comme la couleur, le débit binaire et même la résolution peuvent varier d’une vidéo à l’autre. Avec toutes ces variables, l’empreinte numérique peut-elle vraiment fonctionner ?

En 2007, la technologie d’empreintes digitales Copysense d’Audible Magic a été mise à l’épreuve sur un site de vidéo en ligne appelé Soapbox. Soapbox était un projet de Microsoft qui permettait aux utilisateurs de télécharger des vidéos à la manière de YouTube. Malgré la technologie d’empreintes digitales d’Audible Magic, le site technologique Gigaom a pu facilement télécharger une vidéo protégée par des droits d’auteur provenant de l’émission “The Daily Show” de Comedy Central. Il a fallu plusieurs jours pour que le clip soit retiré de Soapbox – même après que Gigaom ait contacté Microsoft et Audible Magic pour obtenir des commentaires. Pensant que le clip serait alors indexé et protégé contre le partage illicite, Gigaom a essayé de le télécharger à nouveau. Cela a fonctionné. Ils ont eu un succès similaire sur Myspace, qui utilise également l’empreinte digitale d’Audible Magic.

Lire aussi :  Formation à distance : avantages et inconvénients

Audible Magic protège contre 11 millions de chansons, films et émissions de télévision. Mais avec des décennies de médias à notre portée sous forme numérique, le logiciel ne peut évidemment pas se prémunir contre tous les téléchargements illégaux. L’empreinte numérique ne peut pas non plus arrêter la plupart des partages de fichiers peer-to-peer, qui distribuent le matériel directement entre les utilisateurs. L’efficacité de la prise d’empreintes numériques à l’avenir est totalement incertaine. Si des sociétés comme Audible Magic continuent d’améliorer leurs systèmes de reconnaissance et d’étendre leurs bases de données d’empreintes digitales, les sites avec du contenu généré par les utilisateurs seront plus faciles à maintenir et la technologie qui identifie les médias sera plus puissante que jamais. Qui sait ? Dans 20 ans, des applications comme Shazam seront peut-être capables de différencier deux versions de concert de “Free Bird” en se basant sur la longueur d’un solo de guitare. Ça, ce serait de la précision !

Laisser un commentaire

Découvrez nos articles à propos du multimédia