30 novembre 2023

Les "deepfakes" et autres médias synthétiques - créés en grande partie par la technologie de l'IA générative - sont de plus en plus connus, et il est désormais largement admis que les médias synthétiques constituent un problème pour les individus, les organisations et la société.

Les "deepfakes" se présentent sous de nombreuses formes, telles que les reconstitutions, les échanges de visages et les réseaux adverbiaux génératifs (GAN). Il est essentiel de comprendre les différentes formes d'attaques par deepfake afin de pouvoir s'en défendre.

La question de l'IA générative est d'autant plus pressante que la fréquence de ces attaques est en hausse et qu'il devient de plus en plus facile de créer des images synthétiques convaincantes. À mesure que l'IA générative progresse en sophistication, en accessibilité et en évolutivité, il sera de plus en plus difficile de faire confiance à ce que nous voyons et aux personnes avec lesquelles nous interagissons en ligne.

Dans cet article, nous allons démystifier le monde souvent complexe de la fraude basée sur l'IA générative et expliquer les méthodologies sous-jacentes à chaque type de fraude.

Qu'est-ce que l'IA générative ?

L'intelligence artificielle générative (IA) désigne les algorithmes capables de générer un nouveau contenu - texte, images, vidéo ou autres médias - en réponse à une entrée ou à une invite donnée. S'appuyant souvent sur des technologies telles que les réseaux neuronaux et la vision par ordinateur, l'IA générative apprend des modèles et de la structure des "données d'entraînement" existantes afin de créer du contenu. Par exemple, l'"IA analytique" sert à analyser les données existantes et à automatiser le processus de repérage des schémas ou d'extrapolation des tendances, ce qui peut être utile dans des domaines tels que la médecine et les données sur la santé.

L'IA générative s'est imposée dans l'air du temps technologique, avec autant d'admiration que de controverse autour d'outils tels que Chat-GPT. Ces outils peuvent accélérer considérablement la création de contenu, mais la manière dont ils peuvent être utilisés par les criminels dans la course à l'armement en matière de cybersécurité suscite de réelles inquiétudes, car ils favorisent la fraude et l'ingénierie sociale, la désinformation et la cybercriminalité par le biais d'un contenu synthétique manipulateur.

En outre, l'accessibilité croissante des outils d'IA générative sur les marchés du crime en tant que service signifie que les attaquants les moins avertis sur le plan technologique ont désormais un accès facile et abordable à des outils sophistiqués pour créer des médias synthétiques. Les options logicielles les plus sophistiquées d'hier sont aujourd'hui monnaie courante, car la barrière technologique s'est évaporée.

Une étude menée par le Center for Strategic and International Studies a récemment prouvé la qualité de ces parodies générées par l'IA. Elle indique que nous avons "atteint le point d'inflexion où les humains sont incapables de faire une distinction significative entre le contenu numérique généré par l'IA et le contenu numérique créé par l'homme".

Dans cet article, nous nous concentrons plus particulièrement sur l'IA générative telle qu'elle est utilisée pour créer de l'imagerie synthétique, y compris les deepfakes .

Comprendre les différents types d'attaques Deepfake

Prenons quelques instants pour comprendre certaines formes d'attaques de l'IA générative.

Échange de visages : Une forme de média synthétique créé à partir de deux entrées. Ils combinent des vidéos ou des flux en direct existants et superposent une autre identité au flux original en temps réel. Le résultat final est une fausse vidéo en 3D, qui est fusionnée à partir de plusieurs visages, mais avec le modèle biométrique de l'individu authentique toujours intact, même si visuellement la ressemblance est plus proche de celle de l'attaquant. Un spécialiste de l'identification des visages n'ayant pas mis en place les défenses adéquates peut identifier le résultat comme étant l'individu authentique.

Reconstitutions : Également connues sous le nom de deepfakes "marionnettistes". Dans cette technique, l'expression faciale et les mouvements de la personne dans la vidéo ou l'image cible sont contrôlés par la personne dans la vidéo source. Un artiste assis devant une caméra guide le mouvement et la déformation d'un visage apparaissant dans une vidéo ou une image. Alors que les échanges de visages remplacent l'identité source par l'identité cible (manipulation d'identité), les reconstitutions traitent de la manipulation des expressions faciales d'une entrée à la fois.

Les réseaux adverbiaux génératifs (GAN): Un GAN fonctionne grâce à deux modèles d'IA en concurrence l'un avec l'autre pour créer un résultat de deepfake aussi "précis" ou authentique que possible. Les deux modèles - l'un génératif et l'autre discriminant - créent et détruisent en tandem. Le modèle génératif crée un contenu basé sur les données d'entraînement disponibles afin d'imiter les exemples contenus dans les données d'entraînement. Parallèlement, un modèle discriminant teste les résultats du modèle génératif en évaluant la probabilité que l'échantillon testé provienne de l'ensemble de données plutôt que du modèle génératif. Les modèles continuent de s'améliorer jusqu'à ce que le contenu généré ait autant de chances de provenir du modèle génératif que des données d'apprentissage. Cette méthode est si efficace qu'elle améliore le résultat de sa propre authenticité en vérifiant constamment les outils conçus pour la déjouer.

Comment les fraudeurs utilisent-ils généralement les attaques d'IA générative ?

La création et l'utilisation d'images synthétiques générées par l'IA ne sont pas criminelles en soi. Cependant, l'imagerie synthétique est malheureusement un cadeau pour les cybercriminels : elle contribue à des délits tels que l'extorsion et le harcèlement, à la diffusion délibérée de désinformation politique ou à la facilitation de la fraude d'identité et de documents (par exemple, en tentant de contourner les contrôles d'identité imposés par la réglementation "Know Your Customer").

Les formes courantes de fraude fondées sur l'imagerie synthétique sont les suivantes :

Quelle est la différence entre les médias synthétiques modifiés numériquement et les médias synthétiques générés numériquement ?

Les médias synthétiques sont le résultat de l'IA générative, mais tous les médias synthétiques ne sont pas créés par l'IA générative.

L'IA générative génère des données entièrement nouvelles, uniques et originales, par opposition au simple traitement, à l'analyse et à la modification de données existantes. Cette distinction pourrait être résumée par l'opposition entre l'imagerie générée numériquement et l'imagerie modifiéenumériquement.

Pourquoi tout le monde parle-t-il de l'IA générative ?

Si l'IA peut offrir un large éventail de cas d'utilisation positifs - notamment l'automatisation des tâches, l'inspiration créative et l'analyse d'ensembles de données complexes - les dangers de l'IA générative occupent actuellement le devant de la scène.

Popularité de l'intelligence artificielle générative - ce graphique montre que l'intérêt a explosé au fil du temps.Note : Google Trends représente le nombre de recherches organiques pour un terme spécifique au fil du temps ; les données du graphique sont normalisées dans une fourchette de 0 à 100 et sont appelées "intérêt au fil du temps".

Une chose est sûre : l'IA générative progresse rapidement et promet des impacts profondément perturbateurs et transformationnels dans toute une série d'industries.

L'IA générative a suscité l'intérêt du public, des décideurs et des gouvernements. Vous pouvez en savoir plus sur l'IA générative et le secteur public dans cet article, qui fournit une liste de réponses de gouvernements et de décideurs politiques du monde entier, et explique comment iProov se prémunit contre cette menace.

Dans le monde numérique d'aujourd'hui, la surface d'attaque numérique est plus grande, avec un plus grand nombre et une plus grande variété de transactions à haut risque effectuées en ligne - ce qui signifie souvent des récompenses plus importantes pour les fraudeurs. En fin de compte, la préoccupation est de savoir comment les mauvais acteurs peuvent utiliser les médias synthétiques générés par l'IA à des fins frauduleuses et pour faciliter la diffusion de fausses informations en ligne.

Dernières réflexions sur l'IA générative et la vérification biométrique des visages

Un visage humain authentique est unique et ne peut être reproduit. C'est pourquoi la vérification biométrique du visage s'est imposée comme la méthode la plus sûre et la plus pratique pour vérifier l'identité d'un utilisateur en ligne.

Une chose est sûre : la technologie biométrique servira de bouée de sauvetage pour vérifier la présence authentique à distance, d'autant plus que les répliques ne peuvent plus être distinguées par l'œil humain. En réalité, seuls les systèmes les plus avancés qui ont participé à cette course à l'armement en pleine expansion sont équipés pour reconnaître l'IA générative.

Comment iProov peut aider

Pour vérifier un deepfake, iProov utilise une technologie biométrique unique brevetée avec des technologies d'apprentissage profond et de vision par ordinateur pour analyser certaines propriétés que les médias créés par l'IA générative ne peuvent pas recréer - puisqu'il n'y a pas de personne réelle de l'autre côté de la caméra. C'est pourquoi l'intégration d'une biométrie en temps réel dans la technologie liveness est essentielle pour que les organisations puissent faire la distinction entre les médias synthétiques et les personnes authentiques.

Pour en savoir plus sur la façon dont les fraudeurs exploitent l'IA générative pour saper la vérification de l'identité et renforcer la fraude à l'identité synthétique, lisez notre nouveau rapport "Stolen to Synthetic" (du vol au synthétique) ici.

Réservez une démonstration ou demandez une consultation personnalisée avec un expert iProov ici aujourd'hui.