Avis | Je ne suis pas un caricaturiste. Le Gemini de Google non plus
Un magasin Dollar Tree et l'église catholique Saints Pierre et Paul se font face sur la septième rue sud à Saint-Louis. (Capture d'écran/Google Maps)À un endroit sur South 7th St. à Saint-Louis se dressent deux bâtiments qui ne pourraient pas être plus différents. Du côté ouest de la rue, la flèche massive et la nef de l'église catholique Saints-Pierre-et-Paul s'élèvent pour évoquer l'émerveillement et la puissance de Dieu.
À travers le 7ème squat et efficace, il y a un Dollar Tree. La chaîne nationale de vente au détail discount répond à de nombreux désirs et besoins, mais la croissance spirituelle n’en fait pas partie.
Alors que j'étais là, j'ai pensé que le simple ajout de la lettre permettrait de capturer cette étrange juxtaposition de la foi et du matérialisme en Amérique.
Attachez ce I majuscule devant Dollar Tree.
L’image de cette grande église et du Dollar Tree m’est restée, mais je n’en ai rien fait jusqu’à ce que je teste le générateur d’images Nano Banana de Google Gemini.
Comme tous ces outils d’image IA, vous tapez vos instructions et une boîte noire transforme vos mots en image.
carmine agnello
Tout ce que j'avais, c'était mon imagination et le sentiment que mon invite devrait être assez détaillée, mais pas exhaustive. Je m'attendais à un processus itératif. Au final, les résultats ont été à la fois impressionnants et, je l'espère, rassurants pour les vrais dessinateurs.
Compte tenu de mon manque total de talent artistique, je devais admirer le fait que les Gémeaux puissent tout faire avec mes pensées. J’étais l’élève de première année qui ne savait pas colorier à l’intérieur des lignes et mes capacités en dessin ont décliné à partir de ce moment-là.
Sur la base des images brutes et des mots que j'ai fournis, Gemini m'a donné quelque chose que je considérais comme assez bon. Mais ce n’était pas ce qu’un véritable artiste évoquerait. Ses lignes étaient trop dures et la composition trop géométrique.
L'exercice était instructif. Avec quelques raccourcis, nous passerons en revue le processus. Le dessin animé que j’ai mis en ligne vient du New Yorker. Elle représentait un gars sur une île déserte et n’avait aucun lien avec le thème de mon image. Cela dit, cela flirte avec la violation du droit d’auteur et, vu le travail de Gemini, il est difficile d’imaginer que le mannequin n’ait pas utilisé les dessins animés du New Yorker dans sa formation. Il incluait même le nom d’un véritable artiste dans le coin qui, s’il était laissé en place, franchirait clairement la ligne. Voici mes étapes :
Rapide:
J'ai téléchargé deux images. L’une montre l’enseigne du magasin appelé Dollar Tree. Le deuxième est un dessin animé. Utilisez le second uniquement comme guide de style. Je veux que vous produisiez un dessin animé dans le style de l’image de dessin animé. Le dessin animé que vous produisez utilisera un style à la plume et à l’encre et montrera deux hommes debout ensemble devant le parking d’un magasin. L’enseigne du magasin clairement lisible sera I Dollar Tree. En face du parking du magasin se trouve une église nommée First West Church.
Un homme parle à l'autre. La légende dit que je voulais voir quel parking accueillerait le plus de voitures dimanche.
Résultat:

Cette image a été créée à l'aide de l'IA générative. (Jon Greenberg/Poynter)
Cela n’était clairement pas à la hauteur, mais le style était prometteur, alors j’ai réessayé. (Notez la signature dans le coin. Mes excuses à Felipe Galindo dont j'ai fourni le travail à Gemini.)
Rapide:
Plutôt bien mais changez l'enseigne du magasin pour être I-Dollar Tree et placez le magasin et son parking à gauche du dessin animé. Mettez la rue et l'église à droite. Faites en sorte que l'église et son enseigne soient aussi grandes que le magasin et son parking. Éliminez la bulle sortant de la bouche de l’homme. Il n'y a pas de bulle de dialogue. Essayez maintenant de dessiner le dessin animé avec ces modifications.
Résultat:

Cette image a été créée à l'aide de l'IA générative. (Jon Greenberg/Poynter)
Je commençais à penser que ce ne serait pas mon jour mais j’ai réessayé.
Rapide:
Réduisez un peu le magasin et son parking et placez-les tous les deux sur la moitié gauche de l'image. Dessinez ensuite la rue qui va de haut en bas de l’image. Dessinez ensuite la First West Church et son parking sur la moitié droite de l'image, à peu près aussi grande que le magasin et son parking.
Cela a très peu changé le résultat qui a suivi et mon irritation était évidente lors de mon prochain essai, qui n’était même pas vraiment une invite.
Rapide:
Vous semblez incapable de déplacer les composants ou de modifier l'échelle. Voulez-vous réessayer ?
Ce qui entraîna cette réponse contrite :
Je m'excuse de ne pas avoir réussi à capturer correctement votre vision avec les tentatives précédentes. Je comprends que vous recherchez une mise en page et une échelle spécifiques. Je vais réessayer d'ajuster les éléments comme vous l'avez décrit : le magasin et son parking plus petit et sur la moitié gauche la rue qui s'étend verticalement de haut en bas et l'église First West et son parking sur la moitié droite à l'échelle du magasin.
Voici une autre tentative :

Cette image a été créée à l'aide de l'IA générative. (Jon Greenberg/Poynter)
Nous nous rapprochions. Gemini et moi allions y parvenir. Je pensais.
Rapide:
C'est mieux et presque là. Effectuez ces modifications. Déplacez le panneau sur le côté droit de l’image, juste un peu plus près du bas de l’image par rapport à l’église. Rendez les hommes beaucoup plus petits. Montrez seulement quelques voitures dans les deux parkings.
Résultat:

Cette image a été créée à l'aide de l'IA générative. (Jon Greenberg/Poynter)
Aye-yi-yi ! Pas de voitures du tout ! Un signe flou de Dollar Tree. Je suis allé chercher des détails.
Rapide:
Vous vous êtes débarrassé de toutes les voitures. Dessinez-en quatre devant le magasin et quatre devant l’église.
Résultat:

Cette image a été créée à l'aide de l'IA générative. (Jon Greenberg/Poynter)
Craignant que tout nouveau bricolage ne conduise à un retour en arrière, j'ai déclaré ma victoire et je suis rentré chez moi. L'ensemble du processus a pris moins de 10 minutes.
Je ne suis pas un artiste mais je sais ce que j'aime
Je serai le premier à affirmer que les véritables caricaturistes new-yorkais n’ont rien à craindre. Du moins pas encore. Mis à part le fait que la blague n’est pas assez bonne pour le magazine et que l’illustration ne l’est certainement pas, mais plus fondamentalement, l’image manque d’une touche humaine habile.
La scène entière est trop géométrique. Les échelles des différents éléments ne sont pas encore tout à fait exactes. En tant que concepteur d'apprentissage interactif MediaWise, Sean Marcus, Laboratoire d'innovation en IA de Poynter J'ai demandé pourquoi toutes les voitures ont-elles reculé dans leur espace et pourquoi sont-elles si exactement assorties ? La route noire audacieuse semble être la chose la plus importante de l’image alors qu’elle devrait simplement être un élément de la scène. Et les gars devraient être sur le trottoir et non au milieu de la route.
Quelques itérations supplémentaires pourraient affiner le produit final, mais avec ce système, vous n'êtes jamais totalement en contrôle, donc peut-être pas et de toute façon, je ne pense toujours pas qu'un véritable artiste de niveau new-yorkais puisse un jour produire cela.
Aucun argument pour dire que pour moi, c'était satisfaisant. Mon jeu de mots sur la tension entre deux des courants les plus forts de la société américaine, la religion et le matérialisme, n'avait pas de chemin vers l'expression visuelle et Gemini l'a livré.
Pour moi, il s’agissait d’un exercice et d’une indulgence mineure, mais il est facile d’imaginer des cas où cet outil apporterait une réelle valeur ajoutée à une rédaction. Il peut être utile de compléter un article par une illustration. L’IA peut produire des diagrammes et des infographies et en ce sens elle soulève peu de problèmes éthiques. Des outils de ce type existent déjà et l’IA permet d’obtenir plus facilement les mêmes résultats.
Nous explorons un nouveau paysage de l’IA pour déterminer les règles de ce qui est approprié et éthique et de ce qui ne l’est pas. Jouer avec le style new-yorkais distinctif a marqué une limite à noter. Lorsque vous voyez un dessin animé new-yorkais, vous avez l’impression d’être en contact avec un certain artiste. Ce que vous voyez découle de l’imagination et de l’artisanat d’un seul esprit.
Il est révélateur que la première tentative de Gemini incluait la signature de l’artiste. En règle générale, c’est un signe d’avertissement aussi utile qu’un autre : si vous envisagez de signer le travail qui en résulte, vous devriez probablement prendre du recul.




































