- FreeA
- Posts
- Tout savoir sur Midjourney en 12 minutes.
Tout savoir sur Midjourney en 12 minutes.
Et FreeA, c'est dans une semaine.
Hello !
Bienvenue aux 522 personnes qui ont rejoint FreeA depuis la dernière fois, on est maintenant 5235 !
Au programme du jour :
- FreeA, c'est dans une semaine
- Tout savoir sur Midjourney
- Les news IA du mois dernier
- Ma pépite de la semaine
- Le sujet de la semaine prochaine
Merci pour les 5000 abonnés, je n’aurais pas cru que c’était possible au moment de lancer cette newsletter. Mais vous l’avez fait.
Alors road to the 10k.
Si quelqu’un vous a partagé cette édition, n’hésitez pas à vous abonner pour ne pas manquer les prochaines ;)
Cet espace est désormais dédié aux partenaires. Si vous proposez un outil, un service ou quoi que ce soit en rapport avec l'IA et que vous voulez le faire connaître auprès de personnes intéressées, répondez à ce mail ou envoyez moi un message sur Linkedin pour qu'on en discute.
FreeA, c'est dans une semaine.
La semaine dernière, je vous ai dit que le serveur discord était prêt.
En réalité, il reste 2-3 choses à peaufiner, mais le nécessaire est là.
Les bêtas-testeurs y ont accès depuis ce matin, et à l'heure qu'il est je dois probablement être en vocal avec eux pour parler d'IA.
Dans une semaine, je vous dirai tout sur ce projet, le plus grand que j’ai lancé.Et vous aurez accès à la communauté avant tout le monde.
J'ai hâte.
Tout savoir sur Midjourney
Sommaire :
Midjourney, qu'est ce que c'est ?
Qui l'a créé, et quand ?
Comment fonctionne la technologie de génération d'images ?
Pourquoi c'est aussi ouf de créer des images ?
Comment s'en servir ?
C'est quoi tes meilleures astuces ?
Je suis un rat. Il y a des alternatives gratuites ?
Midjourney, qu'est ce que c'est ?
Midjourney, c'est une IA qui permet à n'importe qui de générer une image à partir d'un texte.
C'est une entreprise privée et le modèle n'est pas open-source et n'a pas d'API, mais ils sont depuis plusieurs mois les meilleurs sur la génération d'images.
Les images générées ont déjà remportées plusieurs concours d'Art, et sont d'une qualité déconcertante.
Par contre, ombre au tableau : pour entraîner ses modèles, Midjourney a utilisé des images non libres de droit, et est actuellement en procès sur cette question. En +, personne ne sait à qui appartiennent les images générées par Midjourney :
L'entreprise, l'utilisateur, ou les ayants droits des images d'entraînement ?
Bref.
C'est un pionnier de l'IA, et leader controversé sur la génération d'images, Midjourney est le sujet de cette newsletter.
Qui l'a créé, et quand ?
Il est passé de la NASA à créer une IA qui fait 10 millions de chiffre d'affaires par mois.
En 2011, David Holz quitte la NASA.
Après des années à étudier de la physique, il part dans un autre domaine : le business.
Il se consacre à fond sur un projet, Leap Motion.
C'est une technologie révolutionnaire pour la réalité virtuelle, et la société est valorisée à 300 millions en 2013.
En 2019, il le revend à seulement 30 millions.
Au lieu de baisser les bras, il crée en 2021 son nouveau joujou, un laboratoire de recherche indépendant sur les IA.
Son nom : Midjourney.
Son but : créer des images à partir d'un texte.
Au même moment sort Dall-E : une solution pour créer des images.
Derrière eux, OpenAI, la boite IA à la mode.
Personne ne croit alors en Midjourney et cette petite équipe de 10 personnes.
En juillet 2022, ils sortent une bêta publique.
En quelques semaines, ils gagnent le coeur de millions d'utilisateurs.
1 mois plus tard, une polémique éclate : une de leur image vient de gagner un concourt d'art.
Aujourd'hui, Midjourney en est à la V5.2.
Plusieurs millions d'utilisateurs s'en servent chaque mois.
Bref : à 10€ minimum l'abonnement, ils sont rentables 😂
Comment fonctionne la technologie de génération d'images ?
Midjourney imagine de nouvelles images.
Voici comment :
A chaque nouvelle demande, Midjourney repart de 0.
Elle génère une image composée uniquement de pixels aléatoire.
Ensuite, elle associe cette image à une description.
Celle que lui a donné l'utilisateur avec la commande /imagine.
Ex : Poisson siamois coloré avec une petite belle queue soyeuse isolée sur fond noir. Incroyable poisson tropical exotique, yeux perçants.
En partant de ces pixels aléatoires, elle va progressivement les modifier pour "décrypter" l'image dont on a donné la description.
Midjourney croit retrouver une image déjà existante, mais en hallucine une nouvelle à chaque fois.
"Dis comme ça, ça paraît simple. Pourquoi est-ce qu'on a mis autant de temps à le faire ?"
C'est extrêmement complexe.
Voici comme les ingénieurs de Midjourney ont fait pour atteindre ce résultat :
Ils sont partis de millions d'images.
Au départ, ils les ont légèrement crypté.
A 5% de cryptage, 5% des pixels ont été changé aléatoirement.
Midjourney s'est entraîné à retrouver l'image d'origine.
Puis les ingénieurs ont recommencé à 10%.
A 20%.
A 50%.
A 99%
Et puis, ils ont donné des pixels aléatoire et une description à Midjourney.
Et Midjourney a répondu une image.
Médiocre.
La valeur de Midjourney, c'est la qualité des images.
Pour améliorer le modèle, il y a du finetuning et énormément d'entraînement supplémentaire (couteux)
Récemment, le finetuning est partiellement fait par la communauté, qui vote pour ses images préférées en prévision des prochains modèles.
Mais c'est un travail titanesque qui a été fait par Midjourney.
Voilà comment fonctionne leur modèle.
Et voici le résultat avec le prompt du départ :
2 sources pour aller plus loin :
En anglais :
En français :
Pourquoi c'est aussi ouf de créer des images ?
La technologie de Midjourney peut créer 10 000 images en 30 secondes.
Voilà pourquoi ça va TOUT changer :
1. Midjourney réinvente la créativité
Midjourney crée des images à partir de mots-clés.
Pour $10 / mois, n'importe qui peut devenir un artiste.
Il lui suffit de savoir écrire.
------
2- Comment la machine surpasse l'humain ?
Pensez à un artiste de génie.
Il passe des dizaines d'années à perfectionner son art.
Pendant 20, 30, 40 ans, il ne fait que s'améliorer.
Ensuite, il crée des oeuvres géniales en quelques jours.
Midjourney, de son côté, suit la même méthode.
Entrainement, puis création.
Sauf que Midjourney est une IA, donc tout est plus rapide :
L'entrainement a duré des mois, et continue.
La création dure 30 secondes.
-------
3- La V5 de Midjourney est la première version capable de créer des images ultra réalistes
Midjourney prétend que la différence entre une image et une photo n'est plus toujours possible.
-------
4- La génération d'images va transformer toutes les industries
Imaginez une mode sur-mesure, des illustrations de livres uniques, des animations en réalité virtuelle éblouissantes ou encore des campagnes publicitaires hautement personnalisées.
Toute idée concernant les images devient possible grâce à cette technologie.
Sauf que ça ne fait que 2 ans que Midjourney a été créé.
2 ans.
Pour transformer toutes ces industries.
Imaginez en 5, 10, 20 ans ?
---------
5- Midjourney peut faire des choses impossibles :
- Créer des nouvelles oeuvres d'artistes morts
- Créer des deepfakes sans image de référence
- Découvrir de nouvelles méthodes de création artistique
---------
Et la suite :
- Les compétiteurs se développent à une vitesse folle. On en parle un peu après.
- Les modèles open-source de génération d'images s'améliorent de plus en plus, pour le meilleur comme pour le pire...
- Comment on s'en sert ?
Voici comment créer une image avec midjourney en 2 minutes :
1- Aller sur https://www.midjourney.com/home/
2- Se connecter avec son compte discord (ou en créer un)
3- Payer un abonnement à $8 / mois
4- Cliquer sur "join the bêta" pour rejoindre le serveur discord
5- Cliquer sur un salon "newbies"
6- Taper /imagine {description de votre image} et entrer.
7- Attendre
8- Choisir une image à agrandir parmi les 4
9- Une fois l'image agrandie, cliquer sur le bouton "web"
10- Télécharger l'image en cliquant sur "download"
Il y a quelques mois, j'ai même fait une vidéo pour montrer comment le faire pour ceux qui ont besoin :
https://www.linkedin.com/feed/update/urn:li:activity:7043494843397922818?updateEntityUrn=urn%3Ali%3Afs_feedUpdate%3A%28V2%2Curn%3Ali%3Aactivity%3A7043494843397922818%29
Mes meilleures astuces :
33 astuces pour maîtriser Midjourney :
- 🖥️ Ajustez les paramètres de votre compte par défaut avec /settings
- 🎞️ Modifiez vos ratios d'aspect avec --ar (9/16 par ex)
- 🌀 Réglez le paramètre de chaos avec --chaos
- 🖼️ Fusionnez plusieurs images ensemble avec /blend
- 📝 Essayez les commandes avec un seul mot comme "surréaliste"
- 🔵 Créez facilement des patterns
- 🎨 Ajustez le paramètre de stylisation avec --s
- 🌸 Utilisez le modèle Niji pour des images de style anime (dans les settings)
- 💬 Utilisez des commandes multi-invitations avec {variante 1, variante 2, etc}
- ❌ Supprimez des éléments avec des commandes négatives avec {élément}::-1
- 🕶️ Spécifiez les types de perspectives
- 💡 Spécifiez les conditions d'éclairage
- 🎨 Spécifiez la palette de couleurs
- 😊 Spécifiez l'humeur désirée
- 🖼️ Spécifiez la composition de l'image
- 📚 Utilisez des noms collectifs ("groupe de loups" plutôt que "loups")
- 🔢 Utilisez des nombres spécifiques ("3 loups" plutôt que "des loups")
- 📸 Mentionnez les paramètres de la caméra souhaités
- 📝 Supprimez les mots inutiles
- ❗ Notez que la ponctuation ne peut pas être interprétée
- 🆙 Sachez que la capitalisation n'a pas d'importance
- 👁️ Dirigez mieux l'attention de la commande
- 😄 Utilisez des emojis pour des commandes rapides (/imagine 🍌 plutôt que /imagine banane)
- 🎨 Combinez plusieurs prompts pour des images complexes (par exemple un prompt qui vous décrit et un prompt d'un paysage)
- 📈 Augmentez la résolution de vos images pour une meilleure qualité avec --q 2
- ❓ Utilisez la commande d'aide pour obtenir des conseils : /help
- 🎨 Laissez-vous inspirer par la galerie Midjourney (https://www.midjourney.com/app/feed/)
- ✍️ Générez des images pour vous inspirer dans l'écriture
- 🌅 Créez des fonds d'écran ou des arrière-plans (ou des images de posts Linkedin)
- 🎨 Utilisez des œuvres d'art célèbres dans vos commandes
- 🔄 Utilisez le bouton "🔄" pour régénérer des images avec le même prompt, le résultat sera différent
- ➡️ Utilisez les flèches pour agrandir votre image dans une direction souhaitée
- 💡 Utilisez les flèches et modifiez le prompt de "zoom out" pour modifier l'image. Par exemple, en ajoutant un autre personnage.
Je suis un rat. Il y a des alternatives gratuites ?
Oui. Beaucoup, même.
En réalité, il y a un vrai choix à faire :
1- Utiliser Stable Diffusion.
Les avantages : modèle open-source, de nombreux plugins, possibilités presque infinies (comme de l'entrainement, de la vidéo, etc)
Les inconvénients : lourd à faire tourner, donc souvent nécessaire d'utiliser un outil comme rundiffusion (payant), et moins bon que des modèles plus précis
2- Utiliser des modèles qui s'appuisent sur Stable Diffusion
Les avantages : gratuit, parfois plus de possibilités que Midjourney
Les inconvénients : moins bonne qualité que Midjourney, et parfois trop de pubs
A toi de faire ton choix.
Petite liste (non exhaustive) de mes modèles gratuits favoris :
leonardo.ai
Bluewillow
Bing AI creator
Lexica.art
Maintenant qu'on a vu :
- Ce qu'est Midjourney
- Qui l'a créé, et quand
- Comment fonctionne la technologie de génération d'images
- Pourquoi c'est ouf de créer des images
- Comment se servir de Midjourney
- Mes meilleures astuces pour le maîtriser
- Les alternatives gratuites
Tu es prêt à générer tes propres images, et à t'en servir dans tes créations ou contenus en ligne.
D'ailleurs, n'hésite pas à me mentionner si tu génères une image grâce à cet article, je serai ravi de voir le résultat !
Et partage la newsletter si tu connais un ami à qui ça peut servir de maîtriser Midjourney !
Les dernières news sur l'IA depuis 2 semaines 😅 :
- On a des infos sur GPT-5 : OpenAI a officiellement déposé la marque GPT-5 en y inscrivant des fonctionnalités comme la compréhension de l'audio. Mais pour l'instant, aucune info officielle, seulement des spéculations. Certaines rumeurs parlent de la fin de l'année 2023 pour GPT-5.
- ChatGPT a eu une mise à jour. Voici ce qui a été ajouté :
- Des exemples de prompts
- De nouveaux raccourcis claviers
- Des suggestions de réponse dans une conversation
- Le plus important : la possibilité d'upload plusieurs documents sur le code interpreter. De mon avis subjectif, le code interpreter est actuellement l'IA la plus utile qui existe pour 99% de la population. Mais peu de gens savent bien s'en servir. Il y aura forcément une newsletter sur le sujet.
- Ai.com redirigeait avant vers ChatGPT. Désomais, le site redirige vers Xai, l'IA de Musk.
- Stack Overflow, la plateforme d'échanges entre codeurs pour s'entraider, a annoncé la création d'une IA. Le but : résumer du code, résoudre des problèmes, aider à écrire du code, etc. Cette IA a été créé en réponse à Github Copilot, qui est extrêmement populaire chez les développeurs. Mais la valeur de Stack Overflow était l'entraide entre humains, à voir si cela ne va pas dénaturer la plateforme.
- Instagram travaille sur une certification pour les contenus générés avec de l'IA. A voir si elle sera vraiment utilisée...
- Meta a annoncé une IA open-source pour générer tout type de son/musiques, comme un sifflement avec du vent, du trafic, ou une musique d'ambiance, etc. On se rapproche de plus en plus de la possibilité de générer des vidéos/films intégralement avec de l'IA.
- Alibaba apporte un "concurrent" à Llama, avec leur propre modèle open-source : Qwen-Chat
- Google annonce une nouvelle fonctionnalité, une réponse automatique grâce à l'IA au moment d'une recherche (la fin du SEO ?)
- Nvidia annonce un nouveau modèle de génération d'images qui pèse uniquement 100 KB. Oui, c'est littéralement rien. Ils expérimentent une nouvelle méthode de génération permettant cette taille. Ils devraient bientôt partager le code au public.
- Inworld AI permet d'associer un modèle de langage à CHAQUE PNJ d'un jeu, et donc d'avoir une réelle immersion avec des conversations beaucoup plus complètes dans les jeux vidéos. Imaginez sur un triple A... L'entreprise est déjà valorisée à 500 millions.
- Des drones de combat sont capables d'agir seuls grâce à de l'IA. Oui, c'est effrayant.
- La majorité des grandes entreprises du monde de l'IA ont promis ensemble d'agir pour la sécurité dans le monde de l'IA, avec plusieurs mesures (théoriques) fortes. A voir si ce n'est que du marketing.
- Runway permet désormais de créer des vidéos à partir d'images. Vous sentez venir les cinématiques faites avec de l'IA ?
- Kaiber s'est aussi mis aux cinématiques. Alors qu'ils étaient avant concentrés sur les vidéos faites par des successions d'images différentes (et reconnaissables), ils tentent maintenant de créer des vidéos plus... naturelles, et ça fonctionne vraiment bien ! Peut-être un sujet de newsletter à venir sur les vidéos IA.
- L'app ChatGPT est désormais disponible sur Android.
- Le worldcoin a été lancé par Sam Altman, le fondateur d'OpenAI, avec pour ambition de créer une ID unique pour chaque humain qui permet de se différencier d'un robot ou d'une IA.
La pépite de la semaine
Tu as pris une photo devant la tour Eiffel. Il y a 300 touristes chinois dessus.
Cet outil te permet d'enlever tous les touristes en 30 secondes :
Stillgram est une application disponible sur l'App store.
3 étapes pour s'en servir :
1- Va sur l'application
2- Sélectionne la personne à garder dans l'image (toi)
3- Prend un selfie
4- C'est tout. Oui, ça a pris seulement quelques secondes.
Pour la semaine prochaine :
Comment automatiser sa vie avec l'IA.
L'IA fait rentrer l'automatisation dans une nouvelle ère.
Mais on va repartir de la base pour les débutants de l'automatisation :)
Pour dans deux semaines :
Sujet imposé. Deep Dive dans Notion AI.Pour dans trois semaines :
1- Explication du problème d’alignement de l’IA, où la raison la plus probable pour que l’IA nous extermine.
2- Comparatif entre ChatGPT, Bard, Claude, et les avantages que possèdent chacun des modèles.
3- Que sont les AI Automatisation Agency (AAA), la nouvelle version à la mode du SMMA pour gagner de l’argent ? Comment elles fonctionnent, quels sont réellement leur intérêt et comment en créer une en tant que débutant ?
4- Pourquoi est-ce que Nvidia est la prochaine compagnie à rejoindre les GAFAM grâce à l'IA ? Analyse complète de ce qu'ils font et de pourquoi ils sont devenus aussi importants (+ 1 000 milliards de valo)
5- DeepDive dans les outils de génération de musique. Quelle révolution silencieuse se produit, et quels sont les principaux acteurs ? (On va aussi parler de la nouvelle IA open-source de Meta, mais peut-être qu'un tuto sur l'installation sera nécessaire)
6- La nouvelle fonctionnalité de ChatGPT, les "customs instructions", qui résout 80% des problèmes de ChatGPT + maîtriser code interpretor, l'autre fonctionnalité récente de ChatGPT qui met en émoi toutes les personnes qui s'en sont servies (Actuellement l'IA la plus utile selon moi)
7- J'ai créé un album de musique en 1 semaine avec l'IA.
8- J'ai créé un livre en 1 semaine avec l'IA
9- Comment surentraîner un modèle de langage, même en étant débutant.
10- J’ai créé un deepfake parfait de mes amis créateurs de contenus. Je leur ai fait dire des folies.
(Je ne peux mettre que 5 choix dans un sondage, donc je choisirai un des deux sujets les plus votés)
Deuxième sondage : Il y a beaucoup de sujets à traiter.
Est-ce que vous préférez 2 éditions plus courtes par semaine pour traiter plus de sujets, ou rester au format d'un sujet très complet chaque semaine ?
Si cette édition t'as plu, et que tu connais quelqu'un à qui elle peut servir, tu peux la partager juste ici :
Et si ce n'est pas encore fait, tu peux t'abonner :
Reply