type
summary
status
category
tags
标签
slug
date
password
icon
分类
文章内容状态
Midjournal入门学习
- 了解基本的Midjournal出图方法
- 文生图
- /settings 命令
- Midi 和 Niji 不同的模型和版本
- /describ 命令反推提示词
- 图生图 -- iw 0 - 2、--cref URL和 --cw 0-100
一 、什么是Midjourney?
Midjourney是一款基于人工智能的图像生成工具,通过文本描述生成独特的、富有创意的图像。
- Midjourney 官方网站 :https://www.midjourney.com/
- Discord 是一款流行的基于云的即时通信应用程序,它主要用于游戏玩家和各种社区组织之间的交流和协作。在Discord中,将Midjourney 添加为图像生成 AI 助手机器人,通过对话的方式发送文本及指令来生成图像。→ https://discord.com/
- niji・journey Bot ,由于搜索原因,可能找不到niji机器人,通过发送此链接到聊天窗口,点击可以一键添加 → https://discord.com/api/oauth2/authorize?client_id=1022952195194359889&permissions=274877945856&scope=bot

Midjourney的使用界面如下图

二、Midjourney 起手式 - 文生图
如果实在不知道画什么,这里有几个用于练习的起手提示词(画不同风格好看的人物图像)
在Discord 输入 /image命令 + 提示词,回车发送给添加了Midjourney 机器人的服务器,就可以生成图像。
需要注意:所有的交互必须使用英文,可以使用翻译软件弥补英文水平 → https://translate.google.com/


U1
U2
U3
U4
:MJ会根据提示词一次生成4张备选图,U按钮会将图像从图像网格中分离出来,选择后会将图片放大(V5以后不改变分辨率和细节,只是放大显示,并显示更多设置选项)
V1
V2
V3
V4
:变化按钮,创建所选图像的增量变化。创建变体会生成与所选图像的整体风格和构图相似的一组新图像。
- 🔁:重做Redo,重新运行原始提示词,生成新的一组图像。这就是很多MJ相关问题说的抽卡、刷图。
- 在当前版本V6.1中,默认出图为1:1比例,分辨率1024x1204
点击U4,V4,分别看下U命令和V命令的设置项
点击U4

点击V4

- Upscale (Subtle): 对图像进行放大(默认放大2倍),同时保持细节和风格。
- Upscale (Creative): 对图像进行具创意的放大(默认放大2倍),引入新的细节和变化。
- Vary (Subtle): 制作图像的略微不同版本,保持整体风格不变。
保持整体图片不变,做轻微的变化随机出图

- Vary (Strong): 制作图像的明显不同版本,引入较大变化。
- Vary (Region): 选择图像中的特定区域进行变化 - 局部重绘。
让人物微笑


- Zoom Out 2x: 将图像缩小至原始大小的两倍,增加周围的背景 - 相当于基于当前的图片扩展画面的内容,让AI生成图片外的内容。
- Zoom Out 1.5x: 将图像缩小至原始大小的1.5倍,增加周围的背景 - 相当于基于当前的图片扩展画面的内容,让AI生成图片外的内容。
- Custom Zoom: 自定义缩小比例和调整图像视图 - 通过提示词控制图片外扩展画面的内容。
- 箭头按钮: 按箭头方向生成该方向上图片外的内容。
向下扩图


- Web: 在 midjourney.com 的图库中打开图片
- 心形按钮: 点赞该图像,以便在 Midjourney 网站上轻松找到它们
如何写提示词
- 取决于生图的目的,这个需要多测试,并没有具体的规范
- 如果是为了获得一些和主题相关的图片,就一句话告诉AI想要什么样的图片即可,例如:A cool cyberpunk girl
- 如果想按自己的思路创作一幅图片,需要描述画面的内容,一幅图片的构成包括:风格+主体+场景 + 构图 + 灯光 + 附加信息
风格艺术风格:印象派、现实主义、抽象、超现实主义时代风格:未来、复古、现代、中世纪场景自然:森林、海滩、山脉、湖泊城市:街道、摩天大楼、市场、公园室内:客厅、厨房、办公室、图书馆灯光类型:自然光、人造光、烛光效果:柔和、强烈、阴影、光晕主体人物:女性、男性、儿童、老年人动物:猫、狗、鸟、狮子物体:汽车、建筑、书籍、花卉构图视角:俯视、平视、仰视布局:对称、非对称、中心、偏移附加信息细节:质地、图案情感:宁静、活泼、神秘、忧郁色彩:明亮、阴暗、单色、多彩
- 根据不同的出图需求灵活搭配这些信息即可形成提示词,一般包括:主体类型+主体细节描写+风格描写+参数控制即可
- 需要注意(2024年8月25日)
- V6以后的语义理解提高了很多,描述时候尽量使用专业的清晰的短句,无需刻意拆分成词组
- V6以后 不要加类似SD中的一些夸张的提示词 :获奖、逼真、4K、8K、卓越等
三、Midjourney 出图方式设置:/settings 命令
发送 /settings 命令 可以对Midjourney 和 niji.Journey出图方式进行设置

设置界面

配置说明
- 模型选择框:可以进行默认模型的选择
- RAW Mode: 生成未经风格化处理的图像,更忠于输入。
- Stylize low/med/high/very high: 控制图像风格化程度,从低到非常高 对应参数 -- s。
- Personalization: 个性化设置,可能根据用户偏好调整生成内容。
- Public mode: 生成的图像公开可见(默认情况下MJ出的图会自动共享到 社区,只有Pro Plan和Mega Plan可以切换到非公开模式出图)。
- Remix mode: 允许对图像进行重新组合和创意变更,打开如果重新抽卡时候可以更换提示词和参数,Remix 将采用起始图像的总体构图并将其新图像的一部分。重新混合可以帮助改变图像的设置或照明、主题或实现棘手的构图。
- High Variation Mode: 生成图像时增加变体的多样性,使用“变化”按钮将生成一个新图像,该图像可能会更改图像内的构图、元素数量、颜色和细节类型。
- Low Variation Mode: 保留原始图像主要构图但对其细节进行微妙变化的变体。此模式有助于细化或对图像进行细微调整。
- Turbo mode: 涡轮模式,使用高速实验性 GPU 池,在 Turbo 模式下运行的作业生成速度最高可提高四倍,但消耗的订阅 GPU 分钟数却是典型快速模式作业的两倍。(需要氪金 4$ / 小时)
- Fast mode: 标准速度生成图像。(快速时间需要充值,默30$账号有15小时,氪金 4$ / 小时,这里时间指的是出图过程消耗的时间)
- Relax mode: 以更慢的速度生成图像。
- Reset Settings: 恢复所有设置为默认值。
四、Midjournal机器人:了解Midj模式 和 Niji模式
4.1 、MidJ版本时间线
Midjourney 团队不断推出新的模型版本,以提高连贯性、效率、质量和风格。
可以使用 --version 或 --v 参数切换模型版本,也可以使用 /settings 命令并选择您模型版本。不同的模型擅长生成不同类型的图像。
--version
接受值 1、2、3、4、5、5.0、5.1、5.2、6 和 6.1。--version
可以缩写为--v
--v 6.1
是最新的和当前的默认模型。(2024年8月22日)
版本 | 发布时间 | 描述 |
V6.1 | 2024 年 7 月 30 | 能生成更连贯的图像,细节和纹理更精确,生成图像的速度比 v6 快约 25% |
V6 | 2023年12月21日 | 提高了较长输入的提示准确性、提高了连贯性和知识性,并具有更好的图像提示和混图功能 |
V5.2 | 2023 年 6 月 23 日 | 将美学推向更高境界,角色设计更加连贯,面部细节也更加出色 |
V5.1 | 2023 年 5 月 3 日 | 进一步提升了美学水平 |
V5 | 2023年3月15日 | 强化细节表现,支持更高分辨率和更复杂的场景 |
V4 | 2022 年 11 月 5 日 | 引入新算法,提高生成速度和图像一致性 |
V3 | 2022 年 7 月 25 日 | 改进理解能力,更好地处理复杂提示词和多样化风格 |
V2 | 2022 年 4 月 12 日 | 提升图像质量,引入更多风格选项和细节处理 |
V1 | 2022 年 2 月 | 初始版本,提供基本的AI图像生成功能 |
过去的公司VS现在的公司
Midjourney,年收入上亿美元,整个公司截止到2023年4月,年营收破1亿美金时候,全职团队却只有11个人,但是更震撼的是其中8个研发人员中的一半都是尚未毕业的本科生。


推荐阅读:Midjourney Statistics 2024 – Users, Revenue & Adoption:
4.2 、比较不同版本的Midj模型使用相同的prompt和seed 生成的图像
测试不同版本画人物肖像的表现: 《三体》中的“梦” 在刘慈欣的《三体》三部曲中,庄颜是罗辑的梦中情人,后来成为了他的现实妻子,庄颜的形象是通过罗辑的幻想和记忆中逐渐浮现的,描绘出了一个理想化的女性形象,尝试用Midjourney画出这个理想中的女孩
庄颜这个角色在《三体》三部曲的第二部《三体II:黑暗森林》中出现。关于她的描写主要集中在罗辑的故事线中,特别是在罗辑与她相遇和交往的部分。
- 第18章:罗辑的梦
这一章详细描述了罗辑在冬眠前的梦境,梦中的理想女性形象开始出现,这就是庄颜的雏形。她是罗辑潜意识中理想化的爱人形象。
- 第19章:天幕下的梦
在这一章中,罗辑醒来后在现实中遇见了庄颜。她的形象从梦境走向现实,这一段描写了他们相遇的场景和罗辑对她的感受。
- 第23章:约会
这一章详细描写了罗辑和庄颜的约会场景,他们的关系逐渐发展,庄颜的性格和形象也通过他们的互动得到了进一步描绘。
人物描绘
- 初次见面时的印象:"她的面庞白皙而清秀,似乎带着某种柔和的光辉,眼睛很大,闪烁着晶莹的光彩,给人一种纯净和安详的感觉。"
- 头发和眼神:"她的黑发如同绸缎般柔顺地披散在肩头,双眼清澈而明亮,透出一丝淡淡的忧郁。"
- 整体的外貌描写:"她那种古典而宁静的美,让人想起那些远古时代的画中人。她仿佛从梦境中走出,带着一种不食人间烟火的气质。"
- "A beautiful young woman with a classical and serene appearance" 描述庄颜的整体形象。
- "soft glowing fair skin" 强调她白皙而温和的肤色。
- "large clear eyes with a hint of melancholy" 突出了她清澈的眼睛以及眼中的一丝忧郁。
- "long silky black hair cascading over her shoulders" 描绘了她的长发。
- "wearing a simple and elegant white dress" 表现她的衣着风格,符合她纯净而优雅的气质。
- "standing in a tranquil and ethereal setting with soft, diffused lighting" 设置了一个宁静而超凡的环境,符合《三体》中的描述。
- "The background features a subtle blend of dreamlike elements, with misty landscapes and distant mountains" 描绘出庄颜从梦境中走出的感觉
- "--v 5 --ar 16:9 --q 2 " 设置了生成图像的版本、比例、质量和风格,确保图像的视觉效果。
- 可以在V5.1后的版本选择性添加 --style raw 降低 MJ对图片添加的默认美学,增加写实感
- "--no harsh shadows, no modern elements" 排除了不符合庄颜形象的现代元素和强烈阴影,以保持整体的柔和感。
提示词说明
外貌:
发型和服装:
环境和气氛:
风格和设置:
尝试用不同版本Midjourney模型的生成这个“梦中初恋”的形象
⚠️ 注意:前几个版本可能会毁了这份理想中的纯洁和美丽 💔,变成“罗辑的梦魇”,提前做好心理建设…………如果心理素质较差,请直接跳转到 V5 以后查看。
采用一样的seed值 --seed 3526218580,都不添加style参数使用默认风格
V1


V2


V3


V4


V5


V5.1


V5.2


V6


V6.1




可能新的玩家在体验Midjourney的时候(默认V6.1)认为他本该如此,无法体验到AI技术的冲击感。通过不同版本的对比,能直观感受到AI发展令人恐怖的速度,仅仅2年零5个月的的时间,就能从支离破碎的画面发展成如此惊艳的图像生成效果。(由于对比相对单一,这种惊艳在这次对比中并未完全体现出来,还需自行探索)
超现实主义拼贴绘画风格对比
艺术史:超现实主义拼贴风格的画作
艺术教育:
TPT 是世界上最大的学前班至 12 年级资源市场:
Art Lesson: Mechanimals - A Collage Project 艺术课:机械动物 - 拼贴项目:https://www.teacherspayteachers.com/Product/Art-Lesson-Mechanimals-A-Collage-Project-6588283?st=552ba82630ba72c68af154adcd97f21e
V1


V2


V3


V4


V5


V5.1


V5.2


V6


V6.1


在展现一些艺术风格的时候:版本越老的模型,在抽象画方面有这更突出的表现。而新版本对人像和摄影的细节处理更加优秀。所以并不是老版本的模型在新版本出现之后就会失去使用的意义。
4.3 、Niji 版本 时间线
Niji 模型是 Midjourney 和 Spellbrush 合作推出的, 在 动漫,插画类的图像生成中 有着优异的表现力。它更加擅长使用动态和动作镜头,以及以人物为中心进行构图。
可以使用 “--niji + 版本号” 切换Niji模型版本,也可以使用 /settings 命令并选择模型版本。不同的模型擅长生成不同类型的图像。
--niji
接受值 4 、5 、 6
对比最新版本的Midi(V6.1) 和 Niji(V6)
Midj


Niji



Niji V6的配置和 Midi V6.1一致:
配置说明
- 模型选择框:可以进行默认模型的选择
- RAW Mode: 生成未经风格化处理的图像,更忠于输入。
- Stylize low/med/high/very high: 控制图像风格化程度,从低到非常高 对应参数 -- s。
- Personalization: 个性化设置,可能根据用户偏好调整生成内容。
- Public mode: 生成的图像公开可见(默认情况下MJ出的图会自动共享到 社区,只有Pro Plan和Mega Plan可以切换到非公开模式出图)。
- Remix mode: 允许对图像进行重新组合和创意变更,打开如果重新抽卡时候可以更换提示词和参数,Remix 将采用起始图像的总体构图并将其新图像的一部分。重新混合可以帮助改变图像的设置或照明、主题或实现棘手的构图。
- High Variation Mode: 生成图像时增加变体的多样性,使用“变化”按钮将生成一个新图像,该图像可能会更改图像内的构图、元素数量、颜色和细节类型。
- Low Variation Mode: 保留原始图像主要构图但对其细节进行微妙变化的变体。此模式有助于细化或对图像进行细微调整。
- Turbo mode: 涡轮模式,使用高速实验性 GPU 池,在 Turbo 模式下运行的作业生成速度最高可提高四倍,但消耗的订阅 GPU 分钟数却是典型快速模式作业的两倍。(需要氪金 4$ / 小时)
- Fast mode: 标准速度生成图像。(快速时间需要充值,默30$账号有15小时,氪金 4$ / 小时,这里时间指的是出图过程消耗的时间)
- Relax mode: 以更慢的速度生成图像。
- Reset Settings: 恢复所有设置为默认值。

Niji V5的配置多了5个风格化参数选项 通过 --style 设置或者使用命令/settings设置
对比Niji V5不同的风格
--style Dafault Style
默认模式,在这个模式下生成出来的图片要很强的二次元风格体,在光影的处理上也比较生动,一些细节的处理也是不错的。


--style expressive
表现风格,具有更精致的插画感,在这个模式下生成出来的图片更偏向成熟的欧美风,整体色相饱和度更高,在光感、质感、色感、体积感上视觉效果更佳。


--style cute
可爱的风格,创造出迷人可爱的角色、道具和场景,在这个模式下生成出来的图片偏向日系,卡哇伊治愈风,细节更加丰富精美,二次元画风更加浓郁。


--style scenic
场景风格,在奇幻的周围环境中创造出美丽的背景和电影人物时刻。在环境和背景的表象上更具优势。


--style original
原始风格,使用原始的 Niji 模型版本 5,在这个模式下生成出来的图片集合前面几种风格效果,保留特点,做了优化,与默认模式风格基本一致。


五、图生图
可以将图像用作提示的一部分来影响构图、风格和颜色,图像提示可以单独使用,也可以与文本提示一起使用,可以将不同风格的图像混合或者多个相同风格的图像混合。

使用图片URL说明
- 提示必须有多个图像提示或一个图像提示和一个文本提示才能起作用。
- 图像 URL 必须是指向在线图像的直接链接。
- 文件应以 .png、.gif、.webp、.jpg 或 .jpeg 结尾。
- 在大多数浏览器中,右键单击或长按图像并选择复制图像地址即可获取 URL。
/blend
命令是对移动用户优化的简化的图像提示流程。步骤
- 上传图片至 Discord:按照这些说明将您的图像上传到 Discord
- 复制图片的 URL
- Discord 桌面应用程序:右键单击图像并选择复制链接(而不是“复制消息链接”)。
- Discord Web App:单击展开图像,然后右键单击并选择“复制图像地址”。
- Discord 移动应用程序:点击并按住图像,然后选择“复制媒体链接”。
- 输入提示词发送给MJ机器人生成图像
注意 将图像裁剪为与最终图像相同的纵横比以获得最佳效果。
操作演示

5.1、/describ 命令 上传图像并根据该图像生成提示词
/describe 命令可以上传图像并根据该图像生成四个可能的提示
- 描述功能会生成具有启发性和提示性的提示建议。它不能用于完全重现已上传的图像。
- 再次“描述”同一幅图像将会提供不同的建议。
- 返回上传图像的长宽比。(1:1默认不显示)
试想一下,我们看到了一副很喜欢的图片,就比如“黑神话悟空中的蜘蛛四妹”,想做出来这种风格,但是这种图片的关键词我们如何知道?自己想的话可能也没有好的思路。这个时候就需要用到describe这个指令来反推关键词。


反推关键词
怪不得官方介绍/describ时候说无法重现已上传的图像,可以说是毫不相关,不过确实符合美学,好看是真好看




5.2 --iw (0-3) 命令
注意:
- Miji V6 V6.1 Niji V6 iw范围为0-3 值越大相似度越高
- V5为 0-2 V4 不能使用iw参数
- 使用 --cref 参数 --cw 范围为 0-100 值越大相似度越高
如果不写默认是1,iw 小于1的时候会更接近提示词内容,=1 两者差不多,大于1的时候接近图片内容
通过自己的描述对提示词进行优化,垫原图生成图像,使用 --iw 命令提高图片的权重 ,让生成的图片更贴合原图,目前MidJournal 对于还原原图场景表现并不是很好


5.3 、使用命令 --cref 和 --cw 引用图像,让生成的图像脸部更加贴近原图 →


📎 参考文章及资料
- Midjourney Documentation → https://docs.midjourney.com/
- Midjourney Documentation model-version-5 → https://docs.midjourney.com/docs/model-version-5
- Discord使用帮助,如何上传图像 → https://support.discord.com/hc/en-us/articles/211866427-How-do-I-upload-images-and-GIFs
有关Midjourney使用上的问题,欢迎您在底部评论区留言或者与我联系,一起交流~
- 作者:Schafer
- 链接:https://www.meindigilife.com//article/MidJourney-BasicCourse-1
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。