type
summary
status
category
tags
标签
slug
date
password
icon
分类
文章内容状态
Midjournal学习(2) - MJ控图:图像的精细化处理
- Variations 刷图技巧
- Upscale 放大图像细节(分辨率)
- Zoom Out 图像外绘
- Pan 平移外绘
- Vary Region 局部重绘
- Remix 模式及应用
- stylize风格化参数
- 作品风格(艺术家、公司、艺术风格等)
官网学习网址:
Variations :https://docs.midjourney.com/docs/variations
Upscale :https://docs.midjourney.com/docs/upscalers
Zoom Out :https://docs.midjourney.com/docs/zoom-out-1
一、Variations /verɪˈeʃən/ - 变化 命令
用于测试的提示词



Variations 命令的功能是生成图像的不同版本,也就是图像选择面板中的 V 按钮
- 这些
V
按钮与每个生成的网格中的图像从左到右、从上到下相对应
- 在/settings 设置界面中,可以看到有2个选项:
🎨 High Variation Mode 🎨 Low Variation Mode
,设置后,V按钮使用默认设置
🪄 Vary (Strong)
按钮对应于🎨 High Variation Mode
,而🪄 Vary (Subtle)
对应于🎨 Low Variation Mode
。
High Variation Mode
:将生成与原始图像在构图、元素数量、颜色和细节类型方面不同的新图像Low Variation Mode
:生成保留原始构图和颜色的新图像,但图像细节会略有变化High Variation Mode

Low Variation Mode

High Variation Mode 使用场景 (一般用于多样性需求)
- 探索创意:想要尝试不同风格、构图、颜色或想法时,这个模式可以生成许多风格迥异的图像,从中选择最喜欢的效果。
- 初期构思阶段:在开始一个新的项目或不确定具体视觉效果时,可以使用高变体模式来获得更多的灵感。
Low Variation Mode 使用场景 (一般用于一致性需求)
- 确定设计:当已经对所需的风格、构图和颜色有明确想法时,Low Variation Mode 可以专注于某种具体的视觉效果生成图片。
- 精细化调整:在已经生成了一个接近理想效果的图像后,想要进行微调而不偏离原有设计风格时,使用低变体模式可以确保调整在一个小范围内进行。
二、Upscale 放大图像细节(分辨率)
示例提示词
当前版本的模型(Miji V6.1 ,Niji V6)默认出图比例为1:1,生成 1024 x 1024 像素图像网格,可以修改比例 -- 16:9 生成其它比例,但是整体清晰度不是很高,一般整体画面的像素在 100 - 120W 左右(1024x1024 = 1,048,576 )
1 : 1,1024 x 1024

16 : 9,1456 x 816

对比一下提示词的对于图片的影响,编写一个“详细”的提示词与“一句话”提示词进行对比
1:1

16:9

是否需要详细且专业的设计提示词?
1、可以看出最新版本即使提示词非常简单,也可以生成极具美感的图片。(至少从画面好看的程度,应该是平分秋色,反而因为没有提示词约束,提示词越简单,画面越好看)。
2、随着新版本对于语义理解的加强,提示词对于画面的精细化设计非常有帮助,比如熊猫一般都是在竹林里面,配合摄影风格提示词,背景虚化效果也做的比较好,光影效果也表现更好。
3、综合考虑,可以根据不同的场景自由选择提示词的复杂度与详细程度,如果是为了找灵感,可以给AI留出更多的发挥空间,如果是为了按自己的想法设计图像,则尽可能的详细且精炼的描述画面内容。
单击
Upscale (Subtle)
或Upscale (Creative)
按钮放大图像,放大器将把图像像素翻倍:1:1图像1024x1024会放大到2048x2048,16 : 9图像1456 x 816会放大到2912*1632
Upscale (Subtle)
可使图像分辨率翻倍,专注于提高图像的清晰度和分辨率,而不会对图像的原始元素和构图进行显著改变。
Upscale (Creative)
可使图像分辨率翻倍,并且提升图像细节,在提高分辨率的同时,为图像添加新的细节和风格元素,可能会改变图像的某些部分或整体感觉。
对比不同分辨率放大方式生成的效果
原始图

Upscale (Subtle)

Upscale (Creative)

放大

放大

放大




2种Upscale放大均显著提高的图像的清晰度,Subtle /ˈsʌt(ə)l/(细微差别)方式与原图表现的高度一致,但是因为分辨率提高,吉他的位置,弦和空中鸟的位置有穿帮,与低分辨率情况下效果一样,是糊的。Creative /kriˈeɪtɪv/(创造性)放大与原图风格发声轻微变化,更偏油画感,单弦和鸟的位置均进行了修正,为画面增加了更多的细节。实际放大根据画风和图片的不同,Stuble和Creative表现也不同,因而可以2种放大都尝试一下,选择自己需要的图片。
三、Zoom Out (缩小) 图像外绘
Zoon Out的翻译是:调整镜头使图像变小和远离,(指人)调整相机的镜头或(指相机)调整镜头,使图像看起来更小和更远。放大范围,显示更广阔的视野:(指相机)调整镜头,显示更广阔的视野。
Zoom Out
不会增加图像的分辨率使用Zoom Out命令将扩展画面外的图像内容,将图像扩展到原始边界之外,而不会更改原始图像的内容,新扩展的内容使用原始提示词(Zoom Out )或者新提示词(Custom Zoom )进行填充
3.1 可以用这个功能制作无限放大的
测试提示词,宇宙中的女神
参数中使用了 28mm f/4.0 这个提示词,做补充说明,如果是那种背景虚化效果,扩图后也是虚化的,这里主要是希望能生成一些边缘和主体都清晰的图片,使用28mm f/4.0镜头拍摄的画面比较符合上述需求
- 视角和构图
- 广角视角:28mm是一个广角镜头,视角较宽,能够捕捉更多的场景。适合拍摄风景、建筑、室内场景以及街头摄影等需要更大取景范围的题材。
- 透视感增强:广角镜头会产生较强的透视感,近处的物体看起来会更大,而远处的物体会显得更小,给画面带来深度和空间感。
- 景深效果
- 较大的景深:f/4.0的光圈在广角镜头上通常会提供一个较大的景深。这意味着在拍摄时,即使被拍摄的物体处于不同距离,背景和前景都可能较为清晰。对于风景摄影或街拍,这种效果有助于清晰地展示整个场景。
- 光圈限制:f/4.0的最大光圈相对较小,在低光条件下的表现会受到限制。需要更长的曝光时间或更高的ISO设置来补偿较少的光线,可能会引入噪点或运动模糊。
- 光学特性
- 较少的背景虚化:由于广角和较小的光圈,28mm f/4.0镜头通常不容易获得明显的背景虚化效果(散景)。拍摄主体和背景之间的分离不如长焦或大光圈镜头明显,除非物体非常接近镜头。
- 失真现象:28mm镜头可能会产生一些桶形失真,特别是在画面的边缘部分。这种失真会使直线看起来有点弯曲,尤其是在拍摄建筑物或有直线条的场景时更为明显。
- 用途和场景
- 适合拍摄风景和建筑:广角镜头的视野宽阔,能够在一个画面中包含更多的景物,非常适合拍摄风景、建筑或大场景。
- 室内拍摄的优势:在狭小的室内空间,28mm镜头可以更好地利用有限的空间拍摄更多的内容,非常适合室内摄影、房产摄影等。
- 街头摄影和纪实摄影:广角镜头可以在街拍中捕捉更多的环境和背景,提供更丰富的故事背景,f/4.0的光圈也足以应对大多数白天的光线条件。
正常出图

使用参数 --chaos 40 --weird 600

后续制作无限放大的视频,为了让整个风格看起来更具有冲击感使用参数 --chaos 40 --weird 600
功能测试采用正常出图的素材:

注意Zoom Out
仅影响画面的内容,不会增加图像的分辨率
原始图像:分辨率1456*816

Zoom Out 1.5x:拉远镜头,缩小画面内容,150% 分辨率1456*816

Zoom Out 2x:拉远镜头,缩小画面内容,200% 分辨率1456*816

可以在Zoom Out后的图像中选中图片继续执行Zoom类的命令,这也是无限视频制作的方式,不断的进行Zoom Out,即可形成无限放大的感觉 后续的图片在 Zoom Out 1.5x 生成的图像基础上进行扩图
3.2 Custom Zoom 自定义缩放,更改提示词控制放大画面内容
Custom Zoom
按钮可设置的程度,点击后会弹出一个对话框,可以在其中输入自定义值--zoom
接受 1-2 之间的值,如--zoom 2
。同时,可以修改提示词内容,控制图像的生成。可以使用命令 --ar修改图片比例。
修改提示词
a giant blue planet, Earth, in the upper right of the screen., --stylize 450 --v 6.1 --ar 16:9 --zoom 2
注意(这个问题让我无效刷了2个小时图)
- 如果新修改的提示词对画面的风格或者内容改变比较大,要让变化模式处于高变化模式 High Variation Mode状态。如果启用了低变化模式 Low Variation Mode,很难使用提示词更改图像的主题或构图,该模式用于更改细节。
- 为了避免放大后画面出现文字或者logo,可以采用命令 --no text,logo 规避


技巧:因为扩图的尺寸最大只有200%,有一些提示词可能无法在扩图中体现出来,或者体现的不明显,可以分步生成,选择一个与期望图最贴近的进行二次扩图。
There's a huge 1/4 of a blue planet in the upper right of the screen, --stylize 450 --v 6.1 --ar 16:9 --zoom 2 --no text,logo

a blue planet in the upper right of the screen, --stylize 450 --v 6.1 --ar 16:9 --zoom 2 --no text,logo

Make Square
可以调整非正方形图片的宽高比,使其变成正方形。如果原始宽高比为宽(横向),则会垂直扩展。如果原始宽高比为高(纵向),则会水平扩展,↔️ Make Square↔️ Make Square
,分辨率一般会调整为1024x1024

四、Pan 平移外绘
平移选项会沿所选方向扩展图像的画布,而不会更改原始图像的内容,新扩展的画布将使用提示和原始图像的指导进行填充,使用最靠近图像侧面的 512 个像素以及提示(Remix mode打开后可以重新修改提示词)来确定新的部分。

不断的进行左右扩图,可以形成一幅长图
原始图像

多次平移后

使用Remix模式,增加描述,为画面添加一个纳美族女性角色
多次向左平移后

五、Vary Region 局部重绘
Vary Region 的意思是“局部变化”,使用“区域”编辑器选择需要修改的区域,MJ重新生成图像的选定定区域部分。
局部重绘可以搭配的参数
提示词
使用MJ做人像摄影写真图片的相机参数说明
对于人像摄影相机的描述(长焦+大光圈 突出主体、背景虚化效果)
相机参数 + 人物描述 + MJ参数
相机参数:
- 佳能 EOS R6 和 85mm f/1.4 镜头:A stunning portrait photograph taken with a Canon EOS R6 and 85mm f/1.4 lens
- 尼康 Z6 II 和 50mm f/1.8 镜头: A stunning portrait photograph taken with a Nikon Z6 II and 50mm f/1.8 lens、
- 索尼 A7 III 和 70-200mm f/2.8 镜头(最好固定焦距):A dynamic outdoor portrait shot using a Sony A7 III with a 70-200mm f/2.8 lens
以下是一些示例
操作步骤


- 点击
🖌️ Vary (Region)
按钮,打开编辑界面。
- 选择编辑器左下角的自由选择工具或矩形选择工具,右图-1 位置
- 绘制想要重新生成的图像区域,可以多次用自由选择工具或矩形选择工具进行绘制,右图-2 区域
- 可以通过左上角撤回上一次绘制区域进行调整,右图-3 区域
- 可以通过提示词修改重绘区域的内容,也可以不写提示词,让MJ自由发挥创意,右图-4位置
框选区域的大小会直接影响图像生成的结果,宽松的选取区域会给 midjourney 提供更多的参考信息,以及更多空间来生成新的创意和细节; 精准的选取范围则会带来更小更细微的变化,但也可能会导致生成的内容与周围不太契合;
改变图片中人物的帽子,使用提示词 With a purple hat
选择小的区域进行重绘


由于本身背景做了虚化效果,反而这种人物一致性保持的非常好,而且也和背景画面融合的很契合
选择大的区域进行重绘


后面的背景和人物的眼神、眉毛均发生了变化
因而在选择重绘区域的时候,还需要根据图片(重绘部分与背景融合程度)、重绘的目的(更多的创意还是保持一致性)等方面综合考虑,选择合适的方式。
修改首饰和衣服
With a diamond necklace,wear a pink dress

修改背景元素
Five colorful butterflies


真强,这种颜色和首饰搭配都能画出美感

增加蝴蝶元素后,也并不违和
六、Remix 模式
打开Remix模式,在执行这些命令时候可以输入提示词更改图像的设置或灯光、演变主题或实现复杂的构图
- V命令

- Vary (Subtle) 、Vary(Strong)命令

- 重做命令

- pan 平移工具

影响变化的参数
ㅤ | 命令 | 功能 | 影响初始生成 | 影响变化
影响混合模式 | V6.1 | V6、V5.2 | Niji 6 |
最大纵横比 | --ar 1:1 | 更改纵横比 | ✓ | ✓ | 范围:1:14 — 14:1
默认1:1 | 任何 | 范围:1:14 — 14:1
默认1:1 |
混乱值 | --chaos <number 0–100> | 改变结果的变化程度。值越高,产生的生成结果就越不寻常和出乎意料 | ✓ | ㅤ | 范围:0-100
默认:0 | 范围:0-100
默认:0 | 范围:0-100
默认:0 |
图像权重 | --iw <0–3> | 设置相对于文本权重的图像提示权重。默认值为 1 | ✓ | ㅤ | 0–3
默认=1 | .5–2
默认=1 | .5–2
默认=1 |
负面提示词 | --no item1,item2 | 负面提示,图片中移除的内容 | ✓ | ✓ | 支持 | 支持 | 支持 |
质量 | --quality <.25, .5, or 1>
V6.1 支持 参数为2 | 花费多少渲染质量时间。默认值为 1。值越高,使用的GPU 分钟数越多;值越低,使用的 GPU 分钟数越少。但是并非质量越高图像越好,而是指图像包括的细节 | ✓ | ㅤ | .25、.5 、1或2 | .25、.5 或 1 | .25、.5 或 1 |
重复作业 | --repeat <1–40> | 单个提示创建多个作业,默认为4,这个一般不修改 | ✓ | ㅤ | 范围:1-40
默认:4 | 范围:1-40
默认:4 | 范围:1-40
默认:4 |
随机种子 | --seed <integer between 0–4294967295> | Midjourney 机器人使用种子号创建一个视觉噪声场(如电视静态图像),作为生成初始图像网格的起点。种子号是为每个图像随机生成的,但可以使用 --seed 或 --sameseed 参数指定。使用相同的种子号和提示将产生类似的最终图像 | ✓ | ㅤ | 范围:整数 0–4294967295
默认:随机 | 范围:整数 0–4294967295
默认:随机 | 范围:整数 0–4294967295
默认:随机 |
停止 | --stop <integer between 10–100> | 在流程中途停止作业,以较早的百分比停止作业可能会导致结果更模糊、更不详细 | ✓ | ✓ | 范围:10-100
默认:100 | 范围:10-100
默认:100 | 范围:10-100
默认:100 |
风格 | --style <raw> | 切换到原始风格,降级默认美学 | ✓ | ㅤ | raw | raw | raw |
风格化参数 | --stylize <number> | 影响 Midjourney 默认美学风格应用于 Jobs 的强度 | ✓ | ✓ | 范围:0–1000
默认:100 | 范围:0–1000
默认:100 | 范围:0–1000
默认:100 |
视频 | --video | 保存正在生成的初始图像网格的进度视频 | ✓ | ✓ | 支持 | 支持 | 支持 |
诡异值 | --weird <number 0–3000> | 参数探索不寻常的美学 | ✓ | ㅤ | 范围:0–3000
默认:0 | 范围:0–3000
默认:0 | 范围:0–3000
默认:0 |
Remix 模式的启用方式有 2 种:
- 直接在文本框内输入 / prefer remix 然后发送出去,当 midjourney bot 提示你“Remix mode turned on”,就表示 remix 模式开启成功。
- 发送 /setting 命令调取设置面板,然后点击 「remix mode」按钮使其变绿。

使用Remix模式后,在弹出的Remix Prompt输入提示词和命令参数即可。
一定要注意变化模式对Remix模式的影响
默认的变化模式为 high variation mode 高变化模式,但只有在 low variation mode 低变化模式下启用 remix,才能生成高度一致的图像;
反之如果想对原图产生较大的改变,要切换到高变化模式;
6.1 Remix模式应用 - 图像风格转换
Remix 能在很大程度上保留原图像的构图特征,当我们修改图像的风格时,原图的主体特征会保持不变,从而实现同一图像的风格切换。


- 使用提示词,可以生成一个阳光好看的人物,可以使用Remix模式在保留主体特征的前提下转换图片的风格:
- 在Remix模式下,分别使用Vary (Subtle)低变化 、Vary(Strong)高变化 命令;
- 输入提示词 :
⚠️注意:
🪄 Vary (Strong)
按钮对应于🎨 High Variation Mode
🪄 Vary (Subtle)
对应于🎨 Low Variation Mode

🪄 Vary (Subtle)

Vary (Strong)

Oil painting style. --ar 2:3 --v 6.1 --quality 2

Film style. --ar 2:3 --v 6.1 --quality 2

6.2 Remix模式应用 - 人物年龄变化 (Stuble模式)
以上图“Oil painting style”作为参数,生成一个25岁的照片

在25岁图片的基础上使用 Vary (Subtle)工具,分别生成35岁,45岁,55岁的样子
Portrait photo of a 45-year-old woman, smiling, dark hair, white fashion suit, --ar 2:3 --style raw
25岁

45岁

35岁

55岁

6.3 Remix模式应用 - 提取一张图像的构图特征,然后引导生成相似构图的新图:想生成一幅远看像一个人的风景图 (这种效果V5.2效果比最新的V6.1更好)
1、生成一张人像图片,在提示词中使用 --stop 参数,数值的选用范围在 10-30 之间,以保证生成的图像是模糊的。(测试用5.2生成模糊图效果更好)

2、开启 remix 模式和低变化模式(low variation mode),选择一张合适的图像作为底图,点击对应的变化按钮,并在弹出的文本框内输入新的提示词,引导风景画的生成。
使用V5.2模型

其它的一些图片效果




6.4 Remix模式应用:Vary Region + Remix 混合模式下的局部重绘应用
由于局部重绘是完全在选择区域中进行重新作图,因而可以比单纯的Remix模式遵循更多的参数
和局部重绘Vary Region使用方式基本相同,主要是了解这种创造方式: https://docs.midjourney.com/docs/vary-region-remix-1
七、stylize风格化参数
低风格化值生成的图像与提示非常匹配,但艺术性较差。高风格化值创建的图像非常艺术,但与提示的联系较少。
八、作品风格(艺术家、公司、艺术风格等)
风格是指作品整体呈现出的独特面貌,风格按照不同的标准可以划分为许多种
- 真实程度划分:可以分为写实、抽象、卡通等。
- 按艺术派系划分:可以分为印象派、抽象派、野兽派、写实派、古典主义、现实主义、表现主义、超现实主义、立体主义、
- 极简主义、波普主义、超写实主义等。艺术派系的风格区别很大,它们的影响体现在绘画、建筑、摄影、工业设计等视觉领域的方方面面。
- 按国画技法划分:可以分为白描、写意、泼墨、工笔、没骨等
AI是通过大数据计算来获得结果的,这些风格及画派在网络上有着庞大的数据基础,当用户想要某种效果但又不方便用语言描述的时候,可以在Midjourney的提示词中注明风格类型,这样就会生成具有相应风格的效果。
整理一些常用的艺术家、艺术风格、代表性的艺术公司
艺术风格:整理中
艺术公司:整理中
📎 参考文章
- Variations :https://docs.midjourney.com/docs/variations
- Vary Region : https://docs.midjourney.com/docs/vary-region
- Stable Diffusion AI online:https://stablediffusion.fr/artists
有关Midjourney使用上的问题和想法,欢迎您在底部评论区留言,一起交流~
- 作者:Schafer
- 链接:https://www.meindigilife.com//article/MidJourney-BasicCourse-2
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。