图像超分辨率论文笔记-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

图像超分辨率论文笔记

阅读量：4147 次

发布时间：2019-05-25

本文共 3369 字，大约阅读时间需要 11 分钟。

持续更新

Progressive Multi-Scale Residual Network for Single Image Super-Resolution

论文链接：

代码：（暂未公开）

发表时间：2020.7

网络结构：

1）包括三个部分特征提取、非线性特征抽取、重建；
2）非线性特征抽取主要由PMRB模块构成；
3）普通的多尺度是通过卷积层不同核大小实现的，当卷积核比较大时，所需参数量和计算量都比较大，本文以递归的形式采用相同卷积核尺寸（3*3）实现多尺度（递归结构换一种解释方法，个人认为创新性不大）：

4）在PMRB中还采用了channel-Attention和pixel-Attention构成CPA：

5）损失函数为 $l_1$ loss；

Blind Super-Resolution Kernel Estimation using an Internal-GAN

论文链接：

代码：

2019

算法结构：

1）利用kernelGAN估计一幅真实LR图像的降质核；
2）输入为真实的LR图像，从图像中随机切出的3000个 $64\times64$ 的图像块送入全卷积生成器G中，生成尺度缩小s倍的LR图像块，此处的损失函数除了对抗损失外，还有生成LR图像与对输入的 $64\times64$ 进行bicubic降采样间的MSE损失，还有对G模拟kernel核的限制；
3）如何从G中提取对应的模拟核：对G输入1，输出即为模拟核；
4）判别器，判断真实LR图像块和生成的LR图像块的真假，输出为像素级；
5）超分采用ZSSR算法；

Real-World Super-Resolution via Kernel Estimation and Noise Injection

论文链接：

代码：

CVPR2020， NTIRE2020 RWSR双赛道冠军

算法结构：

1）提出新的数据制作方案：统计模糊核与真实噪声分布并用于制作训练数据对，确保生成的LR图像具有与源域图像相似的属性；2）判别器采用块判别器，可以去除伪影；
2）计算模糊核，参考KernelGAN，满足的约束条件为
$min||(I_{src}*k)\downarrow _s-I_{src}\downarrow _s||_1+|1-\sum k_{i,j}|+|\sum k_{i,j} \cdot m_{i,j}|+|1-D((I_{src}*k)\downarrow _s)| (4)$

$(I_{src}*k)\downarrow _s$ 表示利用核k进行降采样的LR图像， $I_{src}\downarrow _s$ 表示基于理想核进行降采样的LR图像。第二项为正则化项，第三项为边界惩罚项;

2）提取噪声：如果某个块的方差小于设定的阈值，则将其纳入到降质池中。这个规则可以描述为

\sigma(n_i) \lt v （7）

;

4）RealSR降质算法：

在这里插入图片描述

Perceptual Extreme Super Resolution Network with Receptive Field Block

论文链接：

代码：暂未开源

CVPR2020， NTIRE2020 感知极限超分赛道冠军

网络结构（基于ESRGAN）：

1）RRDB模块
2）RRFDB模块

3）RFB模块

关注不同层次的细节，且减少运算量和参数量；
4）上采样模块

最近邻插值法上采样关注空间的特征转换，亚像素层关注depth-to-space，两者交替结合效果更好；
5）训练时，先PSNR-oriented训练，将其作为预训练模型，然后添加内容损失和对抗损失进行微调；
6）最终采用网络插值，取在测试集上最好的十个模型进行网络集成

PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models

论文链接：

项目代码：https://github.com/adamian98/pulse

CVPR2020

网络结构：
1）网络是styleGAN；
2）生成器生成 $1024\times1024$ 的人脸图像，然后对生成的人脸图像进行32倍bicubic降采样，与真实的LR图像做 $l_2$ loss，生成一张图像时，进行100次微调，使得生成图像降采样后和原始的LR图像相似；(训练过程的代码还未公开，训练的一些步骤我现在还不清楚，跟进后再补充)

Guided Frequency Separation Network for Real-World Super-Resolution

论文链接：

代码工程：

网络结构：

分两个阶段，第一阶段：无监督数据生成（通过HR图像生成LR图像，gan）；第二阶段：监督SR（基于第一阶段生成的成对LR-HR图像进行训练）；

基于DSGAN的改进；

第一阶段的gan网络，生成器的主要单元为CARB（Color Attention Residual Block），其中的使用使得能够控制color shift，生成器的输入为bicubic将采用的HR图像块，生成器及判别器细节如下所示：

生成器损失函数： $L_G=\lambda_{t1}*L_{low}+\lambda_{t2}*L_{per}+\lambda_{t3}*L_{high}$
其中：

$F_L()$ 表示高斯低通滤波器；

判别器损失函数定义：

第二阶段：利用前一阶段的网络生成LR图像，构成LR-HR图像对，然后基于LSGAN进行训练，判别器分为高低频提取特征，细节如下：

此阶段的生成器损失函数除了对抗损失和 $l_1$ 损失外，另添加了边缘损失：

其中 $F_E$ 表示Canny边缘检测器。

Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution

论文链接：

代码工程：

网络结构：

图中黑色箭头是正向网络，先降采样提取特征再超分，红色箭头为对偶网络，从得到的超分图像中退质出低分图像；

loss函数：引入额外的对偶回归Loss：

$L_p()$ 是多个尺度图像的loss；
在没有成对数据集时，采用半监督学习，引入部分的成对数据集用于训练，整体损失函数为：

$1_{Sp}(x_i)$ 表示当 $x_i$ 输出成对数据集时，该函数等于1，反之等于0。
训练策略：

Dual Super-Resolution Learning for Semantic Segmentation

论文链接：

代码工程：

网络结构：

1）将超分用于语义分割，构成多任务网络结构；
2）包括三大模块：语义分割超分（SSSR,网络结构图的上分支）,单幅图像超分（SISR，网络结构图的下分支），特征相似度（FA，网络结构图的中间部分）；
3）特征相似度计算表达式为:

最终的loss函数：

转载地址：http://bmjti.baihongyu.com/

你可能感兴趣的文章

JAVA集合--ArrayList实现原理

synchronized与Lock

数据库索引

实现包含min，max，push，pop函数的栈

实验2-6　字符型数据的输入输出

实验3-5　编程初步

实验4-1　逻辑量的编码和关系操作符

实验5-2　for循环结构

实验5-3　break语句和continue语句

实验5-4　循环的嵌套

实验5-5　循环的合并

实验5-6　do-while循环结构

实验5-7　程序调试入门

实验5-8　综合练习

第2章实验补充C语言中如何计算补码

深入入门正则表达式（java） - 命名捕获

使用bash解析xml

android系统提供的常用命令行工具

【Python基础1】变量和字符串定义

【Python基础2】python字符串方法及格式设置

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-23 04:35:30 当前IP: 18.218.238.134 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我