GS Blog

Every failure is leading towards success.

Diffusion Model

Diffusion Model(扩散模型)是经过严格的数学推理得到的,主要用到了贝叶斯公式和马尔科夫链法则,其推导过程与VAE(变分自编码器)有些相像,其中都用到了参数重整化这样的技巧,通过一系列的化简,最终可以得到一个相对简单的形式,其实验效果在去噪,图像生成等领域取得了一定的进展。 Diffusion Mode分为两个过程,扩散过程与逆扩散过程,顾名思义,逆扩散过程就是扩散过程的逆过程...

Summary of 2D Human Pose Estimation

早期基于深度学习的2D人体姿态估计采用直接回归的关键点的坐标(DeepPose),但是这种方法很难收敛,因为在训练中,很难使得模型的输出固定在一个值。将heatmap的概念引入到姿态估计中,使得基于深度学习的2D人体姿态估计算法取得了较大的发展,这里所说的heatmap指的是以每个关键点的位置为中心,加一个高斯核得到的heatmap,这样可以大大降低模型优化的难度。主要分为top down和...

尺度不变特征转换(SIFT)

尺度不变特征转换(Scale Invariant Feature Transform, SIFT)算法顾名思义就是该算法提取的特征对尺度变化有不变性的特点,要理解这个算法,首先要理解尺度的概念,以及尺度不变性的定义。 1. 尺度不变性 对于平面直角坐标系来说,尺度可以表示为横纵坐标轴大的分度值,对于选择不同的分度值,我们得到的结果往往会有不同的结果,给我们直观的结果就是坐标系内的图像被放...

角点检测

对于一幅图像,我们首先想到的图像特征就是图像边缘,图像边缘可以构造出这幅图像的轮廓,根据图像的轮廓我们可以大致获知图像的内容,这一过程可以抽象为将图像从面简化到线,从这个角度出发,我们可以尝试能否进一步将特征从线简化到点,使用这些特征点来表达图像的特征,进一步减少特征中的冗余信息。这种方法被称为角点检测法。 1. 角点 何为角点是我们首先要解决的问题,对于一幅图像来说,平坦区域(亮度变化...

边缘检测

本专题会记录一下计算机视觉课程的上课内容中的笔记,主要针对其中的一些方法进行过程描述与理解,在整体上进行理解算法的内容。 1. 边缘 边缘包括物体的边界、表面方向的改变、不同的颜色、光照明暗的变化,可以看到边缘的位置往往是图像中亮度变化比较剧烈的地方,也即图像的高频分量处于的位置,这些地方往往拥有更多的细节信息,相对而言,那些平坦区域的低频分量可以认为是冗余信息,是可以舍去的,同时这些区...

支持向量机

对于一个二类可分问题,感知机算法可以对这些样本点进行二分类,其解有无穷多个,我们不能找到一个最优的超平面对这些样本点分类。对于所有可行解来说,超平面距离样本点越远,该超平面对当前样本点分类效果应当越好,这也就引出了支持向量机算法,即间隔最大化。支持向量机算法的原始问题可以描述为二次规划问题,对于线性规划以及二次规划问题,还可以使用对偶问题来描述,并且在一定的条件下,原始问题与对偶问题的解是相...

逻辑斯谛回归

1. 基本思想 logistic模型推导的出发点是建立在假设似然比的对数是一个线性判别函数,并因此可以推导出其后验概率比的对数也是线性判别函数,即 \[\begin{aligned} &\log \left(\frac{p(x|\omega_i)}{p(x|\omega_M)}\right)=\beta_{i,0}+\beta_i^Tx,\ i=1,2,...,M-1\\ \Ri...

样本与整体的关系

样本的均值是整体均值的无偏估计,样本的方差是整体方差的有偏估计,这里所谓的有偏估计与无偏估计是针对通过样本计算出的均值与方差的期望而言的,而不是针对某次抽取样本所得到的样本的均值与方差而言,即某次抽样得到的样本,并计算得到的样本的均值与方差是并不严格等于实际整体的均值与方差,因此在实际应用中也可以发现在整体的方差无偏估计与有偏估计时,二者对结果往往不会造成较大的影响。 1. 样本的均值是整...

朴素贝叶斯法

一、朴素贝叶斯法 在概率论中我们曾经学习过贝叶斯公式,它是通过修正先验概率而得到后验概率,后验概率由于考虑到了新情况的加入,更加地接近实际情况。在实际应用中,朴素贝叶斯法凭借其学习与预测的高效率使其成为一种较为常用的方法。 假设输入空间\({\cal{X}}\subseteq R^n\)为\(n\)维向量的集合,输出空间为类标记集合\({\cal{Y}=\{c_1,c_2,...,c_k...

k近邻法

一、k近邻算法 k近邻法(k-nearest neighbor, k-NN)是一种基本的分类与回归方法。该算法简单、直观:给定一个训练数据集,k近邻模型就已经基本固定,对于输入的实例,在训练数据集中找到距离该实例最近的k个实例,在这k个实例中实行多数表决机制,即这k个实例中的多数属于哪个类,该输入实例就属于哪个类。 k近邻算法的数学定义为: 输入:训练数据集\(T=\{(x_1,...