博客专栏

EEPW首页 > 博客 > Siamese-pytorch孪生网络实现评价图像相似度

Siamese-pytorch孪生网络实现评价图像相似度

发布人：数据派THU 时间：2021-12-18 来源：工程师发布文章

来源：机器学习AI算法工程

什么是孪生神经网络

简单来说，孪生神经网络（Siamese network）就是“连体的神经网络”，神经网络的“连体”是通过共享权值来实现的，如下图所示。

所谓权值共享就是当神经网络有两个输入的时候，这两个输入使用的神经网络的权值是共享的（可以理解为使用了同一个神经网络）。

很多时候，我们需要去评判两张图片的相似性，比如比较两张人脸的相似性，我们可以很自然的想到去提取这个图片的特征再进行比较，自然而然的，我们又可以想到利用神经网络进行特征提取。

如果使用两个神经网络分别对图片进行特征提取，提取到的特征很有可能不在一个域中，此时我们可以考虑使用一个神经网络进行特征提取再进行比较。这个时候我们就可以理解孪生神经网络为什么要进行权值共享了。

孪生神经网络有两个输入（Input1 and Input2），利用神经网络将输入映射到新的空间，形成输入在新的空间中的表示。通过Loss的计算，评价两个输入的相似度。

孪生神经网络的实现思路

一、预测部分

1、主干网络介绍

孪生神经网络的主干特征提取网络的功能是进行特征提取，各种神经网络都可以适用，本文使用的神经网络是VGG16

这是一个VGG被用到烂的图，但确实很好的反应了VGG的结构：

1、一张原始图片被resize到指定大小，本文使用105x105。

2、conv1包括两次[3,3]卷积网络，一次2X2最大池化，输出的特征层为64通道。

3、conv2包括两次[3,3]卷积网络，一次2X2最大池化，输出的特征层为128通道。

4、conv3包括三次[3,3]卷积网络，一次2X2最大池化，输出的特征层为256通道。

5、conv4包括三次[3,3]卷积网络，一次2X2最大池化，输出的特征层为512通道。

6、conv5包括三次[3,3]卷积网络，一次2X2最大池化，输出的特征层为512通道。

2、比较网络

在获得主干特征提取网络之后，我们可以获取到一个多维特征，我们可以使用flatten的方式将其平铺到一维上，这个时候我们就可以获得两个输入的一维向量了。

将这两个一维向量进行相减，再进行绝对值求和，相当于求取了两个特征向量插值的L1范数。也就相当于求取了两个一维向量的距离。

然后对这个距离再进行两次全连接，第二次全连接到一个神经元上，对这个神经元的结果取sigmoid，使其值在0-1之间，代表两个输入图片的相似程度。

实现代码如下：

二、训练部分

1、数据集的格式

本文所使用的数据集为Omniglot数据集。

其包含来自 50不同字母（语言）的1623 个不同手写字符。每一个字符都是由 20个不同的人通过亚马逊的 Mechanical Turk 在线绘制的。

相当于每一个字符有20张图片，然后存在1623个不同的手写字符，我们需要利用神经网络进行学习，去区分这1623个不同的手写字符，比较输入进来的字符的相似性。

最后一级的文件夹用于分辨不同的字体，同一个文件夹里面的图片属于同一文字。在不同文件夹里面存放的图片属于不同文字。

上两个图为

.\images_background\Alphabet_of_the_Magi\character01里的两幅图。它们两个属于同一个字。

上一个图为

.\images_background\Alphabet_of_the_Magi\character02里的一幅图。它和上面另两幅图不属于同一个字。

2、Loss计算

对于孪生神经网络而言，其具有两个输入。

当两个输入指向同一个类型的图片时，此时标签为1。

当两个输入指向不同类型的图片时，此时标签为0。

然后将网络的输出结果和真实标签进行交叉熵运算，就可以作为最终的loss了。

本文所使用的Loss为binary_crossentropy。

当我们输入如下两个字体的时候，我们希望网络的输出为1。

我们会将预测结果和1求交叉熵。

当我们输入如下两个字体的时候，我们希望网络的输出为0。

我们会将预测结果和0求交叉熵。

训练自己的孪生神经网络

1、训练本文所使用的Omniglot例子

下载数据集，放在根目录下的dataset文件夹下。

运行train.py开始训练。

2、训练自己相似性比较的模型

如果大家想要训练自己的数据集，可以将数据集按照如下格式进行摆放。

每一个chapter里面放同类型的图片。

之后将train.py当中的train_own_data设置成True，即可开始训练。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。

关键词： AI

相关推荐

电子元件培训教材

资源下载 NBA 电子元件识别电阻识别电容识别 AI MI SMT DIP 静电防护 | 2008-09-20

万家乐JSYZ5-AI燃气热水器电路图

设计方案电路图热水器燃气 JSYZ5-AI 万家乐 | 2013-01-17

四大需求推动封测厂迎春燕

EDA/PCB 先进封测 AI HPC 车用封测 | 2023-12-18

释说芯语16：硬科技：构建企业未来之路（附PPT）

jackwang | 2018-10-22

EEPW2018年6月刊(5G)

资源下载 5G AI | 2018-06-11

“破局AI开发，释放边缘算力开发者访谈”，干货满满！

视频 intel AI OpenVINO | 2021-06-10

人工智能是如何帮助阻止造假者的？

谢丫丫 | 2018-08-14

AI与Intel 4加持英特尔第五代至强与酷睿Ultra双箭齐发

消费电子 AI Intel4 英特尔第五代至强酷睿Ultra | 2023-12-19

WTC-AI太阳能热水器电路图

设计方案 WTC-AI 太阳能热水器电路图 | 2012-07-24

开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

智能计算 OpenAI ChatGPT AI | 2023-12-12

iCAN-4017 AI功能模块

资源下载周立功单片机功能模块 iCAN-4017 AI | 2007-03-30

意法半导体推出NanoEdge AI免费部署服务,打破边缘人工智能应用障碍

嵌入式系统意法半导体 NanoEdge AI 边缘人工智能 | 2023-12-13

AIGC手机处理器与传统AP挥手告别

手机与无线通信手机处理器 AP AI | 2023-12-14

AI算力芯片天下一分为四，中国实力渐显

智能计算算力大模型 AI | 2023-12-15

2021春晚黑科技，火爆全网的\"打工牛\"是什么来头？

视频 AI 机器人 | 2021-02-26

AI芯片领域，英伟达的对手们准备反击

智能计算英伟达 AI | 2023-12-19

EEPW2018年3月刊(工业物联网)

资源下载工业物联网 AI | 2018-03-12

2024智能制造展望：Industry 4.0、AI和自动化的发展

工控自动化自动化，工业，AI | 2023-12-15

英特尔推出新的人工智能芯片以与Nvidia和AMD竞争

智能计算英特尔 AI | 2023-12-15

AI驱动的嵌入式声音和振动识别

视频 ADI AI 嵌入式 OtoSense | 2018-10-23

英特尔人工智能创新应用大赛正式启动，以AI PC促进生产力和娱乐体验飞跃

智能计算英特尔人工智能创新应用大赛 AI PC | 2023-12-18

WTC-AI型太阳能热水器电路图

设计方案电子电路图，WTC-AI 太阳能热水器电路热水器 | 2012-07-30

瑞萨电子AI单元解决方案成功提高GE医疗（日本）日野工厂的生产力

winni945 | 2018-09-12

海联达（Aigale）Ai-HD1 无线全高清套件拆解

zhuwei0710 | 2013-04-28

继上次海联达Ai-ap100拆机之电源改造

zhuwei0710 | 2013-04-03

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 AI 智能语音 | 2017-12-14

如何快速搭建手写体识别演示系统

视频 digikey AI 手写体识别 | 2022-07-29

大嘴业话-AI目前市场分析

视频人工智能，AI，ChatGPT，互联网技术 | 2023-04-25

技术专区

关闭