使用PyTorch进行迁移学习(pytorch模型迁移)
ztj100 2024-10-31 16:13 11 浏览 0 评论
以及为什么不应该从头开始编写CNN架构
如今,训练深度学习模型(尤其是与图像识别相关的模型)是一项非常简单的任务。 您不应该过多强调架构的原因很多,主要是有人已经为您完成了这一步骤。 其余的,您需要进一步阅读。
源代码:Colab Notebook
如今,作为工程师,您唯一应关注的就是数据准备-在深度学习领域,该术语概括了数据收集,加载,规范化和扩充的过程。
今天的议程很简单-解释什么是转移学习以及如何使用转移学习,然后给出带有或不带有预训练架构的模型训练的实际示例。
听起来很简单,所以我们直接开始吧!
数据集下载和基本准备
让我们从导入开始。 在这里,我们有像Numpy,Pandas和Matplotlib这样的常见嫌疑人,还有我们最喜欢的深度学习库Pytorch,其次是它所提供的一切。
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader
from torchvision.utils import make_grid
from torchvision import models, transforms, datasets
我们将在Colab或Colab Pro中更精确地编写此代码,因此我们将利用GPU的强大功能进行培训。
由于我们正在使用GPU进行培训,而您可能并非如此,因此,我们需要一种可靠的方法来进行处理。 这是一种标准方法:
device = torch.device(‘cuda:0’ if torch.cuda.is_available() else ‘cpu’)
device
>>> device(type=’cuda’, index=0)
如果您正在使用CPU进行培训,则应该输入type ='cpu'之类的字眼,但是由于Colab是免费的,因此您无需这样做。
现在到数据集上。 我们将为此使用Dog或Cat数据集。 它具有大量各种尺寸的图像,我们将在以后处理这些图像。 现在,我们需要下载并解压缩它。 就是这样:
%mkdir data
%cd /content/data/
!wget http://files.fast.ai/data/dogscats.zip
!unzip dogscats.zip
大约一分钟后,根据您的互联网速度,可以使用该数据集。 现在,我们可以将其声明为数据目录-不是必需的,但可以节省一些时间。
DIR_DATA = '/content/data/dogscats/'
资料准备
现在已经完成了第一部分的第一部分。 接下来,我们必须对训练和验证子集应用一些转换,然后使用DataLoaders加载转换后的数据。 这是我们应用的转换:
· 随机旋转
· 随机水平翻转
· 调整为224x224-预训练架构所需
· 转换为张量
· 正常化
这是代码:
train_transforms = transforms.Compose([
transforms.RandomRotation(10),
transforms.RandomHorizontalFlip(p=0.5),
transforms.Resize(224),
transforms.CenterCrop((224, 224)),
transforms.ToTensor(),
transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)
])
valid_transforms = transforms.Compose([
transforms.Resize(224),
transforms.CenterCrop((224, 224)),
transforms.ToTensor(),
transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)
])
现在,我们使用DataLoaders加载数据。 此步骤也很简单,您可能已经熟悉了:
train_data = datasets.ImageFolder(os.path.join(DIR_DATA, ‘train’), transform=train_transforms)
valid_data = datasets.ImageFolder(os.path.join(DIR_DATA, ‘valid’), transform=valid_transforms)
torch.manual_seed(42)
train_loader = DataLoader(train_data, batch_size=64, shuffle=True)
valid_loader = DataLoader(valid_data, batch_size=64, shuffle=False)
class_names = train_data.classes
class_names
>>> ['cats', 'dogs']
如果现在要对单个批次进行逆归一化并可视化,则可以得到以下信息:
快速浏览上图表明我们的转换工作符合预期。
数据准备部分现已完成,在下一节中,我们将声明一个自定义的CNN架构,对其进行训练并评估性能。
定制架构CNN
对于这一部分,我们想要做一些非常简单的事情-3个卷积层,每个卷积层之后是max-pooling和ReLU,然后是一个完全连接的层和一个输出层。
这是该架构的代码:
class CustomCNN(nn.Module):
def __init__(self):
super().__init__()
self.conv1 = nn.Conv2d(in_channels=3, out_channels=32, kernel_size=3, stride=1)
self.conv2 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=3, stride=1)
self.conv3 = nn.Conv2d(in_channels=64, out_channels=64, kernel_size=3, stride=1)
self.fc1 = nn.Linear(in_features=26*26*64, out_features=128)
self.out = nn.Linear(in_features=128, out_features=2)
def forward(self, x):
x = F.relu(self.conv1(x))
x = F.max_pool2d(x, kernel_size=2, stride=2)
x = F.relu(self.conv2(x))
x = F.max_pool2d(x, kernel_size=2, stride=2)
x = F.relu(self.conv3(x))
x = F.max_pool2d(x, kernel_size=2, stride=2)
x = x.view(-1, 26*26*64)
x = F.relu(self.fc1(x))
x = F.dropout(x, p=0.2)
x = self.out(x)
return F.log_softmax(x, dim=1)
torch.manual_seed(42)
model = CustomCNN()
model.to(device)
从这里我们可以定义一个优化器和标准,我们准备进行训练:
custom_criterion = nn.CrossEntropyLoss()
custom_optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
由于您可以访问源代码,并且train_model函数很长,因此我们决定不将其放在此处。 因此,如果您要继续,请参考源代码。 我们将训练模型10个时间段:
custom_model_trained = train_model(
train_loader=train_loader,
test_loader=valid_loader,
model=model,
criterion=custom_criterion,
optimizer=custom_optimizer,
epochs=10
)
一段时间后,这里是获得的结果:
无论如何,这都不是可怕的结果,但是我们如何才能做得更好? 迁移学习就派得上用场了。
迁移学习
您可以轻松地在线查找正式定义。 对我们而言,迁移学习意味着下载预制的体系结构,该体系结构接受过1M +图像的训练,并调整输出层,以便根据需要对尽可能多的类进行分类。
由于我们这里只有猫和狗,因此我们需要将此数字修改为两个。
现在,我们将下载ResNet101架构的预训练版本,并使它的参数不可训练-因为该网络已经过训练:
pretrained_model = models.resnet101(pretrained=True)
for param in pretrained_model.parameters():
param.requires_grad = False
赞! 让我们检查一下输出层的外观:
pretrained_model.fc
>>> Linear(in_features=2048, out_features=1000, bias=True)
因此,默认情况下,该体系结构具有1000个可能的类,但是我们只需要两个类-一个用于猫,一个用于狗。 调整方法如下:
pretrained_model.fc = nn.Sequential(
nn.Linear(2048, 1000),
nn.ReLU(),
nn.Dropout(0.5),
nn.Linear(1000, 2),
nn.LogSoftmax(dim=1)
)
pretrained_model.to(device)
这就是我们要做的。
好了,我们仍然必须定义和优化器以及一个准则,但是您知道如何做到这一点:
pretrained_criterion = nn.CrossEntropyLoss()
pretrained_optimizer = torch.optim.Adam(pretrained_model.fc.parameters(), lr=0.001)
训练过程与自定义体系结构相同,但是我们不需要太多的时间,因为好了,我们已经知道权重和偏差的正确值。
pretrained_model_trained = train_model(
train_loader=train_loader,
test_loader=valid_loader,
model=pretrained_model,
criterion=pretrained_criterion,
optimizer=pretrained_optimizer,
epochs=1
)
经过一段时间后,得出的结果如下:
那有多神奇? 不但提高了准确性,而且还因为没有训练太多的时间段而节省了很多时间。
现在您知道了迁移学习可以做什么,以及如何以及为什么使用它。 让我们在下一节中总结一下。
结论
而且,您已获得了— PyTorch最简单的迁移学习指南。 当然,如果网络更深入,自定义模型的结果可能会更好,但这不是重点。 关键是,无需强调多少层就足够了,以及最佳超参数值是多少。 至少在大多数情况下。
确保尝试不同的体系结构,并随时在下面的评论部分中告知我们有关结果的信息。
谢谢阅读。
(本文翻译自Dario Rade?i?的文章《Transfer Learning with PyTorch》,参考:https://towardsdatascience.com/transfer-learning-with-pytorch-95dd5dca82a)
相关推荐
- 从IDEA开始,迈进GO语言之门(idea got)
-
前言笔者在学习GO语言编程的时候,GO语言在国内还没有像JAVA/Php/Python那样普及,绕了不少的弯路,要开始入门学习一门编程语言,最好就先从选择一个好的编程语言的开发环境开始,有了这个开发环...
- 基于SpringBoot+MyBatis的私人影院java网上购票jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于SpringBoot...
- 基于springboot的个人服装管理系统java网上商城jsp源代码mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于springboot...
- 基于springboot的美食网站Java食品销售jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍基于springboot...
- 贸易管理进销存springboot云管货管账分析java jsp源代码mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目描述贸易管理进销存spring...
- SpringBoot+VUE员工信息管理系统Java人员管理jsp源代码Mysql
-
本项目为前几天收费帮学妹做的一个项目,JavaEEJSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。一、项目介绍SpringBoot+V...
- 目前见过最牛的一个SpringBoot商城项目(附源码)还有人没用过吗
-
帮粉丝找了一个基于SpringBoot的天猫商城项目,快速部署运行,所用技术:MySQL,Druid,Log4j2,Maven,Echarts,Bootstrap...免费给大家分享出来前台演示...
- SpringBoot+Mysql实现的手机商城附带源码演示导入视频
-
今天为大家带来的是基于SpringBoot+JPA+Thymeleaf框架的手机商城管理系统,商城系统分为前台和后台、前台用的是Bootstrap框架后台用的是SpringBoot+JPA都是现在主...
- 全网首发!马士兵内部共享—1658页《Java面试突击核心讲》
-
又是一年一度的“金九银十”秋招大热门,为助力广大程序员朋友“面试造火箭”,小编今天给大家分享的便是这份马士兵内部的面试神技——1658页《Java面试突击核心讲》!...
- SpringBoot数据库操作的应用(springboot与数据库交互)
-
1.JDBC+HikariDataSource...
- SpringBoot 整合 Flink 实时同步 MySQL
-
1、需求在Flink发布SpringBoot打包的jar包能够实时同步MySQL表,做到原表进行新增、修改、删除的时候目标表都能对应同步。...
- SpringBoot + Mybatis + Shiro + mysql + redis智能平台源码分享
-
后端技术栈基于SpringBoot+Mybatis+Shiro+mysql+redis构建的智慧云智能教育平台基于数据驱动视图的理念封装element-ui,即使没有vue的使...
- Springboot+Mysql舞蹈课程在线预约系统源码附带视频运行教程
-
今天发布的是由【猿来入此】的优秀学员独立做的一个基于springboot脚手架的Springboot+Mysql舞蹈课程在线预约系统,系统项目源代码在【猿来入此】获取!https://www.yuan...
- SpringBoot+Mysql在线众筹系统源码+讲解视频+开发文档(参考论文
-
今天发布的是由【猿来入此】的优秀学员独立做的一个基于springboot脚手架的在线众筹管理系统,主要实现了普通用户在线参与众筹基本操作流程的全部功能,系统分普通用户、超级管理员等角色,除基础脚手架外...
- Docker一键部署 SpringBoot 应用的方法,贼快贼好用
-
这两天发现个Gradle插件,支持一键打包、推送Docker镜像。今天我们来讲讲这个插件,希望对大家有所帮助!GradleDockerPlugin简介...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 从IDEA开始,迈进GO语言之门(idea got)
- 基于SpringBoot+MyBatis的私人影院java网上购票jsp源代码Mysql
- 基于springboot的个人服装管理系统java网上商城jsp源代码mysql
- 基于springboot的美食网站Java食品销售jsp源代码Mysql
- 贸易管理进销存springboot云管货管账分析java jsp源代码mysql
- SpringBoot+VUE员工信息管理系统Java人员管理jsp源代码Mysql
- 目前见过最牛的一个SpringBoot商城项目(附源码)还有人没用过吗
- SpringBoot+Mysql实现的手机商城附带源码演示导入视频
- 全网首发!马士兵内部共享—1658页《Java面试突击核心讲》
- SpringBoot数据库操作的应用(springboot与数据库交互)
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- node卸载 (33)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- exceptionininitializererror (33)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)