人工智能学习pyTorch自建数据集及可视化结果实现过程

2022-12-04 13:46 开发作者：网络整理

一、自定义数据集

现有数据如下：

5个文件夹，每个文件夹是神奇宝贝的一种。

每个图片形状、大小、格式不一。

人工智能学习pyTorch自建数据集及可视化结果实现过程

我们训练CNN的时候需要的是tensor类型的数据，因此需要将所有的图片进行下列转换：

1.对文件夹编号，进行映射，比如妙蛙种子文件夹编号0，皮卡丘编号1等。

2.对文件夹中所有图http://www.cppcns.com片，进行编号的对应，这个就是标签。并保存为一个csv文件。

3.图片信息获取：分为train,val,test

4.处理图片，使其成为torch可以处理的类型

1.文件夹映射

前半部分为文件夹的映射。我们www.cppcns.com希望传入数据的时候直接传入文件夹的名字，而文件夹所在的路径就是py文件所在的路径，因此这样可以直接读取。对于路径的操作使用os.path.join进行。

人工智能学习pyTorch自建数据集及可视化结果实现过程

2.图片对应标签

输入的filename，就是我们将图片和标签信息存储的文件。

使用glob.glob方法，可以轻松调取路径下的所有指定类型的文件。

将名字和标签对应好后，通过csv.writer，可以将信息以csv格式写入新文件。

人工智能学习pyTorch自建数据集及可视化结果实现过程

以上是保存的部分，在这个函数中，我们还要重新读取一下这个文件，因为要在这个类中获得最终的图片，以及标签，并且返回。

人工智能学习pyTorch自建数据集及可视化结果实现过程

3.训练及测试数据分割

这里是第一步的图片的后半部分，导入了图片之后，对其进行分割，这里是按照训练、交叉验证、测试，分别是0.6,0.2,0.2进行分割的。

分割完毕后的self.images, self.labels，就可以拿来进行tensor相关的处理了。

人工智能学习pyTorch自建数据集及可视化结果实现过程

4.数据处理

上面几步是准备工作，接下来定义的_编程客栈_getitem__是为了能够使train_loader = DataLoader()这一语句实现。在这里面直接将数据进行我们希望进行的转换。比如大小、旋转、裁剪等。

最后返回处理好的图片，以及tensor化的标签。

人工智能学习pyTorch自建数据集及可视化结果实现过程

另外，还需要定义一个__len__，使得我们可以获得数据集长度。

人工智能学习pyTorch自建数据集及可视化结果实现过程

二、ResNet处理

我们要用ResNet对图片进行处理，因此其中的参数需要进行一定的修改。

主要的修改部分是ResNet18之中的resblo编程客栈ck模块。因为我们希望输入的是3通道，224*224的图片，因此在这里对通道，步长进行一定的修改，并进行测试，成功之后便可以进行训练了。

人工智能学习pyTorch自建数据集及可视化结果实现过程

三、训练及可视化

1.数据集导入

同时把GPU设备相关代码准备好，并且由于需要可视化，因此先实例化visdom，并且在终端上输入python -m visdom.server，打开visdom监视终端。

人工智能学习pyTorch自建数据集及可视化结果实现过程

2.测试函数

先把模式改为eval()，接下来就是通过model，去训练测试集，得到标签，并统计正确率。

人工智能学习pyTorch自建数据集及可视化结果实现过程

3.训练过程及可视化

和之编程客栈前的一样，还是先实例化一个优化器，选择损失函数模式，实例化ResNet18，然后进行训练。

在这里由于要展示，因此先对损失值，交叉验证分数分别设置一个初始的线，通过append的方法，画出我们的损失曲线，以及交叉验证分数曲线。

人工智能学习pyTorch自建数据集及可视化结果实现过程

通过torch.save方法存储我们的最优解。

最后通过把存储好的最优解调用起来，使用测试集，来测试最终的效果。

人工智能学习pyTorch自建数据集及可视化结果实现过程

最终获得的交叉验证准确率89%，测试集准确率88%，损失值及交叉验证结果的图像如下：

人工智能学习pyTorch自建数据集及可视化结果实现过程

以上就是人工智能学习pyTorch自建数据集及可视化结果实现过程的详细内容，更多关于pyTorch自建数据集及可视化结果实现的资料请关注我们其它相关文章！

继续阅读：[db:TAGS]

人工智能学习pyTorch自建数据集及可视化结果实现过程

目录

一、自定义数据集

1.文件夹映射

2.图片对应标签

3.训练及测试数据分割

4.数据处理

二、ResNet处理

三、训练及可视化

1.数据集导入

2.测试函数

3.训练过程及可视化

更多精彩内容

精彩评论

最新开发

C#实现高保真的Excel转PDF详解(无需 Office 环境)

SpringBoot整合FastExcel实现导入导出功能的操作详解

springBoot中动态加载jar包的完整指南

SpringBoot中公共字段自动填充的常用技巧

IntelliJ IDEA配置Gitee私人令牌的完整指南(2025 年最新版)

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）