![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
文章平均质量分 67
knowyourself1
这个作者很懒,什么都没留下…
展开
-
resize训练集图片大小并存储的方法
我们做深度学习训练时,需要大量的图片(数据),这些图片往往尺寸不一,也不是我们input的尺寸需求。如果我们能在训练前就将这些图片resize成需要的尺寸,那么训练过程将会非常省时省资源的。resize图片大小的方法有两种:一、#直接基于原图片中心点为中心,以原图片较短边切割成边长为原长方形较短边为边长的正方形代码如下:'''[1] #直接基于原图片中心点为中心,以原图片较短边切割成边长为原长方形较短边为边长的正方形#如test.jpg和crop_img.jpg,部分长宽比例较大的图形经过切割原创 2021-03-29 23:45:51 · 3221 阅读 · 0 评论 -
图片批量重命名
图片批量重命名我们在用图片训练深度学习神经网络,或者用无监督学习算法做分类处理时,往往会用到大量图片,这时就需要将全部图片按照一定的规则命名。使用python批量将图片命名的算法如下:#coding=utf-8#批量将文件重命名import ospath='./'#path=os.path.dirname(__file__) #获取当前脚本的绝对路径filelist = os.listdir(path)filelist.sort() #list.sort是就地将该列表进行排序,也就是说原创 2021-03-11 23:32:24 · 702 阅读 · 0 评论 -
对爬取的电影《唐人街探案3》豆瓣短评做文本分析,并利用stylecloud制作词云图
上一节,我们爬取了豆瓣上电影《唐人街探案3》的评论,并将评论保存成了txt文档,爬虫过程可参考:爬取某瓣上电影《唐人街探案3》的评论本节,我们将对电影短评做文本分析,并利用stylecloud制作词云图。详细步骤如下:1、调入需要用到的库文件#import pandas as pdimport matplotlib.pyplot as pltimport osimport jiebafrom sklearn.feature_extraction.text import CountVector原创 2021-03-07 01:10:44 · 1133 阅读 · 0 评论 -
主成分分析(PCA)的原理与实现
主成分分析(PCA)的原理与实现问题背景Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。如下图所示,数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。如何预测并可视化?再比如,人脸是由许多像素组成的高维数据。高维数据很难处理,因为不能用二维数据的散点原创 2021-02-25 01:36:45 · 870 阅读 · 0 评论