Numpy-Pandas-Matplotlib
文章平均质量分 58
python 三大常用库的学习及总结
Robin_Pi
所有觉得难得东西,只是因为没有真正理解最基础的概念
展开
-
Python 的“取整”的坑:一文了解Python取整
python 取整问题原创 2020-11-30 15:30:55 · 487 阅读 · 0 评论 -
Numpy报错:ImportError: numpy.core.multiarray failed to import
导入自定义的 python 模块时,出现以下报错:ImportError: numpy.core.multiarray failed to import from .cv2 import *ImportError: numpy.core.multiarray failed to import原因:numpy 版本过低或者过高解决:查看numpy 版本:pip show numpy我当前环境中的 numpy 版本是:Version: 1.16.5升级:pip install -原创 2021-09-29 11:16:45 · 46972 阅读 · 10 评论 -
Python matplotlib 报错:RuntimeError: In set_size: Could not set the fontsize:弄清 figsize 和 dpi 的含义
问题保存图片时报错:RuntimeError: In set_size: Could not set the fontsizeTraceback (most recent call last): File "/Users/robin/MLcode/Pycharm_Project/tensorflow/2021/0823_face_recognition_environment/0827_img_quality_analysis_v4.py", line 1556, in <module>原创 2021-09-15 17:01:14 · 1547 阅读 · 0 评论 -
python matplotlib:解决保存的图片是空白的问题
原因可能是:图片显示plt.show() 用在了plt.savefig()图片保存之前(plt.show()一定要用在最后,因为它会将画布刷新)原创 2021-09-14 05:31:19 · 2607 阅读 · 0 评论 -
Python Matplotlib绘图:解决汉字显示乱码问题
失败方法增加 plt.rcParams['font.sans-serif'] = ['SimHei'] # Or any other Chinese characters依然报错:findfont: Font family ['sans-serif'] not found. Falling back to DejaVu Sans.有效方法问题的原因是库中的 font 文件夹中不包含相关字体接下来是正片:下载SimHei点击下载放入目录fonts/ttf下获取目录的原创 2021-09-13 18:18:28 · 355 阅读 · 0 评论 -
Numpy:numpy.append 以及与 numpy.concatente 的区别
问题报错:AttributeError: 'numpy.ndarray' object has no attribute 'append'解决列表中用 append 直接添加元素,但是 numpy 数组需要使用 numpy.append(arr,values,axis=None)其中有两点需要注意,举例说明:目标:在下面的数组中增加一行 「255, 255, 255】[[100 88 77] [126 123 116] [ 31 27 23] [181 174 163] [219原创 2021-08-28 07:12:21 · 1386 阅读 · 0 评论 -
一文了解python 透视图(pandas.pivot_table)
文章目录pivot_table的参数理解pivot 与 groupby其它查看可视化保存先上图:pandas piviot_table cheet sheetor:先初略的了解透视图是用来干什么的,一句话:pivot_table 最大的意义便是将数据分组表示并进行聚合运算(结合上面的图来看)。如果你了解pandas的 groupby ,那你会发现他们基本是相通的。下面是正片:pivot_table的参数理解Signature:pd.pivot_table( data, val原创 2020-08-18 14:15:00 · 3980 阅读 · 0 评论 -
Python返回列或行最大值对应的内容
文章目录现实场景数据方法现实场景有一堆数据,表示的是语音识别的效果(用相似度得分表示),需要找到每个测试人员最高分数对应的那个对象(判别结果)。数据data = {"tet":["Anna", "Anna", "Bob", "Bob"], "name":["Candy", "Duck", "Candy", "Duck" ], "scores":["254", "390", "450", "178"]}df = pd.DataFrame(data) df tet name scores原创 2020-08-18 10:10:01 · 3949 阅读 · 0 评论 -
Python [plt 和 cv] 图片读取、显示和保存
绘制图像1. 图片读取方式2. 绘图2.1 图片显示2.2 关闭坐标显示3. 保存图片1. 图片读取方式keras 导入opencv 导入2. 绘图2.1 图片显示opencv 绘制 (默认 gbr)cv2.imshow()若不能正常显示:k = cv2.waitKey(0) # 0==wait foreverplt 显示plt.imshow()plt.sh...原创 2020-03-28 09:01:50 · 4151 阅读 · 0 评论 -
机器学习——Sklearn学习笔记——总章
Sklearn学习笔记 0| 总章写在前面预处理模型选择算法分类回归聚类降维写在最后写在前面Sklearn 官方文档相当地详实,反而显得对初学者学习不太友好。本 “学习笔记” 系列就是参照Sklearn官方文档整理而得,结构上基本维持不变,内容少会有少许删减(过于详细和”偏“),以便自己以后查阅和复习。预处理模型选择算法分类回归聚类降维写在最后后续还会继续更新 “学习总结”...原创 2020-01-14 14:10:21 · 732 阅读 · 0 评论 -
用 Seaborn 做数据可视化(1)——绘图功能(4)可视化线性关系
传送门:用 Seaborn 做数据可视化(0)总章目录:可视化线性关系1. 绘制线性回归模型的函数1.1 regplot()1.2 implot()2. 不同情况下的使用2.1 变量 x 是离散值2.2 解决非线性关系的拟合(拟合不同的模型)2.3 离群点的问题(“outlier” observations)2.4 变量 y 是离散的(二元)3. regplot() 和 lmplot() 真正的...原创 2020-01-13 10:52:06 · 1097 阅读 · 5 评论 -
Python数据分析之可视化——用 Seaborn 做数据可视化(0)总章
目录1. 介绍&框架1.1 Seaborn 与 Matplotlib 的关系1.2 Seaborn 的优势1.31.4 框架(理解)2. 绘图函数2.1 可视化统计关系2.2 可视化分类数据分类散点图同类观测值分布同类统计评估可视化“宽型”数据使用分面图进行多变量关系分析2.3 可视化数据集的数据分布可视化单变量分布可视化双变量分布(二元分布)可视化数据集中的成对关系2.4 可视化线性关系绘制线...原创 2020-01-13 09:48:51 · 757 阅读 · 0 评论 -
用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布
传送门:用 Seaborn 做数据可视化(0)总章目录:可视化数据集的数据分布1. 可视化单变量分布:distplot()2. 可视化二元分布:jointplot()2.1 散点图分布:jointplot() (默认 Kind=“scatter” )2.2 核密度分布:jointplot(kind="kde" )2.3 六边形分布: jointplot(kind="hex")3. 成对关系:...原创 2020-01-13 09:44:57 · 697 阅读 · 0 评论 -
用 Seaborn 做数据可视化(1)——绘图功能(2)可视化分类数据:sns.catplot()
目录0. 概述1. 分类散点图1.1 catplot() 默认 kind='strip'1.2 catplot(kind='swarm')2. 类中观测值分布2.1 catplot(kind='box')2.2 catplot(kind="boxen")2.3 catplot(kind="violin")3. 类中统计评估3.1 catplot(kind="bar")3.2 catplot(kin...原创 2020-01-13 00:33:29 · 3603 阅读 · 0 评论 -
用 Seaborn 做数据可视化(1)——绘图功能(1)可视化统计关系:sns.relplot()
目录0. 介绍1. 概论2. 可视化统计关系 relplot( )2.1 两个方法scatterplot()lineplot()2.2 几个参数kindcihuestylesize1. 散点图(scatter plot)绘制二维散点图绘制三维散点图2. 线图(line plot)2.1 聚合和表示不确定性2.2 绘制语义映射数据子集2.3 绘制时间序列3. 分面图(facets):展示多变量关系...原创 2020-01-12 22:48:56 · 3060 阅读 · 1 评论 -
如何使用NumPy快速创建我们需要的数据?
不论是在平时的零碎学习还是网课的学习中,在代码上现实或者跑通一个算法或者模型不仅能够让自己理解的更深还能加强我们的记忆。所以,专门花点时间学习一下如何创建和组织出我们想要的数据很有必要。NumPy 数组NumPy 数组需要注意的一点是,数组是相同类型的元素按照一定顺序排列的组合。NumPy 数组的生成方式:生成一般数组生成一维数组:传入列表生成元组的数组:传入元组生成多维数组:传入嵌...原创 2020-01-06 17:23:23 · 1412 阅读 · 0 评论 -
Python数据分析之可视化——用一篇文章总结:matplotlib、Pandas、seaborn
目录1. 使用 matplotlib 进行数据可视化1.1 基础概念1.2 核心步骤:画图三步走1.3 详细介绍:1.建立画布2. 建立坐标系(确定画图区域)3. 设置坐标轴设置坐标轴的标题设置坐标轴的刻度设置坐标轴的范围其他设置5.绘制图表6.图标显示1.4 常见问题1.5 极简代码实现一个坐标系多个坐标系2. 使用 Pandas 进行数据可视化线图条形图直方图箱线图散点图饼图3. 使用 sea...原创 2020-01-06 11:54:55 · 3204 阅读 · 0 评论 -
AI 之路——数据分析(2)利用Pandas进行数据清清洗
数据预处理1. 缺失值处理缺失值python缺失值有3种:1)Python内置的None值2)在pandas中,将缺失值表示为NA,表示不可用not available。3)对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。后面出来数据,如果遇到错误:说什么foloat错误,那就是有缺失值,需要处理掉所以,缺失值有3种:None,NA,NaN(N...原创 2020-01-04 18:36:39 · 424 阅读 · 0 评论 -
AI 之路——数据分析(1)Pandas小结与框架整理
写在前面主要是阶段性框架总结AI 之路:数据分析——机器学习——深度学习——CV/NLP工具/技能:Python、NumPy、Pandas、Matplotlib——Scikit-learn;LR、SVM…——TensorFlow、Keras、Pytorch;CNN、RNN…数据分析使用 NumPy 或者 Pandas 进行数据分析,后者更为强大和专业,而且有自己的 Matplotli...原创 2020-01-04 18:02:19 · 443 阅读 · 0 评论 -
Python数据分析之NumPy(3)—— NumPy中那些困惑:打印的形状 以及 Python 数组、NumPy 数组、Pandas ndarray 的联系与区别?
疑问:一直很疑惑为什么 NumPy 默认是行向量?(3,)还是(3,1)?明明Python 有内置的数组结构,为什么还再需要创造一个NumPy 数组?NumPy array 和 Python 内置的 array之间到底有什么区别?NumPy array 和 Pandas ndarray 之间又有什么区别和联系?今天就专门花时间来梳理一下相关的知识点。概念梳理:数学中的向量数学...原创 2020-01-03 22:51:41 · 1477 阅读 · 1 评论 -
如何选取 Pandas 中某一列的字符串数量大于某个值的数据?
最简单的操作,一步解决:使用 Pandas 的字符串向量表达式来进行操作df[df.text.str.len() > 100]原创 2019-12-29 15:17:04 · 9832 阅读 · 2 评论 -
Python数据分析之Pandas(2)——一些疑问
把 Pandas 对象当做增强版的 NumPy 结构化数据,行和列都能带上标签,而不是简单地整数索引。Pandas有三个基本数据结构:Series、DataFrame 和 Index。SeriesPandas中一维数组是列向量!-----------疑难杂症之python-Print( )字典print()似乎将结果进行挤压?试一试Numpy数组:似乎打印前后都没有区别,这也验...原创 2019-12-29 12:52:05 · 255 阅读 · 0 评论 -
Python数据分析之NumPy(1)——NumPy快速入门笔记:用一篇文章快速解最核心的NumPy知识
大部分内容是来自英文版官方文档,再加上自己的一点理解,供自己复习用。1. 几个重要概念1.1 array (NumPy数组)NumPy’s main object is the homogeneous multidimensional array.It is a table of elements (usually numbers), all of the same type, index...原创 2019-12-14 16:44:12 · 586 阅读 · 0 评论 -
Python数据分析之Pandas(1)——Pandas官方文档解读:一篇文章 Pandas 快速上手
一.概览两大数据结构:Series和DateFrame(分别对应一维数据和二维数据)记住:index(the rows) 用来代替 axis=0;columns 用来代替axis=1二.快速入门1. 数据导入CSV文件、Excel文件、HDF5pd.read_csv()pd.read_excel()pd.read_hdf()df = pandas.read_csv(...原创 2019-12-15 02:20:34 · 1015 阅读 · 0 评论 -
Python数据分析之NumPy(2)——NumPy核心概念强化篇
本文作为学习NumPy快速教程之后的知识补充,只有真正、正确地理解了每个概念意思,才会再以后的学习过程中少走弯路。在NumPy的学习中,我们最重要的学习目标就是它的ndarray对象。1. 数组对象三个基本对象:1.ndarray本身ndarray是同质的(homogenous):每个项目占用相同大小的内存块, 并且所有块都以完全相同的方式解释。好处:数组对象采用相同的数据类型...原创 2019-12-16 12:19:50 · 732 阅读 · 0 评论 -
Python数据分析之Pandas(3)——Pandas小结
0. 核心基础:(速记-解释-白话)Series:一维;两个“属性”;操作元素① 一维数组结构(看做表格中的一列)②由 index 和 对应的值 构成 (对应行index的一列)③元素级别的操作 (操作这一列之内的元素)DataFrame :二维;三个“属性”;操作行/列①二维数据结构(看做横向/列变化方向堆叠起来的多个Series)②由 index、列名 和 它们对应的值 ...原创 2019-12-27 20:34:34 · 310 阅读 · 0 评论