python数据分析
文章平均质量分 78
初学小白Lu
这个作者很懒,什么都没留下…
展开
-
python用pandas读取excel文件,提示ImportError: Missing optional dependency ‘xlrd‘
pandas依赖的xlrd未安装。原创 2023-02-23 11:24:12 · 1364 阅读 · 0 评论 -
python实现线性插值
插值:是根据已知的数据序列(可以理解为你坐标中一系列离散的点),找到其中的规律,然后根据找到的这个规律,来对其中尚未有数据记录的点进行数值估计。原创 2022-12-05 15:09:00 · 7076 阅读 · 2 评论 -
pandas读取csv文件提示UnicodeDecodeError
pandas读取csv文件提示UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position 24: invalid start byte。原创 2022-09-04 18:44:59 · 522 阅读 · 0 评论 -
NumPy切片和索引
ndarray 数组可以基于 0 - n 的下标进行索引原创 2022-08-28 12:03:23 · 390 阅读 · 0 评论 -
Pandas--read_csv,to_csv参数说明
Pandas--read_csv,to_csv参数说明。原创 2022-08-23 21:19:22 · 5997 阅读 · 0 评论 -
Pandas---DataFrame函数说明
DataFrame表示的是矩阵的数据表,原创 2022-08-23 21:18:33 · 4932 阅读 · 0 评论 -
Pandas读取json文件
Pandas读取json文件。原创 2022-08-22 22:42:20 · 5188 阅读 · 0 评论 -
matplotlib图表的样式
通过更改参数可以修改默认的属性原创 2022-08-16 23:30:57 · 573 阅读 · 0 评论 -
Matplotlib绘制动图以及绘制平滑曲线
动图和拟合平滑曲线原创 2022-08-11 20:13:13 · 2169 阅读 · 0 评论 -
Matplotlib保存图片到文件
Matplotlib保存图片到文件。原创 2022-07-22 19:50:31 · 7405 阅读 · 0 评论 -
Matplotlib属性及注解
标题原创 2022-05-25 22:59:48 · 1180 阅读 · 0 评论 -
Matplotlib模块--子模块及画图
Matplotlib的核心是面向对象的。如果需要对绘图进行更多的控制和自定义,建议直接使用对象。许多情况下,创建一个 Figure,一个或多个 Axes 使用pyplot.subplots。Matplotlib子模块matplotlibmatplotlib.afmmatplotlib.animationmatplotlib.artistmatplotlib.axes:包含大多数图形元素: Axis , Tick , Line2D , Text , Polygon 等,并设置坐标系。matpl原创 2022-04-28 22:00:04 · 824 阅读 · 0 评论 -
matplotlib颜色、标记、线类型
fmt 参数fmt 参数定义了基本格式,如标记、线条样式和颜色。fmt = ‘[marker][line][color]’import matplotlib.pyplot as pltimport numpy as npypoints = np.array([6, 2, 13, 10])plt.plot(ypoints, 'o:r')plt.show()例如 o:r,o 表示实心圆标记,: 表示虚线,r 表示颜色为红色。颜色、标记、线类型标记类型使用 plot() 方法的 mark原创 2022-01-19 23:06:34 · 2432 阅读 · 0 评论 -
Numpy数组
数组可以进行批量操作而无需for循环,这种特性为向量化。 arr = np.array([[1, 2, 3], [4, 5, 6]]) result1 = arr * arr result2 = arr - arr result3 = 1 / arr result4 = arr ** 0.5 print(result1) print(result2) print(result3) print(result4)结果:[[ 1 4 9]原创 2021-12-23 21:22:13 · 528 阅读 · 0 评论 -
Numpy生成数组
虽然NumPy提供了数值数据操作的计算基础,但大多都把pandas作为统计、分析的基石,尤其是针对表格数据。pandas提供了更多的针对特定场景的函数功能,例如时间序列操作等NumPy等并不包含的功能。NumPy:它的设计对含有大量数组的数据非常有效。在内部将数据存储在连续的内存块上。NumPy的算法库是C语言写的,在操作内存时,不需要任何检查或管理操作。NumPy数组使用的内存量也小于其他Python内建序列。NumPy可以针对全量数组进行复杂计算而不需要写Python循环。ndarray:原创 2021-12-22 21:56:58 · 4993 阅读 · 0 评论 -
Anaconda安装
一、什么是Anaconda?Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。二、Anaconda、conda、virtualenv的区别1. Anaconda其包含的科学包包括:conda, numpy, scipy, ipython notebook等。2. condaconda是包及其依赖项和环境的管理工具。适用语言:Python, R, Ruby, Lua原创 2021-08-26 00:06:18 · 368 阅读 · 1 评论 -
sklearn scikit-learn
sklearn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。sklearn拥有可以用于监督和无监督学习的方法。sklearn中的大部分函数可以归为估计器(Estimator)和转化器(Transformer)两类。包含以下子模块:分类:SVM,最近邻,随机森林,逻辑回归等回归:Lasso,岭回归等聚类:k-means,谱聚类等降维:PCA,特征选择,矩阵分解等模型选择:网格搜索,交叉验证,指标矩阵预处理:特征提取,正态化scipy.opt原创 2021-12-16 21:58:35 · 3758 阅读 · 0 评论 -
python数据分析模块
python可以做数据分析,主要包括numpy,scipy,pandas,matplotlib,scikit-learn等等诸多强大的模块,在结合上ipython交互工具 ,以及python强大的爬虫数据获取能力,字符串处理能力NumPy(Numerical Python的简称)是高性能科学计算和数据分析的基础包。NumPy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。可以利用这种数组对整块数据执行一些数学运算,比python自带的数组以及元组效率更高,其语原创 2021-08-26 21:48:04 · 2167 阅读 · 0 评论