数据分析学习
文章平均质量分 77
陌小柠
你应该去山顶看看
各自努力,顶峰相见
展开
-
【Python数据分析】之可视化Seaborn库
文章目录前言系列文章Seaborn绘制统计图形一、直方图二、核密度估计曲线三、绘制散布图绘制双变量分布四、绘制二维直方图五、核密度估计绘制成对的双变量分布六、多个成对的双变量分布前言Python数据分析结课了,即将结束复习考试,往期记录的只是自己的学习部分,沧海一粟而已,不要停止学习想继续学习的小伙伴可以参考《Python数据分析与应用》和系列文章系列文章Python数据分析之复习知识点Python之Series和DataFrame的数据排序Python之Numpy(二)Python之原创 2022-05-18 20:08:17 · 1559 阅读 · 4 评论 -
【Python数据分析】之数据合并的concat函数与merge函数
文章目录系列文章一、concat函数1)横向堆叠与外连接横向堆叠合并df1和df2,采用==外连接==的方式2) 纵向堆叠与内链接二、merge()函数三、join函数1)根据行索引合并数据2)合并重叠数据系列文章Python之Series和DataFrame的数据排序Python数据分析之复习知识点一、concat函数concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并参数含义如下:参数作用axis表示连接的轴向,可以为0或者原创 2022-05-14 15:18:33 · 8883 阅读 · 31 评论 -
Python数据分析之复习知识点
文章目录系列文章一、判断题二、填空题系列文章Python数据分析之理论知识也是比较理论类的知识点,可以看看一、判断题副本与视图是使用原数组数据的两种方式。副本产生的数据在内存单独开辟新空间,视图指向的数据与原数组对象属于一个内存空间。(√)sdecimal()方法仅用于判断字符串中的单个字符是否是十进制数,isdigit()判断十进制、二进制、全角数字是否是数字,(√)isnumeric()判断十进制、全角数字、汉字数字是否是数字。(√)Matplotlib绘制的图都是由二维坐标、三维坐标原创 2022-05-04 20:03:34 · 2066 阅读 · 1 评论 -
Python之Series和DataFrame的数据排序
Series和DataFrame的数据排序文章目录Series和DataFrame的数据排序前言系列文章环境:jupyter Notebook(Anaconda)一、 算术运算与数据对齐1. 创建数组obj_one2. 没有对齐的位置会用NaN进行补齐3. 没有对齐的位置直接加上二、Series排序1. 创建数组ser_obj2. 按索引排序3. 按索引降序三、DataFrame排序1.创建数组df_obj2. 按索引排序3. 按索引降序排序4. 按值排序5. 按values值排序7.按第2列索引排序前原创 2022-04-26 21:13:42 · 2558 阅读 · 0 评论 -
Python之pandas(三)
文章目录前言系列文章环境:jupyter Notebook(Anaconda)一、Series的索引操作1.创建数组2.使用索引位置来获取数据3. 使用索引名称来获取数据4. 使用位置索引进行切片5. 使用索引名称进行切片6. 通过不连续位置索引获取数据,(==两个中括号==)7. 通过不连续索引名称获取数据8. 布尔型索引,返回与模板中True位置对应的元素9.通过数据类型索引获取数据集二、DataFrame的索引操作1. 创建数组2. 通过列索引进行切片3. 查看数据类型4. 使用不连续列索引名称获取数原创 2022-04-26 10:58:02 · 2003 阅读 · 7 评论 -
Python数据分析之理论知识
文章目录Python数据分析概述一、数据分析的概念1.广义数据分析2.数据挖掘二、数据分析流程1. 需求分析:2. 数据获取3.数据预处理4.分析与建模5.模型评价与优化6. 分类模型评价指标7.回归模型8.部署三、数据分析应用场景四、总思维导图Python数据分析概述一、数据分析的概念1.广义数据分析狭义数据分析对比分析分组分析交叉分析回归分析等2.数据挖掘智能推荐关联规则分类模型聚类模型二、数据分析流程1. 需求分析:主要指从用户原创 2022-04-24 19:09:28 · 4174 阅读 · 6 评论 -
Python之Numpy(三)
Python之Numpy(三)文章目录Python之Numpy(三)一、数组的统计运算1. 求总和2. 平均值3. 最大值4. 所有元素的累计和二、数组其他处理1. 数组排序2.检查数组元素3. unique()函数4. in1d()函数5. 矩阵数组6.矩阵相乘7. 返回方阵的对角线8. 计算对角线元素和一、数组的统计运算import numpy as nparr=np.arange(10)arr1. 求总和arr.sum() #总和2. 平均值arr.mean()原创 2022-04-17 17:37:59 · 1246 阅读 · 4 评论 -
Python之Numpy(二)
文章目录一、数组广播1. 创建arr12.创建arr23.数组加法运算二、数组与标量之间的运算1. 与标量相加2. 与标量相乘三、ndarray的索引和切片1. 创建数组2.通过索引访问3.通过切片访问4.创建arr2d四、花式(数组)索引的基本使用1. 创建二维数组2. 通过切片访问3. 通过索引访问五、布尔型索引的使用1.创建student_name2.创建student_score3. 数组的转置和轴的对称4. 数组的转置5. reshape函数6.transpose函数7.swapaxes函数一、原创 2022-04-16 16:54:14 · 667 阅读 · 0 评论 -
python之Numpy
科学计算库Numpy文章目录科学计算库Numpy环境:jupyter Notebook(Anaconda)一、认识NumPy数组对象1. 引入numpy库2. 将0-12按3行4列排序3. 数据类型4. 数组维度的个数5. 数组的维度6. 数组元素的个数7. 数组元素类型二、创建NumPy数组1. 创建NumPy数组2. zeros()函数3. ones()函数4. empty()函数5. arange()函数三、ndarray对象的数据类型1. 建立int类型数组2. 转换为float数据类型3. 建立原创 2022-04-16 14:15:16 · 616 阅读 · 0 评论 -
Python之pandas(二)
Python之pandas(二)环境:jupyter Notebook(Anaconda)1.引入pandas库和numpy库import pandas as pd import numpy as np2. 读取文件信息file=open('D:/北京地区信息.csv')file_data=pd.read_csv(file) #读取文件信息file_datafile1=open('D:/天津地区信息.csv')file1_data=pd.read_csv(file1)原创 2022-04-02 22:41:07 · 1793 阅读 · 2 评论 -
Python之Pandas
Python之pandas环境:jupyter Notebook(Anaconda)1.引入pandas库和numpy库import pandas as pd import numpy as np2. 读取文件t1=pd.read_excel('D:\scores.xlsx',header=[0,1],index_col=0) #读取文件t1#index_col 接收int、sequence或者False。表示设定的列作为行名,如果是一个数列,则是多重索引,默认为None3. i原创 2022-04-02 21:06:45 · 8479 阅读 · 0 评论 -
Python安装pymysql
Anaconda安装pymysql环境:jupyter Notebook(Anaconda)1. 未安装pymysql2. 打开cmd(命令提示符)3. 出现错误开始我简单粗暴的直接在cmd中输入,然后出现了404错误,提示我conda的配置状态权限有问题。( 第13行中view your configuration’s current state)//有一点点小挫败,但是作为一名计算机的专业人员,噢,不,作为一名计算机的小白,怎么可以轻易的被一个环境配置问题打倒!!conda insta原创 2022-04-01 16:03:03 · 8742 阅读 · 1 评论 -
python之Matplotlib
python之Matplotlib环境:jupyter Notebook(Anaconda)1.pyplot中的基础绘图语法import numpy as npimport matplotlib.pyplot as pltdata=np.arange(0,1.1,0.01)plt.title('lines')plt.xlabel('x') #添加x轴的名称plt.xlabel('y') #添加y轴的名称plt.xlim((0,1))原创 2022-03-29 20:45:02 · 2713 阅读 · 0 评论