分析
文章平均质量分 71
用python做简单的数据分析
Banana忍冬
这个作者很懒,什么都没留下…
展开
-
【python】数据可视化1:matplotlib
matplotlib模块可以数据制作成图表的形式展示,更直观的看到数据的趋势和分布。在matplotlib模块中默认不显示中文且负号由方块表示,要声明中文字体显示和负号。柱形图和条形图柱状图:常用于数据的比对,使用bar()传入x轴和y轴数据绘制。附加的参数width和color可以指定柱形图柱子的宽度和颜色。import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #设置中文字体(字体的英文原创 2021-07-23 17:17:05 · 572 阅读 · 6 评论 -
【python】PyMySQL和pandas操作数据库
目录使用PyMySQL模块操作数据库使用pandas进一步操作数据库to_sql()把DataFrame数据存回数据库使用PyMySQL模块操作数据库下载并安装pymysql模块。使用connect()函数连接到数据库。host、port为连接本地MYSQL数据库的IP和端口。user、password为登录本地MYSQL的账号和密码。database指定读取哪个数据库。charest设置数据编码。import pymysqlconn = pymysql.connect(ho原创 2021-07-21 22:02:36 · 4175 阅读 · 4 评论 -
【python】read_html()处理网页中的表格数据
read_html()从网页中识别<table>读取表格类数据。可识别对象包括有:网址、本地HTML文档、request模块得到的响应对象的文本。注意read_html()返回一个DataFrame类型的列表,每一项代表网页中的一个<table>,可用切片方式指定提取第几个表格。参数io参数match参数flavor参数header参数index_col参数encoding...原创 2021-07-20 20:18:10 · 1721 阅读 · 2 评论 -
【python】NumPy模块快速介绍
NumPy模块提供了数组,方便进行数据的计算,运算效率比列表的高。目录创建数组查看数组信息创建数组简单创建:array()import numpy as np# 创建一维数组# 数组中元素用空格分开a = np.array([1,2,3,4])# 创建二维数组b = np.array([1,2], [3,4])等差创建:arrange()import numpy as np# 创建 起始为1, 步长为2,结束值<=20 的等差数列# 不指定则默认 步长原创 2021-07-03 17:42:08 · 110 阅读 · 0 评论 -
【python】DataFrame对象的数据处理
缺失值处理重复值处理数据排序数据筛选数据统计数值分布相关系数数据透视表原创 2021-07-10 15:41:09 · 575 阅读 · 0 评论 -
【python】pandas模块快速介绍
Series对象可理解为带行标签得一维数组,行标签对应每一组元素,有三种声明方式:不声明,默认序号 声明index参数设置序号 使用字典创建设置序号import pandas as pda# 使用默认序号s1 = pda.Series(['一','二','三'])# index设置序号s2 = pda.Series(['四','五','六'], index=['001','002','003'])# 字典设置序号s3 = pda.Series({'001':'七', '002':原创 2021-07-07 21:05:39 · 291 阅读 · 0 评论