python自学笔记之数据的获取、分析、可视化
文章平均质量分 91
worden丶
这个作者很懒,什么都没留下…
展开
-
Python数据挖掘(二)之Pandas高级处理
一、缺失值处理1、缺失值处理思路删除含有缺失值的样本替换/插补(计算平均值、中位数填入)2、如何处理NaN判断数据是否为NaN:pd.isnull(df),pd.notnull(df)存在缺失值NaN,并且是np.nan:1、删除存在缺失值的:df.dropna(axis=‘rows’,inpalce=True)2、替换缺失值:df.fillna(value,inplace=True)value:替换成的值inplace:True会修改原数据/False不替换修改原数据原创 2020-09-19 20:47:13 · 673 阅读 · 0 评论 -
Python数据挖掘(二)之Pandas
一、pandas介绍panel+data+analysis二、DataFrame1、结构:既有行索引,又有列索引的二维数组import numpy as npimport pandas as pd# 创建一个符合正态分布的10个股票5天的涨幅数据stock_change = np.random.normal(0,1,(10,5))# 添加行索引indexstock = ['股票{}'.format(i) for i in range(10)]# 添加列索引columnsdate原创 2020-09-16 22:28:40 · 606 阅读 · 0 评论 -
Python数据挖掘(一)之Numpy
一、基本操作ndarry.方法()numpy.函数名()二、ndarray与Python原生list运算效率对比import numpy as npimport randomimport time# 生成一个大数组python_list = []for i in range(10000000): python_list.append(random.random())ndarray_list = np.array(python_list)# 原生pythonlist求和原创 2020-09-15 20:27:29 · 474 阅读 · 0 评论 -
python学习笔记之一些测试代码(四)
# 测试代码1--json库的使用# 新建一个字典dic_v1 = {"confirm":500,"heal":480} #创建字典print(dic_v1)print(type(dic_v1))# 将字典dic_v1转换为字符串print("将字典dic_v1转换为字符串".center(30,'='))import jsonstr_v1 = json.dumps(dic_v1) #将字典转换为字符串print("字典转换为字符串后的值:",str_v1)print("使原创 2020-09-03 21:54:25 · 176 阅读 · 0 评论 -
python学习笔记之数据的可视化(三)
疫情数据的可视化1> matplotlib 导库命令:import matplot.pyplot as plt2> 可视化流程1.绘制画布及绘制图形 plt.figure(figsize=(8,6),dpi =80) plt.plot(x,y,color,linestyle) 参数含义:color表示颜色,颜色的单词 linestyle表示线型,- -- : -. plt.scatter(x,y,color,marker,s)原创 2020-09-03 21:48:28 · 535 阅读 · 0 评论 -
python学习笔记之数据的分析(二)
疫情数据的分析1.导入外部数据pd.read_csv('文件名') 查看数据属性:columns 列名index 行索引shape m行n列dtyps 各列的类型2.查找数据方法1:用列名直接查找df[[列名列表]]方法2:用loc查找df.loc[行取值,列取值]注意:行取值可以用逻辑值来进行映射,逻辑真(True)会返回,逻辑假(False)会去掉df.head(n) #返回前n行,默认为5行df.tail(n)原创 2020-09-03 21:40:51 · 166 阅读 · 0 评论 -
python学习笔记之数据的获取(一)
疫情数据获取 – 爬虫(requests,pandas,json) 1) 网站链接: https://wp.m.163.com/163/page/news/virus_report/index.html?_nw_=1&_anw_=1 2) 操作步骤: 1.打开开发者工具(在网页浏览器中打开网址,按f12即可) 2.选择‘network’面板,设置类型为‘xhr’类型,刷新页面 3.点击以‘list-total’开头的链接,查看headers和preview面板 hea原创 2020-09-03 21:15:54 · 2728 阅读 · 0 评论