![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas数据分析
文章平均质量分 90
zly717216
人生苦短,我用python
展开
-
numpy 给力教程
数据神器 — numpy导入numpy库import numpy as np并查看numpy版本np.__version__'1.21.2'numpy ndarray n dimension array,ndarray不是真正的矩阵,一切皆矩阵一、创建ndarray1.由python list创建l = [1, 2, 3, 4]n = np.array(l)narray([1, 2, 3, 4])n[0] = 8narray([8, 2, 3, 4])注意:原创 2021-10-13 20:33:45 · 6350 阅读 · 0 评论 -
jupyter的使用
jupyter 的使用一、启动程序执行命令:jupyter notebook注意以下几点:打开地址为当前bash的目录,默认的根目录浏览器地址为 http://localhost:8888/通过control -C终止jupyter程序几个基本操作:DD:删除当前cellM:转为markdown文档markdown文档下运行变为预览模式二、IPython的帮助文档1. 使用help()通过help命令来获得帮助文档help(len)Help on built-in f原创 2021-10-13 20:30:48 · 6962 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(五)
pandas的拼接操作pandas的拼接分为两种:级联:pd.concat, pd.append合并:pd.mergeimport numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt0. 回顾numpy的级联============================================练习12:生成2个3*3的矩阵,对其分别进原创 2021-10-13 20:22:42 · 6484 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(四)
pandas层次化索引import numpy as npimport pandas as pdfrom pandas import Series, DataFrame1. 创建多层行索引1) 隐式构造最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组data = np.random.randint(0,150, size=(6,6))index = [['一班', '一班', '一班', '二班', '二班', '二班'], ['张三', '李四', '王五原创 2021-10-13 20:21:39 · 6601 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(三)
Pandas处理丢失数据有两种丢失数据:Nonenp.nan(NaN)1. NoneNone是Python自带的,其类型为python object。因此,None不能参与到任何计算中。object类型的运算要比int类型的运算慢得多计算不同数据类型求和时间%timeit np.arange(1e5,dtype=xxx).sum()2. np.nan(NaN)np.nan是浮点类型,能参与到计算中。但计算的结果总是NaN。但可以使用np.nan*()函数来计算nan,此时视na原创 2021-10-13 20:20:25 · 6303 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(七)
Pandas绘图Series和DataFrame都有一个用于生成各类图表的plot方法。默认情况下,它们所生成的是线形图线形图简单的Series图表示例,plot()import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt%matplotlib inlineplot()线形图反映的是趋势.s = Series(data=np.ra原创 2021-10-13 19:50:48 · 6405 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(六)
import pandas as pdfrom pandas import Series,DataFrameimport numpy as nppandas数据处理1、删除重复元素def make_df(index, cols): df = DataFrame({col: [col + str(i) for i in index] for col in cols}) df.index = index return dfdf = make_df([1,2,3,4],原创 2021-10-13 19:46:23 · 6495 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(二)
Pandas数据加载pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,期中read_csv和read_table这两个使用最多使用read_csv将其读入import pandas as pdfrom pandas import Series,DataFrameimport numpy as nppd.read_csv('./data/SMSSpamCollection', sep='\t', header=None) # separator 默认 是,原创 2021-10-13 19:31:08 · 8381 阅读 · 0 评论 -
pandas数据分析给力教程【完整版】(一)
Pandas的数据结构导入pandasfrom pandas import Series1、SeriesSeries是一种类似于一维数组的对象,由下面两个部分组成:values:一组数据(ndarray类型)index:相关的数据索引标签1)Series的创建两种创建方式:(1) 由列表或numpy数组创建,默认索引为0到N-1的整数型索引由列表创建l = [1,2,3,4,5]s = Series(l, index=list('abcde'))sa 1b原创 2021-10-13 19:19:55 · 6463 阅读 · 0 评论