自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 提问pandas read_html相关方面技术

求大神解答一下,我尝试用read_html读取这个网http://www.pbc.gov.cn/eportal/fileDir/defaultCurSite/resource/cms/2015/07/2014s03a.htm但是运行之后提示No Table Found,如果直接读取htm文件的话是一个列表,转换成DataFrame的话只有一列,实在不知道怎么弄,跪求大神解答一下,小白感激不敬。...

2020-03-15 16:34:50 230

原创 利用python进行数据分析第八章学习笔记

第8章,数据规整:聚合、合并和重聚8.1层次化索引(hierarchical indexing)通俗易懂点就是设置多列索引,能使你在单个轴上设置多个索引。抽象点来说,就是能使你以低维度形式处理高纬度数据。data = pd.Series(np.random.randn(9), index=[['a', 'a', 'a', 'b', 'b', 'b, 'c', 'c', 'c'],[1,2,...

2020-03-10 19:29:35 265

原创 利用python进行数据分析第四章学习笔记

Numpy基础基础功能:1.ndarray,一个具有矢量运算和复杂广播能力的快速且节省空间的多维数组。2,用于对整组数据进行快速运算的标准数学函数(无需编写循环)。3,用于读写磁盘数据的工具以及用于操作内存映射文件的工具。4,线性代数,随机数生成以及傅里叶变换。5,用于集成C、C++、Fortran等语言编写的的代码A C API。import numpy as npdata = ...

2020-03-09 12:34:39 282

原创 利用python进行数据分析第七章回顾笔记

第七章,数据清洗与准备一,处理缺失数据对于数值数据,pandas使用浮点值NaN表示缺失数据(哨兵值),可以使用pandas.isnull()方法检测。常用的方法有dropna()对缺失数据进行过滤,fillna()用指定值或插值方法(ffill、bfill)填充缺失数据。滤除缺失数据的办法有很多种data.dropna()或者data[data[notnull()],dropna()会默认...

2020-03-08 16:52:28 473

原创 利用python进行数据分析第六章回顾笔记

第六章主要讲解数据加载、存储与文件格式一,读取文本格式的数据主要包括有以下几个函数:1.read_csv(从文件、URL、文件类型对象中加载带分隔符的数据。默认分隔符为逗号)2.read_table(从文件、URL、文件类型对象中加载带分隔符的数据。默认分隔符为制表符)3.read_excel(读取EXCEL的表格数据)4.read_hdf(读取Pandas写的HDF5文件)5.re...

2020-03-07 17:12:24 420

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除