- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 pandas使用笔记
dates=pd.date_range('20160728',periods=6) #创建固定频度的时间序列df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) #创建6*4的随机数,索引,列名称。df2=pd.DataFrame({'A':pd.Timestamp('20160728'),'B':pd.Se
2016-11-07 22:05:32 1115
原创 利用python做数据分析(六)-reindex
参考文档:http://pda.readthedocs.io/en/latest/chp5.html http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reindex.htmlDataFrame.reindex(index=None, columns=None, **kwargs) reindex 函数的
2016-11-07 16:50:33 30083 2
原创 利用python做数据分析(五)-读取合并多个文件
pieces=[]columns=['name','sex','births']for year in range(1880,2011): path=('C:\\Users\\ecaoyng\\Desktop\\work space\\Python\\py_for_analysis\\pydata-book-master\\ch02\\names\\yob%d.txt' % year)
2016-11-06 17:43:52 9420
原创 利用python做数据分析(四)-数据合并
参考链接:http://pandas.pydata.org/pandas-docs/stable/merging.htmlmerge用于通过一个或多个键将两个数据集的行连接起来,类似于 SQL 中的 JOIN。该函数的典型应用场景是,针对同一个主键存在两张包含不同字段的表,现在我们想把他们整合到一张表里。在此典型情况下,结果集的行数并没有增加,列数则为两个元数据的列数和减去连接键的数量。 on=N
2016-11-06 12:17:40 15797
原创 利用python做数据分析 札记(一)
因为自己对商业非常感兴趣,最近听了好多关大数据、BI等数据挖掘的讲座,很感兴趣,结合自己的技术背景与兴趣,志在讲自己的后半生布道在python,大数据、数据挖掘的路上。故心血来潮的想回顾一下python,并自学一下python的数据挖掘功能,作为笔记供自己参考并分享给大家。因为工作的关系之前一直用eclipse做python的IDE开发环境,最近潜心数据挖掘,发现好多任用IPython和Anacon
2016-11-03 21:40:49 1344
原创 利用python做数据分析 札记(二)
实验环境:Anaconda-> Jupyter 参考数据:利用python进行数据分析 python版本 3.5.2 所有的源文件和所需的数据地址是http://download.csdn.net/detail/liangjbdd/8842239#commentpath='C:\\Users\\ecaoyng\\Desktop\\work space\\Python\\py_for_analy
2016-11-03 21:16:01 1408
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人