- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 python/pandas/numpy(十二)数据加载、存储与文件格式
基本命令pd.read_csv('1.txt')只想读几行文本文件pd.read_csv('1.txt', nrow=5)要逐块读取文件,需要设置chunksize(行数)chunker=pd.read_csv('1.txt',chunksize=1000)写出到文本文件(以逗号分隔的文件)data.to_csv('1.txt')当然可以使用其他分隔符data.to_csv('1.txt', sep
2016-12-29 16:27:18 2492
原创 python/pandas/Numpy数据分析-统计描述,唯一值,值计数
pandas 对象拥有一组常用的数学和统计方法,大部分属于简约统计,用于从Series中提取一个值,或者从DataFrame中提取一列或者一行Series注意:与NumPy数组相比,这些函数都是基于没有缺失数据的建设构建的,也就是说:这些函数会自动忽略缺失值。count 非 NA 值的数量 describe 针对 Series 或 DF 的列计算汇总统计 min , max 最小值和最
2016-12-29 10:23:51 12710
原创 python/pandas/numpy数据分析(十)-函数, rank,重复索引
DataFrame的apply方法,将函数应用到行或者列形成的一维数组上.frame=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['Utha','Ohio','Texas','Oregon']) frame . b d e Utha -0.683356 -0.577942 -0.022012
2016-12-28 15:02:34 16223 1
原创 python数据分析(九)-点积与线性代数
参考网址:http://www.cnblogs.com/begtostudy/archive/2010/08/03/1790935.htmlb=np.arange(15) print(b)[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14]b.reshape(3,5)Out[32]: array([[ 0, 1, 2, 3, 4], [
2016-12-27 13:28:58 587
原创 回归,将要继续更新博文
前一两个月一直在出差,没有时间更新博客,现正式回归,还是喜欢平静的家庭生活,还有两周就要第一次当爸爸了,工作之余也没闲着,看了很多生孩子坐月子的书,愿一切平安!
2016-12-26 21:51:52 436
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人