自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 python数据分析(应用数据库)

本文介绍主题如下:基于sqlite3的轻量级访问通过pandas访问数据库SQLAlchemy的安装与配置通过SQLAlchemy填充数据库通过SQLAlchemy查询数据库Pony ORMDataset:懒人数据库PyMongo与MongoDB利用Redis存储数据Apache Cassandra1、基于sqlite3的轻量级访问SQLite是一款非常流行的关系型数据库,由于

2017-11-29 19:27:43 2968

原创 python数据分析(数据可视化)

数据分析初始阶段,通常都要进行可视化处理。数据可视化旨在直观展示信息的分析结果和构思,令某些抽象数据具象化,这些抽象数据包括数据测量单位的性质或数量。本章用的程序库matplotlib是建立在Numpy之上的一个Python图库,它提供了一个面向对象的API和一个过程式类的MATLAB API,他们可以并行使用。

2017-11-28 10:12:13 72777 7

原创 python数据分析(数据检索、加工与存储)

1、利用numpy和pandas对CSV文件进行写操作。a):numpy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组。代码:import numpy as npnp.random.seed(42)a=np.random.randn(3,4) #生成3行4列0到1之间的随机数组a[2][2]=np.nanprint

2017-11-23 14:25:53 711

原创 python数据分析(pandas入门)

1、pandas数据结构之DataFrameDataFrame生成方式:1、从另一个DataFrame创建。2、从具有二维形状的NumPy数组或数组的复合结构生成。3、使用Series创建。4、从CSV之类文件生成。下面介绍DataFrame的简单用法:a):读取文件代码:from pandas.io.parsers import read_csvdf=read_csv(

2017-11-21 14:58:38 5736 1

原创 python数据分析(统计学和线性代数)

1、求矩阵的逆代码#coding:utf8import numpy as npA=np.mat("2 3 4; 4 2 6;10 -4 18")print "A\n",Ainverse=np.linalg.inv(A) #求矩阵的逆print "inverse of A\n",inverseprint "Check\n",A*inverse #检验相乘是否为单位矩阵pr

2017-11-19 14:58:49 1407

spark机器学习第三章数据集(MovieLens)

spark机器学习数据集MovieLens。

2017-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除