自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 逻辑回归(Logistic Regression)

一、什么是逻辑回归  机器学习算法三要素:模型、参数、目标函数。      1.模型   设X是连续随机变量,x服从logistic分布是指其具有下列分布函数和密度函数:F(x)=P(x≤x)=11+e−(x−u)/γf(x)=F′(x)=e−(x−u)/γγ(1+e−(x−u)/γ)2  逻辑回归模型是如下的概率分布:P(y=1|x)=e(

2017-11-30 15:25:58 146805 1

原创 numpy np.repeat 与 np.tile的区别, numpy.ravel()函数

二者执行的是均是复制操作;np.repeat:复制的是多维数组的每一个元素;np.tile:复制的是多维数组本身;1. np.repeatx = np.arange(1, 5).reshape(2, 2)print xprint np.repeat(x, 2)print np.tile(x,(5,1))print np.tile(x,(5,))结果:[[1 2]

2017-11-30 13:54:13 2276 1

原创 python中的list和array的不同、from…import

python中的list是python的内置数据类型,list中的数据类不必相同的,而array的中的类型必须全部相同。在list中的数据类型保存的是数据的存放的地址,简单的说就是指针,并非数据,这样保存一个list就太麻烦了例如list1=[1,2,3,'a']需要4个指针和四个数据,增加了存储和消耗cpu。1、numpy中封装的array有很强大的功能,里面

2017-11-30 09:59:01 6472 1

原创 python--数据清洗

1.数据错误:错误类型– 脏数据或错误数据• 比如, Age = -2003– 数据不正确• ‘0’ 代表真实的0,还是代表缺失– 数据不一致• 比如收入单位是万元,利润单位是元,或者一个单位是美元,一个是人民币– 数据重复2.缺失值处理:处理原则1)缺失值少于20%•连续变量使用均值或中位数填补•分类变量不需要填补,

2017-11-28 14:18:16 3293

原创 pandas 学习(一)

1、pandas 学习(一) —— read_csv ,read_excel对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型;data = pd.read_csv(file_name) # 数据文件路径,从文件读取数据返回 DataFrame 4. 基本成员函数df.dtypes:会按列给出各个列的数据类型;df.

2017-11-28 10:48:26 684

转载 Python 第三方库的安装

第一步:下载第三方库本文以用于解析excel的xlrd为例,下载地址为:https://pypi.python.org/pypi/xlrd,下载版本为 xlrd-0.9.4.tar.gz第二步:解压下载到的安装包文件本文解压后的目录为D:\\xlrd-0.9.4第三步:配置环境变量:以windows 7为例,右键点击计算机,选择属性,在弹出的对话框中选择高级

2017-11-09 09:11:59 2714

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除