自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 logistic_regression_python

大数据时代,数据犹如一座巨大的金矿,等待我们去发掘。而机器学习和数据挖掘的相关技术,无疑就是你挖矿探宝的必备利器!工欲善其事,必先利其器。很多初涉该领域的人,最先困惑的一个问题就是,我该选择哪种“工具”来进行数据挖掘和机器学习。我这里的工具主要指的是“语言、系统和平台”。尽管之于机器学习而言,语言和平台从来都不算是核心问题,但是选择一个你所熟悉的语言和环境确实可以令你事半功倍。现在你的

2017-10-13 14:45:29 655

转载 python_pandas_dataframe_行列选择_切片操作

SQL中的select是根据列的名称来选取;Pandas则更为灵活,不但可根据列名称选取,还可以根据列所在的position(数字,在第几行第几列,注意pandas行列的position是从0开始)选取。相关函数如下:1)loc,基于列label,可选取特定行(根据行index); 2)iloc,基于行/列的position; 3)at,根据指定行index及列label,快速定位

2017-10-13 14:42:49 2640

转载 python_openpyxl_操作excel

初识与安装Openpyxl is a Python library for reading and writing Excel 2010 xlsx/xlsm/xltx/xltm files.安装?1$ pip installopenpyxl  一个简单创建例子?12

2017-10-13 14:39:40 26485 2

转载 Python_pandas_dataframe

在刚开始使用pandas DataFrame的时候,对于数据的选取,修改和切片经常困惑,这里总结了一些常用的操作。先初始化一个DateFrame做例子[python] view plain copy print?import numpy as np  import pandas as pd  df = pd.DataFrame([['Snow','M',

2017-10-13 14:35:47 287

转载 logistic_regression算法

本节不仅介绍了Logistic回归在sklearn中模型应用,还介绍了liblinear、牛顿法、拟牛顿法(DFP算法、BFGS算法、L-BFGS算法)、梯度下降、随机梯度下降等,正文如下,欢迎围观喔~~(我的字迹请大家别吐槽了,已放弃治疗,捂脸~`~)上一篇主要是学习了Logistic回归(Logistic Regression)算法笔记(一)-Python,用基础Pyt

2017-10-13 14:29:23 792

转载 卡方检验概述

前言、什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 一、四格表资料的卡方检验

2017-10-13 14:24:39 12772

转载 卡方检验原理及应用

卡方检验,或称x2检验,被誉为二十世纪科学技术所有分支中的20大发明之一,它的发明者卡尔·皮尔逊是一位历史上罕见的百科全书式的学者,研究领域涵盖了生物、历史、宗教、哲学、法律。之前做文本分类项目用过卡方值做特征选择(降维),后来听内部培训,另一个部门说他们有用卡方检验做异常用户的检测,于是就想把卡方检验再温习一次,同时把卡方检验和特征选择串起来理解。无关性假设举个例子,假设我们有一堆新闻标

2017-10-13 14:19:46 2521

转载 R语言生成虚拟变量/哑变量

在R语言中对包括分类变量(factor)的数据建模时,一般会将其自动处理为虚拟变量或哑变量(dummy variable)。但有一些特殊的函数,如neuralnet包中的neuralnet函数就不会预处理。如果直接将原始数据扔进去,会出现”requires numeric/complex matrix/vector arguments”需要数值/复数矩阵/矢量参数错误。这个时候,除了将这些

2017-10-13 14:16:25 24153 1

转载 R语言读取Excel

因为一个项目需要,原始数据全部是Excel文件,包括.xls和.xlsx格式,并且很多excel数据的格式并不规范,一个个转为csv格式不太现实,所以把所有能了解到的读取excel的方法都试了一遍,做个简单汇总。相关的包:RODBC、xlsx、openxlsx、gdata、readxl,测试平台win7。RODBC包-相关方法RODBC-odbcConnectExcel2007()

2017-10-13 14:11:23 1718

转载 R语言_卡方检验

R语言 卡方检验由 xiaoxiaogang 创建,youj 最后一次修改 2016-12-12 卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。 这两个变量应该来自相同的人口,他们应该是类似 - 是/否,男/女,红/绿等。例如,我们可以建立一个观察人们的冰淇淋购买模式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋的味道相关联。 如果发现相关性,我

2017-10-13 14:00:30 17797

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除