- 博客(7)
- 资源 (18)
- 问答 (4)
- 收藏
- 关注
原创 最佳特征筛选与feature_selection
本文介绍的是如何利用scikit learn中的feature_selection模块来筛选最佳特征。1.读取数据并进行填充titanic=pd.read_csv('./titanic.txt')# print titanic.head()# print titanic.info()#分离数据特征与预测目标y=titanic['survived'] # 提取出survived
2018-01-20 10:53:55 2808
原创 用pandas处理缺失值补全及DictVectorizer特征转换
下面介绍的是用pands读取泰坦尼克遇难船员的数据,然后挑选特征,补全缺失值,特征转换。1.pands读取数据titanic=pd.read_csv('./titanic.txt')其数据形式如下: row_num pclass survived name age embarked home.dest room ticket boat sex 3 1
2018-01-19 10:03:17 4410
原创 Scikit-learn——LogisticRegression与SGDClassifier
1.sklearn.linear_model.logistic regression一般来说,逻辑回归用梯度下降算法来求解参数比较常见;所以这也导致一开始误以为LogisticRegression模型就是用梯度下降算法来实现的,当遇到SGDClassifier(Stochastic Gradient Descent)随机梯度下降分类器的时候,就有点蒙了。梯度下降明明是一个求解算法,怎么就和分类器扯上
2018-01-18 20:27:17 12697 2
原创 Scikit-learn CountVectorizer与TfidfVectorizer
本文主要介绍两个类的基本使用,CountVectorizer与TfidfVectorizer,这两个类都是特征数值计算的常见方法。对于每一个训练文本,CountVectorizer只考虑每种词汇在该训练文本中出现的频率,而TfidfVectorizer除了考量某一词汇在当前训练文本中出现的频率之外,同时关注包含这个词汇的其它训练文本数目的倒数。相比之下,训练文本的数量越多,TfidfVectoriz
2018-01-18 10:54:42 26978 14
原创 如何用pandas读取CVS格式数据
本文主要介绍的是如何利用pandas来读取CVS格式的数据 CVS格式指的是:每个元素之间均已逗号隔开,不管文件后缀名是什么,例如.txt,.data等等如#x.txt1,2,34,5,6----------------------------------------------------------column_name=['A','B','C']t=pd.read
2018-01-10 16:21:57 3850
原创 Scikit-learn——Decision Tree(Classifier)
本文主要介绍一下sklearn中分类决策树的简单用法。决策树优点: 1.简单易于理解,能够可视化; 2.训练集规模不大,值得注意的是该模型不接受缺失值; 3.使用代价仅为训练样本数取对数; 4.既能够处理数值型数据集(numerical)也能够处理标签型(categorical)数据集 5.能够处理多输出问题; 6.能够用布尔逻辑来表示一种情况的决策过程,不像神经网络完全黑箱; 7.性
2018-01-08 20:36:48 3534
原创 决策树——(三)决策树的生成与剪枝CART
前面两篇文章分别介绍了用ID3和C4.5这两种算法来生成决策树。其中ID3算法每次用信息增益最大的特征来划分数据集,C4.5算法每次用信息增益比最大的特征来划分数据集。下面介绍另外一种采用基尼指数为标准的划分方法,CART算法。1. CART算法分类与回归算法(Classification and Regression Tree,CART),即可以用于分类也可以用于回归,是应用广泛的决策树
2018-01-04 21:09:10 2146
神经网络与深度学习
2017-09-24
deeplearning
2017-09-10
Dell inspiron 15r 5537安装Ubuntu 开机提示低显卡模式?
2015-06-05
Linux 中,普通用户获得临时root 之后,是否和超级用户一样?
2015-06-04
C语言关于char分配内存的问题
2015-06-04
C++中,定义的数组怎么由输入来确定维度
2014-12-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人