机器学习
文章平均质量分 68
Cvjark
计算机专业学生
展开
-
利用随机森林进行特征选择
例子是wine数据集: http://archive.ics.uci.edu/ml/machine-learning-databases/wine/ 之所以可以利用随即森立来进行特征筛选是由于决策树的特性,因此我们可以利用所有决策树得到的平均不纯度(基尼系数)衰减来量化特征的重要性。根据重要性可以剔除相关度很低的特征,精简模型。 接下来直接进入代码:import pandas as pd...原创 2018-09-15 19:29:39 · 10321 阅读 · 4 评论 -
初探强化学习:置信区上界解决多臂老虎机问题
强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,**强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。**这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、仿真优化、多主体系统学习、群...原创 2018-09-18 13:56:27 · 978 阅读 · 0 评论 -
UCI库中Mines vs. Rocks的数据集属性可视化展示
数据集描述: 从各种不同的纵横角度获得的信号,每个样本有60个从不同地点接收到的仪器测量值(每个模式是一组60个数字,范围为0.0到1.0),最后一个标记岩石(R)和水雷(M) 任务是根据声纳返回的测量信息,进行分类,从而发现未爆炸的水雷。data_url = "http://archive.ics.uci.edu/ml/machine-learning-databases/undocum...原创 2018-09-13 20:00:38 · 928 阅读 · 0 评论 -
降维:特征选择与特征提取
对于降维,我看可以简单理解为减少数据的维度,说白了就是减少变量个数。文末的视频墙裂推荐观看一下。特征选择: 不改变变量的含义,仅仅只是做出筛选,留下对目标影响较大的变量。Backward Elimination(反向淘汰)Forward Selection(正向选择)Bidirectional Elimination(双向淘汰)Score Comparison(信息量比较)前面三种...原创 2018-09-24 01:48:46 · 6389 阅读 · 0 评论 -
鲍鱼数据集的可视化展示
写在开头:这篇文章有别于上次的岩石与雷的分类问题,是个回归数据集的展示。我们将运用到之前的工具对这个数据集进行一些可视化。 关于数据集:数据集的来源同样是UCI库。 性别(M,F,I)由于鲍鱼年幼时分辨不出该属性,所以有三个类别。 长度 单位毫米 直径 单位毫米 高度 单位毫米 总重量 剥壳重量 内脏重量 壳重 环的数量 (整型 +1.5用于预测鲍鱼年龄) ...原创 2018-09-14 11:09:23 · 8369 阅读 · 1 评论 -
一个简单的自然语言处理例子
例子是我学习的教程的一个例子,收集了一些客户对于饭店的评价,目标是将他们进行分类,分成好评和差评。数据的前5项:这里用到了一个之前没用到的包NLTK对我们的文本数据进行必要的处理,转化,使其变成能够进入我们模型的数据,本文针对一个例子进行介绍,详细可以查看官方文档对于这个包的说明。NLTK的介绍:NLTK是一个高效的Python构建的平台,用来处理人类自然语言数据。它提供了易于使用的接口...原创 2018-09-20 21:30:43 · 8951 阅读 · 3 评论 -
Kaggle房价预测案例(附数据集)
数据集链接import pandas as pdimport numpy as nptrain_data = pd.read_csv('train.csv',index_col = 0)test_data = pd.read_csv('test.csv',index_col = 0)train_data.head()train_y_test = train_data['SalePr...原创 2018-09-26 16:26:51 · 18962 阅读 · 21 评论 -
构造一个神经网络对银行客户流失做一个分析
例子及数据集是某套教程(避嫌)里的内容,做下记录,个人认为,亲自实现代码可以增强学习效果。**情境:**某家银行发现进来他们的客户流失比较严重,处于业务需要,现在他们将收集的客户资料,希望通过分析得到未来一段时间内客户断掉跟这家银行的业务来往的可能性,从而做出适当的挽留措施。现在他们收集了客户的ID、姓名、信用得分、地区位置、性别、年龄、业务往来时长、存款、购买的业务数、是否拥有信用卡、是...原创 2018-09-22 02:18:25 · 2362 阅读 · 1 评论