- 博客(11)
- 资源 (9)
- 收藏
- 关注
原创 数据分析之通过集成提高算法
一、算法集成方法¶ 1.装袋(Bagging):通过给定组合投票的方式,获得最优解。比如你生病了,去n个医院看了n个医生,每个医生给你开了药方,最后的结果中,哪个药方的出现的次数多,那就说明这个药方就越有可能性是最由解,这个很好理解。而bagging算法就是这个思想。 2.提升(Boosting):一种
2018-01-28 11:49:23 786
转载 数据分析之预测模型项目模板
机器学习是一项经验技能,经验越多越擅长。不能只通过阅读就能掌握机器学习的技能,需要大量的练习才能掌握。在这里将介绍一个通用的引入机器学习的六个步骤。通过本篇文章将学到: 1.端到端的预测模型的项目结构 2.如何将前面学到的内容引入到项目中 3.如何通过这个项目模版来得到一个高准确度的模型一、 在项目中实践机器学习 从端到端
2018-01-27 10:39:14 7218
原创 数据分析之审查回归算法
一、线性算法1.线性回归 1.1 原理 :y = ax +b的升级版。 1.2 适用场景 :普遍适用,简单粗暴的算法2.岭回归 2.1 原理 :改良的最小二乘估计法
2018-01-27 09:23:10 893
原创 树莓派安装mqtt服务器
零、缘起 看到目前各大云平台都搭建自己的mqtt服务器,本想直接用作项目。奈何算了下成本,实在太贵。尝试自己搭建mqtt服务器,遂拿尘封已久的树莓派进行测试。一、安装wget -c https://github.com/eclipse/mosquitto/archive/v1.4.11.tar.gztar zxvf v1.4.11.tar.gz
2018-01-26 18:40:08 7033
原创 数据分析之审查分类算法
一、算法审查对于当前数据集,寻找最优算法没有最好的分类器,只有最合适的分类器。随机森林平均来说最强,但也只在9.9%的数据集上拿到了第一,优点是鲜有短板。SVM的平均水平紧随其后,在10.7%的数据集上拿到第一。神经网络(13.2%)和boosting(~9%)表现不错。数据维度越高,随
2018-01-21 19:03:43 1258
原创 数据分析之算法评估矩阵
一、算法评估矩阵目的:合理有效的评估算法,寻找最适合的算法和参数二、分类算法矩阵2.1 分类正确率:分对了多少In [6]:from pandas import read_csvfrom sklearn.model_selection
2018-01-20 11:38:37 1745
原创 数据分析之评估算法
一、分离训练数据集和评估数据集In [9]:# 通过卡方检验选定数据特征import pandasfrom pandas import read_csvfrom sklearn.preprocessing import LabelEncoderfrom sklearn.model_selection import train_test_split
2018-01-14 12:17:33 4229
原创 数据分析之特征选择
一、数据驱动1.相关性:皮尔逊系数In [1]:from numpy.random import randnimport numpy as npfrom scipy.stats.stats import pearsonr1.随机数据:相关性也很随机
2018-01-14 10:44:14 2622
原创 数据分析之数据清洗
一、数据导入In [144]:#读取数据import matplotlib.pyplot as plt%matplotlib notebookimport seaborn as sns #要注意的是一旦导入了seaborn,matplotlib的默认作图风格就会被覆盖成seaborn的格式import pandasusers=pandas.re
2018-01-07 14:07:34 2418
原创 数据分析之理解数据
一、数据导入In [8]:import pandasfrom pandas import set_option#括号里面直接指定了数据的来源,当然你也可以按照老师视频中所讲授的来操作iris = pandas.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/iri
2018-01-01 17:56:39 3166
力控能源管理系统介绍说明
2022-10-29
华盛顿大学机器学习:案例研究01
2017-10-07
PYTHON QT GUI快速编程 PYQT编程指南
2017-09-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人