机器学习
chandelierds
这个作者很懒,什么都没留下…
展开
-
Kaggle机器学习实战系列之Titanic项目
**Kaggle实战系列之Titanic项目**1.引言先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)!然后push自己抽出时间来写这篇blog的原因也非常简单:写完前两篇逻辑回归的介绍和各个角度理解之后,我们讨论群(戳我入群)的小伙伴们纷纷表示『好像很高级的样纸,but 然并卵 啊!你们倒是拿点实际数据来给我们看看,这玩意儿 有!什!么!用!...转载 2018-10-19 19:28:01 · 436 阅读 · 0 评论 -
GBDT算法原理以及实例理解
这篇写的非常好,之前看了几篇都不太明白,看了这篇终于懂了!转载自:http://blog.csdn.net/zpalyq110/article/details/79527653 GBDT 的全称是 Gradient Boosting Decision Tree,梯度下降树,在传统机器学习算法中,GBDT算的上TOP3的算法。想要理解GBDT的真正意义,那就必须理解GBDT中的Gradient...转载 2019-03-04 11:19:05 · 1320 阅读 · 0 评论 -
sklearn中的predict_proba与predict
转载自:https://blog.csdn.net/qq_36523839/article/details/80405455 发现个很有用的方法——predict_proba今天在做数据预测的时候用到了,感觉很不错,所以记录分享一下,以后可能会经常用到。我的理解:predict_proba不同于predict,它返回的预测值为,获得所有结果的概率。(有多少个分类结果,每行就有多少个概率...转载 2018-12-06 20:21:52 · 807 阅读 · 0 评论 -
pandas中的merge与groupby用法
最近一直在做机器学习比赛,学习大神们的源码时发现这两个函数使用频繁,自己也是花了一阵子才搞明白,先草草记录下暂时在比赛中用到的,比赛结束后再细细整理。1、gruopbyIn [35]: df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],^M ...: 'key2':['one', 'two', ...原创 2018-11-25 16:37:52 · 749 阅读 · 0 评论 -
matplotlib基础1:绘图基本属性设置 -- xticks(loc,labels)格式化转义标记
转载自:https://blog.csdn.net/weixin_40040404/article/details/81185564 matplotlib绘图基本属性设置:# -*- coding: utf-8 -*-"""Created on Tue Jul 24 15:11:36 2018@au...转载 2018-11-19 13:58:38 · 1573 阅读 · 0 评论 -
偏度(skewness)和峰度(kurtosis)
转自:https://blog.csdn.net/xbmatrix/article/details/69360167 偏度偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏...转载 2018-11-02 16:57:04 · 6015 阅读 · 0 评论 -
kaggle——房价预测项目
转载自:https://blog.csdn.net/skywalker_123/article/details/81220291Exploratory Data Analysis and Predictionsof House Price 作业完成工具与环境:win10+anaconda3+pycharm2018+jupyter notebook(Python3)前言:刚接触...转载 2018-11-01 21:08:18 · 6619 阅读 · 3 评论 -
reshape(-1,1)什么意思 numpy.reshape
numpy.reshape(a, newshape, order='C')[source],参数`newshape`是啥意思? 官方文档:https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.htmlnewshape : int or tuple of intsThe new shap...转载 2018-11-01 14:57:29 · 12484 阅读 · 2 评论 -
Python如何忽略warning的输出
转载出处:https://blog.csdn.net/xiaodongxiexie/article/details/65646239有时候运行代码时会有很多warning输出,如提醒新版本之类的,如果不想这些乱糟糟的输出可以这样:import warningswarnings.filterwarnings('ignore')命令行下则可以:python -W ignore file.py...转载 2018-10-27 20:43:02 · 4451 阅读 · 0 评论 -
《利用python进行数据分析》学习记录——使用Pandas和seaborn绘图
matplotlib实际上是一种比较低级的工具。要绘制一张图表,你组装一些基本组件就行:数据展示(即图表类型:线型图、柱状图、盒形图、散布图、等值线图等)、图例、标题、刻度标签以及其他注解型信息。在pandas中,我们有多列数据,还有行和列标签。pandas自身就有内置的方法,用于简化从DataFrame和Series绘制图形。另一个库seaborn(https://seaborn.pydata...原创 2018-10-23 20:39:47 · 1847 阅读 · 1 评论 -
在求标准差(std)时所遇到的问题
在求标准差(std)时所遇到的问题今天在处理数据时发现pandas中用std方法计算的标准差蜜汁诡异,所以就在网上进行了搜索,发现pandas求std与numpy有所差异,怕自己之后忘掉,所以把学习过程记录如下(用ipython编辑)。本人新入门菜鸟,如有错误,请指出!先定义一个DataFrame:In [1]: import pandas as pdIn [2]: import nump...原创 2018-10-21 22:10:48 · 3543 阅读 · 0 评论 -
训练集(train set) 验证集(validation set) 测试集(test set)问题综述
本人机器学习初学菜鸟一枚,在做一些小比赛时对模型评估与选择的一些问题不是很明白,搬运了以下2篇博文,跪谢大佬们整理的那么详细!!!(其实看完还是有些疑问,还是要多看几遍,加深记忆)以下为博文1内容:原地址:http://www.cnblogs.com/xfzhang/archive/2013/05/24/3096412.html机器学习中模型评估与选择中的几个小问题 Part 1 Tra...转载 2018-10-21 20:57:31 · 13394 阅读 · 0 评论 -
numpy和tensorflow中的关于参数axis的正确理解
转自ZeroZone零域:https://blog.csdn.net/ksws0292756/article/details/80192926 axis的默认值不是0,这一点我发现很多博客文章都搞错了。所以一定要知道,axis的默认值不是0当给axis赋值为0时,和采取默认值时的表现是完全不同的,从下面的代码就可以看出。>>> z #大小为2×3×4的数组array...转载 2018-10-28 09:33:23 · 214 阅读 · 0 评论 -
均方误差(MSE)
转载自:https://blog.csdn.net/Eric2016_Lv/article/details/52819926?locationNum=3&fps=1均方误差单独扽概念是很简单的,这里只做介绍,更深一步的内容会在后面列出来。SSE(和方差、误差平方和):The sum of squares due to errorMSE(均方差、方差):Mean squared er...转载 2018-10-28 09:01:23 · 7494 阅读 · 0 评论 -
pandas 中对axis=0,axis=1的理解,对应pandas中drop的用法
Stackoverflow.com是程序员的好去处,本公众号将以pandas为主题,开始一个系列,争取做到每周一篇,翻译并帮助pandas学习者一起理解一些有代表性的案例。今天的主题就是Pandas与Numpy中一个非常重要的参数:axis.(轴)Stackoverflow问题如下:python中的axis究竟是如何定义的呢?他们究...转载 2018-10-28 08:55:15 · 13877 阅读 · 0 评论 -
《利用Pyhton进行数据分析》学习记录——数据清洗和准备
1、处理缺失数据在许多数据分析工作中,缺失数据是经常发生的。pandas的目标之一就是尽量轻松地处理缺失数据。例如,pandas对象的所有描述性统计默认都不包括缺失数据。pandas使用浮点值NaN(Not a Number)表示缺失数据,我们称其为哨兵值,可以方便的检测出来:In [20]: string_data = pd.Series(['aardvark', 'artichoke', ...原创 2018-10-23 00:09:27 · 252 阅读 · 0 评论 -
Win10 x64 + CUDA 10.0 + cuDNN v7.5 + TensorFlow GPU 1.13 安装指南
转载自:http://www.cnblogs.com/sorex/p/7615185.html0.环境说明硬件:Ryzen R7 1700x + GTX 1080Ti系统:Windows 10 Enterprise Version 1809 Update March 20191.前期工作NVIDIA 419.35 驱动Visual Studio 2017 (需要C++部分)Pytho...转载 2019-04-05 23:30:21 · 366 阅读 · 0 评论