自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习小组系列笔记--简单的数据预处理和特征工程

【将在后面的应用中来实践应用】 学习目标有四个: 无量纲化:最值归一化、均值方差归一化及sklearn中的Scaler 缺失值处理 处理分类型特征:编码与哑变量 处理连续型特征:二值化与分段 相关的参考资料: 关于最值归一化、均值方差归一化及sklearn中的Scaler方面的学习,可以参考:《机器学习的敲门砖:归一化与KD树》及《特征工程系列:特征预处...

2020-03-15 23:29:32 286

原创 机器学习小组系列笔记---(二)

一、本周学习内容 知识点描述:如何评价模型的好坏。 本周是机器学习小组第二期的第二周,我们这周学习机器学习的一些相关基础知识我们的学习目标有三个:数据拆分:训练数据集&测试数据集评价分类结果:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等评价回归结果:MSE、RMSE、MAE、R Squared 二、学习资料 为了方便大家学习,我们推荐了相关的参考资料。 首先...

2020-03-08 22:51:26 193

原创 机器学习小组系列笔记---(一)knn算法

一、本周学习内容 知识点描述:用代码打开AI的大门 本周是机器学习小组第一期的第一周,我们这周从最简单的机器学习算法“K-近邻算法”开始,通过代码走进机器学习的大门,搞定传统机器学习算法。 我们的学习目标有三个:了解kNN算法的思想及其原理 使用python手动实现kNN算法 ...

2020-03-01 19:08:40 203

原创 实验研究--安装fasttext

在安装文本处理模块 fasttext时,报错“一大串红字”,最后是gcc不对的问题。<忘了报错截图了> 所以先安装gcc,尝试了很多方法都不可行,一来网速不太好,二来很多办法在我的mac上都不适用。 最后参考了这位博主的文章,通过安装xcode来安装gcc,成功! https://blog.csdn.net/runfarther/article/details/54378251 ...

2020-03-01 15:16:08 255

原创 求职--统计与概率--统计--假设检验

常用假设检验 整理自https://www.cnblogs.com/zhizhan/p/4784065.html 假设检验--A/B test应用举例:https://baijiahao.baidu.com/s?id=1629865394478984240&wfr=spider&for=pc 1.t检验   适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配...

2019-07-02 15:15:10 161 1

原创 求职--统计与概率--统计--假设检验--方差分析

整理参考https://blog.csdn.net/snowdroptulip/article/details/79030986 1. 方差分析 方差分析:又称变异分析,是英国统计学家R.A.Fisher于1923年提出的一种统计方法,故有时也称为F检验。 可简写为ANOVA。用于多组均数之间的显著性检验。 要求:各组观察值服从正态分布或近似正态分布,并且各组之间的方差具有齐性。 基本思...

2019-07-02 15:07:10 378

原创 求职--统计与概率--统计--假设检验--卡方检验

整理自此文:https://www.jianshu.com/p/807b2c2bfd9b 1.卡方检验:检验两个变量之间有没有关系 以运营为例: 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别; 不同城市级别的消费者对买SUV车有没有什么区别; 如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。 2. 以投硬币为例 1) 根据投硬币观察到的正面,反面次数,判断这个硬...

2019-07-02 14:59:14 180

原创 求职--统计与概率--统计--假设检验--t检验

统计:描述统计 与 推断统计 描述统计:均值,方差,中位数,众数; 推断统计:参与估计 与 假设检验 参数估计:点估计,矩阵估计,最大似然估计 通过参数估计得到数据分布的参数值。 假设检验 假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。预先对总体参数的取值做出假定,然后用样本数据来验证,从而做出是接受还是拒绝的结论。 具体...

2019-07-02 14:49:11 1006

原创 学习笔记-《python程序员面试宝典》-基础知识-数据结构-编程思维(一)

1. 时间空间复杂度 时间复杂度主要看算法中多次调用或者主要调用的部分,重点看循环、递归等; 空间复杂度: 通常来说,只要算法不涉及到动态分配的空间以及递归、栈所需的空间,空间复杂度通常为0(1)。 2.字符串逆转函数 时间复杂度O(n),空间O(1) def roundString(S): begin = 0 end = len(S)-1 ss = li...

2019-06-29 14:32:22 3365

原创 #Anaconda 安装#windows

若出现pip install xxx 错误,将安装源换成清华镜像依然错误。出现了:CondaHTTPError: HTTP 000 CONNECTION FAILED for url &lt;https://repo.continuum.io/pkgs/msys2/noarch/repodata.json.bz2&gt; Elapsed: -  An HTTP error occurred whe...

2018-04-27 14:59:50 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除