李可以你可以

关于 Java 的内容没有办法给出准确答复了,请见谅。

排序:
默认
按更新时间
按访问量

“k 近邻算法”综述

“k 近邻算法”综述 本来题目想叫“白话 k 近邻算法”,后来想想,“k 近邻算法” 的描述几乎就是“白话”,所以就不故弄玄虚了,接下来的就是一篇笔记呀。 图片来自周志华《机器学习》第 10 章第 1 节。 想说一说“k 近邻算法”在机器学习中的地位 “k 近邻算法” 可以说是最容易理解的机器学...

2018-11-18 14:43:55

阅读数:38

评论数:0

LeetCode 题解之 452. Minimum Number of Arrows to Burst Balloons

452. Minimum Number of Arrows to Burst Balloons 题目描述和难度 题目描述: 在二维空间中有许多球形的气球。对于每个气球,提供的输入是水平方向上,气球直径的开始和结束坐标。由于它是水平的,所以y坐标并不重要,因此只要知道开始和结束的x坐标就足够了。...

2018-11-15 13:53:36

阅读数:28

评论数:0

Python 二分查找 bisect 模块的用法

https://nbviewer.jupyter.org/github/liweiwei1419/blog-article-sources/blob/master/jupyter/bisect 的用法.ipynb

2018-11-14 16:32:08

阅读数:22

评论数:0

LeetCode 题解之 283. Move Zeroes

283. Move Zeroes 题目描述和难度 题目描述: 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 示例: 输入: [0,1,0,3,12] 输出: [1,3,12,0,0] 说明: 必须在原数组上操作,不能拷贝额外的数组。 尽量减少...

2018-11-13 12:00:12

阅读数:14

评论数:0

白话“卡方检验”

什么是卡方检验 卡方检验是假设检验的一种,用于分析两个类别变量的相关关系,是一种非参数假设检验,得出的结论无非就是相关或者不相关,所以有的教材上又叫“独立性检验”,所以如果不是很清楚假设检验的朋友们,要好好复习一下假设检验了。提起假设检验,会扯出一堆东西,这里我简单为大家梳理一下。 什么是“类别变...

2018-11-11 14:41:10

阅读数:239

评论数:0

朴素贝叶斯算法应用——垃圾短信分类

理解贝叶斯公式其实就只要掌握:1、条件概率的定义;2、乘法原理 P(ci∣x)=P(x∣ci)P(ci)P(x) P(c_i|x) = \cfrac{P(x|c_i)P(c_i)}{P(x)} P(ci​∣x)=P(x)P(x∣ci​)P(ci​)​ 这里 xxx 是一个向量,有几个特征,就有几个...

2018-10-29 15:35:30

阅读数:52

评论数:0

凸函数和凹函数判定,Jensen 不等式的理解和记忆

最近看到 EM 算法,其中的证明有用到琴生不等式,在这里做一个笔记。 在刚开始学习凸函数和凹函数的时候,我们会被凸函数和凹函数的命名所困扰,命名看起来是凹的,一些教材上却偏偏说它是凸函数。其实这个只是一个定义,它叫什么,并不影响函数本身的性质。就像我在 B 站上看到有些人戏称三国时期的武将赵云为“...

2018-10-28 12:26:21

阅读数:120

评论数:0

关联分析概述1——Apriori 算法简介

关联分析概述 “关联分析”就是分析在众多的历史交易记录中,出现很多的组合项有哪些,并且得出“购买了 A 物品的顾客还很有可能会一起购买 B 物品”这样的结论。 那么,“分析一起出现的组合项”有什么用呢? 1、我们可以发现哪些商品的组合销量高,例如,我们知道周志华的《机器学习》和李航的《统计学习方法...

2018-10-27 15:16:24

阅读数:60

评论数:0

EM 算法简介

EM 算法的思想 用拟合的思想来求随机变量的数字特征。 例如:模型中有两个未知参数 AAA 和 BBB 需要估计,而 AAA 和 BBB 又存在相互依赖的关系,即知道 AAA 才能推出 BBB,知道了 BBB 才能推出 AAA 。 EM 的思路就是先固定其中一个,推测另一个,如此反复。 EM 分别...

2018-10-23 17:28:52

阅读数:13

评论数:0

数据特征选定

数据特征选定 目的:最大限度地从原始数据中提取出合适的特征。 单变量特征选定 统计分析可以用来分析和选择对结果影响最大的数据特征; 可以选用一系列统计方法来选定数据特征; 卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,偏离程度决定了卡方值的大小; 卡方值越大,越不符合 卡方值越小,...

2018-10-19 16:39:08

阅读数:17

评论数:0

数据预处理的四种方式

数据预处理 调整数据尺寸 让所有的属性按照相同的尺度来度量数据; 梯度下降算法 神经网络 SVM 回归算法 K 近邻算法 # 调整数据尺度(0..) import pandas as pd import numpy as np from sklearn.preprocessing import...

2018-10-19 14:22:15

阅读数:63

评论数:0

简单的数据可视化

直方图(Histogram) 又称质量分布图,可以直观地展示每个属性的分布情况; 一般用横轴表示数据类型,纵轴表示分布情况; 可以很直观看到数据是高斯分布、指数分布还是偏态分布。 下面使用 Pandas 的 DataFrame 对象的 hist() 方法就可以直接得到直方图。 import p...

2018-10-19 13:19:51

阅读数:28

评论数:0

使用 Pandas 查看数据

简单查看数据 dataframe.head() 数据的维度 dataframe.shape 属性 数据的属性和类型 dataframe.dtypes 属性 统计性描述 dataframe.describe() 数据分组分布 print(data.groupby('class').size(...

2018-10-19 13:02:46

阅读数:26

评论数:0

数据导入的几种方法

Pima Indians 数据集 从 UCI 中获取的,这是一个分类问题的数据集,主要记录了印第安人最近五年内是否患糖尿病的医疗数据。 (数据集文件见最后。) 使用标准 Python 类库导入数据 import csv import numpy as np filename = 'pima_da...

2018-10-19 12:36:07

阅读数:28

评论数:0

sklearn 线性回归简单应用

样本准备 import numpy as np import matplotlib.pyplot as plt # 样本准备 train_X = np.linspace(-1, 1, 100) train_Y = 2 * train_X + np.random.randn(*train_X.sh...

2018-10-11 08:32:05

阅读数:59

评论数:0

使用 seaborn 绘图的参考资料

1、【Kaggle入门级竞赛top5%排名经验分享】— 分析篇 https://zhuanlan.zhihu.com/p/40360380 2、数据可视化Seaborn从零开始学习教程(一) 风格选择 https://zhuanlan.zhihu.com/p/36994775 数据可视化Seabo...

2018-10-10 14:17:47

阅读数:44

评论数:0

使用 seaborn 的 FacetGrid 绘图的方法

FacetGrid 是一个绘制多个图表(以网格形式显示)的接口。 步骤: 1、实例化对象 2、map,映射到具体的 seaborn 图表类型 3、添加图例 示例代码: col='Pclass' 表示从列的方向上看,是 Pclass 字段。 # 在不同社会等级下,男性和女性在不同登陆港口下的数量...

2018-10-10 13:38:32

阅读数:162

评论数:0

让 matplotlib 显示中文的方法

以下是我在网上查阅的一些方法,最后尝试通过了。在这里做个备份,供大家参考。 方法1:在加入以下代码片段。 import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['STHeiti'] # 用来正常显示中文标签 plt...

2018-10-10 11:43:53

阅读数:95

评论数:0

seaborn 的 barplot 条形图的用法

barplot 可以将一些统计函数的结果显示在图标上。 estimator 指定分组汇总的方式,传入一个函数的引用就可以了,默认是取平均值。 %matplotlib inline import pandas as pd import numpy as np import seaborn as ...

2018-10-09 16:13:43

阅读数:218

评论数:0

seaborn 的 countplot 计数直方图,可以分类别显示(通过 hue 参数指定)

显示中文: from matplotlib.font_manager import FontProperties font = FontProperties(fname='/Library/Fonts/Kaiti.ttc', size=20) countplot 显示计数直方图 使用 subp...

2018-10-09 14:57:49

阅读数:142

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭