自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 学习《机器学习100天》第10天 支持向量机和K近邻法

github上的项目,跟着一起学习“了解更多关于SVM如何工作和实现knn算法的知识。”    1. “支持向量机“中的支持向量下图中两条虚线上的点,就是支持向量    2. 核函数核函数(Kernel trick),这一概念经常与SVM搭配出现,但并非SVM特有。在一个空间中,模型是非线性可分的,需要把数据映射到另一个空间,线性可分。此时需要借助核函数。 参考...

2019-01-29 15:39:47 322

原创 学习《机器学习100天》第9天 支持向量机(SVM)

github上的项目,跟着一起学习直观了解SVM是什么以及如何使用它来解决分类问题。(1)什么是SVM?SVM(Support Vector Machine):支持向量机(2)SVM是用来干什么的?找到一个超平面,用来解决分类问题。最大化支持向量到超平面的距离。根据问题是否线性可分,又用到了核函数 参考:SVM理解 https://blog.csdn.net...

2019-01-28 19:46:50 189 2

翻译 学习《机器学习100天》第8天 逻辑回归背后的数学

逻辑回归背后的数学 | 第8天github上的项目,跟着一起学习Logistic回归的详细描述,原文在这里(打开需要能访问谷歌的环境)https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc翻译一下(公式推导的部分不太理解,先翻译个大概):逻辑回归模型示意图: 输入...

2019-01-21 14:29:12 231

原创 名词解释

1、TF-IDF(term frequency–inverse document frequency):一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。用途:评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增...

2019-01-17 13:54:13 616

原创 一些评价标准

分类问题:准确率回归问题:1、RMSE(Root Mean Square Error):均方根误差,观测值与真值偏差的平方与观测次数n比值的平方根m:样本个数y:真实输出值^y:预测得到的输出值i:第i个样本2、MAE(Mean Absolute Error ):平均绝对误差,又叫平均绝对离差,是所有单个观测值与算术平均值的偏差的绝对值的平均3、MSE(me...

2019-01-17 13:16:17 237

原创 学习《机器学习100天》第7天 k近邻(KNN)

github上的项目,跟着一起学习k近邻是分类算法,也可用于回归。k近邻:对于要预测的输入,参考周围k个邻居的输出,决定自己的输出。选择距离自己最近的k个邻居,其中的距离常用欧式距离来衡量。例子:红色和绿色的星星是训练集,蓝色边框中空的星星是待预测的,假设k=3,距离最近的3个邻居中,2个是绿色,一个是红色,所以预测的最终输出为绿色。...

2019-01-15 15:44:45 177

原创 学习《机器学习100天》第6天 逻辑回归

github上的项目,跟着一起学习逻辑回归的代码实现需要处理的问题:根据用户的年龄和薪资,预测是否买车。    步骤1 数据预处理导入库导入数据集分为训练集和测试集特征缩放:sklearn.preprocessing的StandardScaler    步骤2 逻辑回归模型将逻辑回归应用于训练集:sklearn.linear_model的LogisticRegr...

2019-01-14 21:35:22 248

原创 学习《机器学习100天》第5天 逻辑回归

逻辑回归,确定决策边界衡量逻辑回归的输出好坏,损失函数常用交叉熵(参考1)添加正则项,控制过拟合利用梯度下降法,最小化损失函数参考:1.关于交叉熵的个人理解https://blog.csdn.net/weixin_42078618/article/details/81736329 ...

2019-01-13 15:16:07 130

原创 学习《机器学习100天》第4天 逻辑回归

逻辑回归的基础理论知识与上一节的线性回归区别:逻辑回归输出结果是离散的,线性回归输出结果是连续的。如判断邮件是否为垃圾邮件。假设首先使用线性回归的方法,得到的输出可能为任意值。想要实现逻辑回归,需要把输出变到0到1之间,所以用到sigmoid函数函数图像:输出总在0到1之间。逻辑回归的输出是离散值,如果是二分类,只有0和1两个状态,为了把sigmoid变换后的0到1之间...

2019-01-11 20:01:41 221

原创 学习《机器学习100天》第3天 多元线性回归

数据(前4行)是这样的: R&D Spend Administration Marketing Spend State Profit 165349.2 136897.8 471784.1 New York 192261.8 162597.7 151377.6 443898.5 California 19...

2019-01-10 15:13:56 234

原创 学习《机器学习100天》第2天 简单线性回归

问题:根据学生的学习时间,预测分数1.数据预处理2.用训练集训练简单线性回归模型sklearn.linear_model的LinearRegressionfit(X_train, Y_train)方法3.预测结果predict(X_test)4.可视化plt.scatter()散点图plt.plot()直线plt.show()...

2019-01-09 12:09:43 201

原创 学习《机器学习100天》第一天 数据预处理

github上的项目,跟着一起学习数据预处理 | 第1天用来练习的数据是这样的:Country Age Salary Purchased France 44 72000 No Spain 27 48000 Yes Germany 30 54000 No Spain 38 61000 ...

2019-01-07 22:56:12 227

原创 什么是先验概率和后验概率?

假设迟到的原因有2个:    1.天气不好    2.起床晚了先验概率:迟到的概率条件概率:已知天气不好的条件下,迟到的概率后验概率:已经迟到了,因为天气原因迟到的概率 参考:https://blog.csdn.net/Mr_HHH/article/details/83346428...

2019-01-04 19:56:44 13841 2

原创 notebook运行报错No module named 'pydotplus'

代码:import pydotplus报错:ModuleNotFoundError: No module named 'pydotplus'环境:windows+anaconda-notebook解决:打开anaconda prompt命令行,conda install pydotplus参考:https://blog.csdn.net/qq_35550465/article/...

2019-01-04 13:53:22 11327 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除