![](https://img-blog.csdnimg.cn/20190927151124774.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
机器学习
天青如水
这个作者很懒,什么都没留下…
展开
-
面试题
什么是 Logistic 回归,以及其常见的应用场景简述 K-means 原理以及优劣点请描述什么是 RDF 三元组以及其作用的场景请描述什么是实体抽取以及管理抽取,以及常用的算法。简单描述在知识图谱领域,实体对齐的场景以及目的简单描述知识图谱的应用场景。单词纠错问题,大概题意是给你一个字典数据,key为单词,value为统计出现在文章中的次数,基于贝叶斯方面的知识,给出理论推导,并完成词语拼写过程中的纠错功能。将第七题中的英文改成汉字。...原创 2020-07-18 11:52:00 · 737 阅读 · 0 评论 -
集成学习
原文链接:https://editor.csdn.net/md?articleId=106394362目录1 二元决策树DecisionTreeRegressor2 自举集成(Bagging)随机森林(Bagging + 随机选择的属性子集)3 Boosting1) AdaBoost2) 梯度提升法(Gradient Boosting)4 总结5 Sklearn实战1) 构建随机森林模型来预测红酒口感2) 用梯度提升来预测红酒品质3) 用Bagging来预测红酒口感误差:偏差:欠拟合(Underfi原创 2020-05-28 00:34:43 · 760 阅读 · 0 评论 -
惩罚线性回归---Python机器学习:预测分析核心算法
惩罚线性回归参考教材:Python机器学习预测分析核心算法,书中代码较为过时,借用sklearn等工具包进行了重写。实践中遇到的绝大多数预测分析(函数逼近)问题,惩罚线性回归和集成方法都具有最优或接近最优的性能。这些问题包含:大数据集、小数据集、宽数据集(wide data sets)、高瘦数据集(tall skinny data sets)、复杂问题、简单问题惩罚线性回归模型一个重要优势就是它训练所需时间。当面对大规模的数据时,训练所需时间就成为一个需要考量的因素1. 声呐数据集声纳信号又叫作原创 2020-05-25 23:47:43 · 1655 阅读 · 0 评论 -
HMM
HMM公式推导在 HMM 中,有两个基本假设:齐次 Markov 假设(未来只依赖于当前):p(it+1∣it,it−1,⋯ ,i1,ot,ot−1,⋯ ,o1)=p(it+1∣it)p(i_{t+1}|i_t,i_{t-1},\cdots,i_1,o_t,o_{t-1},\cdots,o_1)=p(i_{t+1}|i_t)p(it+1∣it,it−1,⋯,i1,ot,o...原创 2020-05-07 12:51:35 · 752 阅读 · 2 评论 -
机器学习之降维
机器学习之降维过拟合={data↑正则化降维{直接降维:特征选择线性降维:PCA,MDS非线性降维:{保留局部特征{局部重建权值:LLE邻接图:Laplacian Eigenmaps保留全局特征{流形:Isomap、LPP基于核函数:KPCA、KICA 过拟合=\left\{\begin{aligned}&data \uparrow\\&正则化\\&降...原创 2020-05-04 12:43:43 · 1153 阅读 · 2 评论 -
Kaggle之房价问题
Kaggle之房价问题基于爱荷华州埃姆斯的住宅数据信息,预测每间房屋的销售价格。这是一个回归问题,评估方式是均方根误差。数据分析import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statsfrom scipy.spec...原创 2020-04-29 07:57:14 · 1662 阅读 · 0 评论 -
kaggle之共享单车案例
kaggle之共享单车案例自行车共享系统是租借自行车的一种手段,通过这些系统,人们可以从任意地点租借一辆自行车,到达目的地后归还。自行车共享系统明确记录了旅行时间,出发地点,到达地点和时间。因此,其可用于研究城市中的移动性。在本项目中,要求将历史使用模式与天气数据结合起来,以预测华盛顿特区的自行车租赁租赁需求。数据提供了跨越两年的每小时租赁数据,包含天气信息和日期信息,训练集由每月前19天的数...原创 2020-04-24 10:07:03 · 5365 阅读 · 5 评论 -
机器学习公式推导---线性分类
线性分类对于分类任务,线性回归模型就无能为力了,但是我们可以在线性模型的函数进行后再加入一层激活函数,这个函数是非线性的,激活函数的反函数叫做链接函数。我们有两种线性分类的方式:硬分类,我们直接需要输出观测对应的分类。这类模型的代表为:线性判别分析(Fisher 判别)感知机软分类,产生不同类别的概率,这类算法根据概率方法的不同分为两种生成式(根据贝叶斯定理先计算参数后验,再...原创 2020-02-21 13:34:44 · 212 阅读 · 0 评论 -
机器学习公式推导---(二)线性回归
线性回归假设数据集为:D={(x1,y1),(x2,y2),⋯ ,(xN,yN)}\mathcal{D}=\{(x_1, y_1),(x_2, y_2),\cdots,(x_N, y_N)\}D={(x1,y1),(x2,y2),⋯,(xN,yN)}后面我们记:X=(x1,x2,⋯ ,xN)T,Y=(y1,y2,⋯ ,yN)TX=(x_1,x_2,\cdots,x_N)^...原创 2020-02-26 20:45:34 · 155 阅读 · 0 评论 -
动手学深度学习PyTorch版---笔记汇总
pytorch函数PyTorch的Tensor,它可以是零维(又称为标量或一个数)、一维、二维及多维的数组。Tensor自称为神经网络界的Numpy,它与Numpy相似,二者可以共享内存,且之间的转换非常方便和高效。不过它们也有不同之处,最大的区别就是Numpy会把ndarray放在CPU中进行加速运算,而由Torch产生的Tensor会放在GPU中进行加速运算(假设当前环境有GPU)。对Te...原创 2020-02-13 16:33:38 · 1585 阅读 · 0 评论 -
机器学习数据集
图像分类领域1)MNIST经典的小型(28x28 像素)灰度手写数字数据集,开发于 20 世纪 90 年代,主要用于测试当时最复杂的模型;到 了今日,MNIST 数据集更多被视作深度学习的基础教材。fast.ai 版本的数据集舍弃了原始的特殊二进制格式,转 而采用标准的 PNG 格式,以便在目前大多数代码库中作为正常的工作流使用;如果您只想使用与原始同样的单输入通道,只需在通道轴中选取单个切片...原创 2020-01-07 15:04:12 · 990 阅读 · 0 评论 -
Hands-on ML 课后习题
chapter 1您如何定义机器学习?机器学习是一门能够让系统从数据中学习的计算机科学。机器学习在哪些问题上表现突出,你能提出四种类型吗?机器学习非常利于:不存在已知算法解决方案的复杂问题,需 要大量手动调整或是规则列表超长的问题,创建可以适应环境波动的 系统,以及帮助人类学习(比如数据挖掘)。什么是被标记的训练数据集?被标记的训练集是指包含每个实例所期望的解决方案的训练集...原创 2019-12-28 00:42:57 · 718 阅读 · 0 评论 -
K-means小应用---图像压缩
图像在相邻区域的颜色相近,我们可以用一种颜色来代替区域中的其它相近颜色。利用K-means算法可以对图像的进行分簇,然后将各簇内的颜色都用中心点的颜色代替。python代码'''@dev: python3:3.7.3 scipy:1.3.0@Date: 2019-12-13 18:59:14@Descripttion: 利用K-means进行图像压缩'''from scipy.clu...原创 2019-12-13 21:18:38 · 201 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十五)--- MapReduce
参考资料:机器学习实战Mapper'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-12 22:53:08@LastEditTime: 2019-11-12 23:08:24@FilePath: \\机器学习实战\\15-MapReduce\\mrMeanMapper.py@Descripttio...原创 2019-11-12 23:57:18 · 289 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十四)--- SVD算法
参考资料:机器学习实战'''@version: 0.0.1@Author: Huang@dev: python3 vscode@Date: 2019-11-12 21:09:57@LastEditTime: 2019-11-12 21:58:07@FilePath: \\机器学习实战\\14-SVD算法\\SVD.py@Descripttion: SVD是从有噪声数据中抽取相关特...原创 2019-11-12 23:53:01 · 266 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十三)--- PCA算法
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-12 12:40:12@LastEditTime: 2019-11-12 21:04:40@FilePath: \\机器学习实战\\13-PCA\\PCA.py@Descripttion: 在低维下,数据更容易进行处理,相关特征...原创 2019-11-12 23:50:22 · 296 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十二)--- FP-growth算法
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-12 09:29:53@LastEditTime: 2019-11-12 12:24:30@FilePath: \\机器学习实战\\12-FP-growth算法\\FPGrowth.py@Descripttion: 只需对数据库...原创 2019-11-12 12:29:53 · 320 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十一)--- Apriori算法
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-11 11:24:22@LastEditTime: 2019-11-11 16:56:01@FilePath: \\机器学习实战\\11-Apriori\\apriori.py@Descripttion: 如果一个元素项是不频繁...原创 2019-11-11 17:02:53 · 286 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(十)--- K均值聚类算法
参考资料:机器学习实战'''@version: 0.0.1@Author: Huang@dev: python3 vscode@Date: 2019-11-10 11:39:30@LastEditTime: 2019-11-10 17:57:13@FilePath: \\机器学习实战\\10-K均值聚类算法\\kMeans.py@Descripttion: 聚类是一种无监督的学习...原创 2019-11-10 18:13:48 · 334 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(九)--- 树回归
参考资料:机器学习实战'''@version: 0.0.1@Author: Huang@dev: python3 vscode@Date: 2019-11-07 23:59:30@LastEditTime: 2019-11-08 14:16:04@FilePath: \\机器学习实战\\09-树回归\\tree.py@Descripttion: CART是十分著名且广泛记载的树构...原创 2019-11-08 14:26:13 · 239 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(八)--- 线性回归
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-06 20:00:17@LastEditTime: 2019-11-07 19:33:18@FilePath: \\机器学习实战\\08-线性回归\\regression.py@Descripttion: 线性回归'''i...原创 2019-11-08 14:23:36 · 373 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(七)--- AdaBoost
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-11-05 21:07:47@LastEditTime: 2019-11-06 19:35:46@FilePath: \\机器学习实战\\07-AdaBoost\\adaboost.py@Descripttion: AdaBoost的...原创 2019-11-06 19:46:33 · 322 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记 ---序言
本系列博客主要参考《机器学习实战》一书,这本书在理论方面非常欠缺,但能让你用最基本的pyton语法,从底层上让你构建代码,实现机器学习中的许多算法。本系列博客基于python3对书中代码进行一定的修改。github地址:Machine-Learning-in-Action-learn目录:代码笔记(一)—k-近邻算法代码笔记(二)— 决策树算法代码笔记(三)— 朴素贝叶斯算法代码笔记(...原创 2019-11-04 23:50:49 · 198 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(六) ---- SVM
参考资料:机器学习实战'''@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-10-31 00:05:29@LastEditTime: 2019-11-04 23:15:13@FilePath: \\机器学习实战\\06-SVM\\svmMLiA.py@Descripttion: SVM的大部分时间都源自训练,...原创 2019-11-04 23:23:06 · 284 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(五) ---- Logistic回归算法
参考资料:机器学习实战'''@version: 0.0.1@Author: Huang@dev: python3 vscode@Date: 2019-10-29 23:39:44@LastEditTime: 2019-10-30 22:00:01@FilePath: \\机器学习实战\\05-Logistic回归\\logRegres.py@Descripttion: Logis...原创 2019-10-30 22:09:57 · 321 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(四)---用sklearn.naive_bayes实现新浪新闻分类
参考资料:机器学习实战朴素贝叶斯实战篇实现代码:"""@Descripttion: 朴素贝叶斯之新浪新闻分类@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-10-28 13:15:37@LastEditors: tqrs@LastEditTime: 2019-10-28 13:15:49"""fro...转载 2019-10-29 22:53:29 · 212 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(三)--- 朴素贝叶斯算法
"""@Descripttion: 基于贝叶斯决策理论的分类方法优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对于输入数据的准备方式较为敏感适用数据类型:标称型数据@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-10-27 00:58:34@LastEditors: tqrs@LastEditT...原创 2019-10-29 13:55:13 · 308 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(二)--- 决策树算法
参考资料:机器学习实战决策树的python3实现代码:"""@Descripttion: 决策树优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能会产生过度匹配问题适用数据类型:数值型和标称型@version: 0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-06-03 12:15...原创 2019-10-27 00:30:44 · 378 阅读 · 0 评论 -
Python3《机器学习实战》代码笔记(一)---k-近邻算法
参考资料:机器学习实战Python3《机器学习实战》"""@Descripttion: kNN: k Nearest Neighbors 优点:分类数据最简单最有效的算法 缺点:无法给出任何数据的基础结构信息,无法知晓平均实例样本和典型实例样本具有的特诊@version:0.0.1@Author: tqrs@dev: python3 vscode@Date: 2019-06-0...原创 2019-10-26 01:56:08 · 227 阅读 · 0 评论