机器学习
文章平均质量分 93
普通网友
这个作者很懒,什么都没留下…
展开
-
python真实面试问题和过程
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn挑战公司:****有限公司 公司规模:20~99人 公司地址:**** 面试时间:上午10:30 面试结果:谈了待遇,等待通知做了个Python学习网站,www.python88.cn,包含全套教程,Python、爬虫、web、数据分析、机器...原创 2018-04-14 18:18:12 · 7588 阅读 · 4 评论 -
机器学习全套教程(十四)-- 线性回归
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn线性回归学习目标目标 记忆线性回归的原理过程 应用LinearRegression或SGDRegressor实现回归预测 记忆回归算法的评估标准及其公式 应用 波士顿房价预测 回忆一下回归问题的判定是什么?1、 线性回归的原理1.1 线性回归应用场...原创 2019-03-21 09:06:25 · 677 阅读 · 0 评论 -
机器学习全套教程(十五)-- 欠拟合与过拟合
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn欠拟合与过拟合学习目标目标 说明线性回归(不带正则化)的缺点 说明过拟合与欠拟合的原因以及解决方法 应用 无 问题:训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?当算法在某个数据集当中出现这种情况,可能就出现了过拟合现象。1、 什么是过...原创 2019-03-21 09:06:54 · 575 阅读 · 0 评论 -
机器学习全套教程(十六)-- 线性回归的改进-岭回归
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn线性回归的改进-岭回归学习目标目标 说明岭回归的原理即与线性回归的不同之处 说明正则化对于权重参数的影响 说明L1和L2正则化的区别 应用 波士顿房价预测 1、 带有L2正则化的线性回归-岭回归岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候...原创 2019-03-21 09:07:36 · 427 阅读 · 0 评论 -
机器学习全套教程(十七)-- 分类算法-逻辑回归与二分类
分类算法-逻辑回归与二分类学习目标目标 说明逻辑回归的损失函数 说明逻辑回归的优化方法 说明sigmoid函数 知道逻辑回归的应用场景 知道精确率、召回率指标的区别 知道F1-score指标说明召回率的实际意义 说明如何解决样本不均衡情况下的评估 了解ROC曲线的意义说明AUC指标大小 应用classification_report实现精确率、召回率计算...原创 2019-03-25 13:32:33 · 1567 阅读 · 0 评论 -
机器学习全套教程(一)------- 数据集
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.1 数据集目标 知道数据集的分为训练集和测试集 会使用sklearn的数据集 应用 无 2.1.1 可用数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址:http://archive.ics....原创 2019-03-19 12:36:59 · 1643 阅读 · 1 评论 -
机器学习全套教程(三)---特征抽取
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.3 特征提取学习目标目标 应用DictVectorizer实现对类别特征进行数值化、离散化 应用CountVectorizer实现对文本特征进行数值化 应用TfidfVectorizer实现对文本特征进行数值化 说出两种文本特征提取的方式区别 应用 无...原创 2019-03-19 12:39:06 · 4856 阅读 · 0 评论 -
机器学习全套教程(四)-- 特征预处理
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.4 特征预处理学习目标目标 了解数值型数据、类别型数据特点 应用MinMaxScaler实现对特征数据进行归一化 应用StandardScaler实现对特征数据进行标准化 应用 无 什么是特征预处理?2.4.1 什么是特征预处理# sci...原创 2019-03-19 12:39:59 · 1544 阅读 · 0 评论 -
机器学习全套教程(五)-- 特征降维
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.5 特征降维学习目标目标 知道特征选择的嵌入式、过滤式以及包裹氏三种方式 应用VarianceThreshold实现删除低方差特征 了解相关系数的特点和计算 应用相关性系数实现特征选择 应用 无 2.5.1 降维降维是指在某些限定条件下,降低随...原创 2019-03-19 12:41:17 · 3094 阅读 · 4 评论 -
机器学习全套教程(十三)-- 集成学习方法之随机森林
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn集成学习方法之随机森林学习目标目标 说名随机森林每棵决策树的建立过程 知道为什么需要随机有放回(Bootstrap)的抽样 说明随机森林的超参数 应用 泰坦尼克号乘客生存预测 1、 什么是集成学习方法集成学习通过建立几个模型组合的来解决单一预测问题。它...原创 2019-03-21 09:05:45 · 462 阅读 · 0 评论 -
机器学习全套教程(十二)-- 决策树
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn决策树学习目标目标 说明信息熵的公式以及作用 说明信息增益的公式作用 应用信息增益实现计算特征的不确定性减少程度 了解决策树的三种算法实现 应用 泰坦尼克号乘客生存预测 1、认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-th...原创 2019-03-21 09:05:18 · 606 阅读 · 0 评论 -
机器学习全套教程(十一)-- 朴素贝叶斯算法
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn朴素贝叶斯算法学习目标目标 说明条件概率与联合概率 说明贝叶斯公式、以及特征独立的关系 记忆贝叶斯公式 知道拉普拉斯平滑系数 应用贝叶斯公式实现概率的计算 应用 20类新闻文章分类预测 1、 什么是朴素贝叶斯分类方法2、 概率基础2...原创 2019-03-21 09:04:43 · 628 阅读 · 0 评论 -
初探基于Tesseract、图像二分法、阈值实现的图像文字识别
开发环境:Linux乌班图Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统,除了极高的精确度,Tesseract 也具有很高的灵活性。1、安装1、sudo apt-get install tesseract-ocr(安装tesseract)2、pip...原创 2018-06-03 21:48:37 · 2710 阅读 · 1 评论 -
机器学习实战--酒店情感分析分类
数据集:正面评价:2000_pos.txt商务大床房,房间很大,床有2M宽,整体感觉经济实惠不错!早餐太差,无论去多少人,那边也不加食品的。酒店应该重视一下这个问题了。宾馆在小街道上,不大好找,但还好北京热心同胞很多~前台 楼层服务员都不错,房间安静整洁,交通方便,吃的周围也挺多.唯一不足,卫生间地漏设计不好,导致少量积水.这次去北京,是要去北师大办事,所以特意留意了下附近的宾馆。住了...原创 2018-11-11 15:18:39 · 6100 阅读 · 1 评论 -
python数据分析与挖掘(四)---matplotlib散点图
Python教程网 >>:www.python88.cn散点图(scatter)我们需要知道不同的统计图的意义,以此来决定选择哪种统计图来呈现我们的数据。1 常见图形种类及意义 折线图:以折线的上升或下降来表示统计数量的增减变化的统计图 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化) 散点图:用两组数据构成多个坐标点,考察坐标点的分...原创 2019-01-26 22:44:18 · 1276 阅读 · 0 评论 -
python数据分析与挖掘(九)--- numpy 数组
Python教程网 >>:www.python88.cn1 ndarray的属性数组属性反映了数组本身固有的信息。属性名字 属性解释 ndarray.shape 数组维度的元组 ndarray.ndim 数组维数 ndarray.size 数组中的元素数量 ndarray.itemsize 一个数组元素的长度(字节) n...原创 2019-01-26 22:56:16 · 404 阅读 · 0 评论 -
机器学习全套教程(七)-- 数据集介绍与划分
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn数据集介绍与划分学习目标目标 知道数据集的分为训练集和测试集 知道sklearn的分类、回归数据集 应用 无 拿到的数据是否全部都用来训练一个模型?1、 数据集的划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型 测试数据:在...原创 2019-03-21 08:57:53 · 961 阅读 · 0 评论 -
机器学习全套教程(八)-- sklearn转换器和估计器
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cnsklearn转换器和估计器学习目标目标 知道sklearn的转换器和估计器流程 应用 无 1、转换器和估计器1.1 转换器想一下之前做的特征工程的步骤?1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transfo...原创 2019-03-21 08:59:04 · 909 阅读 · 0 评论 -
机器学习全套教程(九)-- K-近邻算法
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cnK-近邻算法学习目标目标 说明K-近邻算法的距离公式 说明K-近邻算法的超参数K值以及取值问题 说明K-近邻算法的优缺点 应用KNeighborsClassifier实现分类 了解分类算法的评估标准准确率 应用 Facebook签到位置预测 问题:...原创 2019-03-21 09:03:32 · 1075 阅读 · 1 评论 -
机器学习全套教程(十)-- 模型选择与调优
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn模型选择与调优学习目标目标 说明交叉验证过程 说明超参数搜索过程 应用GridSearchCV实现算法参数的调优 应用 Facebook签到位置预测调优 1、为什么需要交叉验证交叉验证目的:为了让被评估的模型更加准确可信2、什么是交叉验证(cros...原创 2019-03-21 09:04:09 · 433 阅读 · 0 评论 -
机器学习全套教程(六)-- 主成分分析
Python爬虫人工智能教程:www.python88.cn编程资源网:www.python66.cn2.6 主成分分析学习目标目标 应用PCA实现特征的降维 应用 用户与物品类别之间主成分分析 2.6.1 什么是主成分分析(PCA) 定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量 作用:是数据维数压缩,尽可能降低原...原创 2019-03-19 12:42:09 · 1142 阅读 · 2 评论