机器学习
文章平均质量分 88
johnsondiao0521
好读书好纠结
展开
-
RF、GBDT、XGBoost面试级整理
复习树模型,先把它记录下来。RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性。 根据个体学习器的生成方式,目前的集成学习方法大致分为两大类:即个体学习器之间存在强依赖关系、必须串行生成的序列化方法,以及个体学习器间不存在强依赖关系、可同时生成的并行化方法;前者的代表就是Boosting,后者的代表是Bagging和“随机森林”(Random Forest)。1、RF1.1 原理原创 2022-04-07 16:27:19 · 100 阅读 · 0 评论 -
自然语言处理(NLP)的任务
1. 什么是NLP自然语言处理是人工智能的一个子领域,自然语言处理是研究人与人交互中以及在人与计算机交互中的语言问题的一门学科。人工智能应用的领域主要有:数据挖掘、推荐算法、智能搜索、广告推荐、自然语言处理、计算机视觉、自动驾驶等等。2.NLP主要研究方向信息抽取:从给定文本中抽取重要的信息,比如时间、地点、任务、事件、原因、结果、数字、日期、货币、专有名词等等。通俗来说,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。文本生成:机器像人一样使用自然语言处理进行表达和写作。依据输入原创 2021-07-09 18:22:58 · 5861 阅读 · 0 评论 -
安装faiss
faiss安装使用Anaconda安装使用Anaconda安装使用faiss是最方便快速的方式,facebook会及时推出faiss的新版本conda安装包,在conda安装时会自行安装所需的libgcc, mkl, numpy模块。faiss的cpu版本目前仅支持Linux和MacOS操作系统,gpu版本提供可在Linux操作系统下用CUDA8.0/CUDA9.0/CUDA9.1编译的版本。注意,上面语句中的cuda90并不会执行安装CUDA的操作,需要提前自行安装。#安装cpu版本#更新co转载 2020-11-03 11:19:43 · 328 阅读 · 0 评论 -
机器学习实战 第3章 决策树
第3章 决策树决策树 概述决策树(Decision Tree)算法是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。我们这章节只讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-then 规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。决策树学习通常包括 3 个步骤:特征选择、决策树的生成和决策树的修剪...原创 2018-12-12 10:31:20 · 218 阅读 · 0 评论 -
机器学习实战 第2章 k-近邻算法
第2章 k-近邻算法KNN 概述k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法。一句话总结:近朱者赤近墨者黑!k 近邻算法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k 近邻算法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其 k 个最近邻的训练实例的类别,通...原创 2018-12-11 16:26:29 · 314 阅读 · 0 评论 -
机器学习实战 第4章 基于概率论的分类方法:朴素贝叶斯
原创 2018-12-04 18:55:46 · 284 阅读 · 0 评论