机器学习
机器学习笔记分享
MrYucsdn
yuqingzhude@163.com
展开
-
XGBoost 入门实战 - 配合sklearn应用
"""本节内容* xgboost 和 sklearn一起使用* 使用校验集选择最佳模型"""from xgboost import XGBClassifier# 加载LibSVM格式数据模块from sklearn.datasets import load_svmlight_filefrom sklearn.metrics import accuracy_scorefrom sklearn.model_selection import train_test_splitfrom matpl原创 2020-06-01 22:25:02 · 546 阅读 · 0 评论 -
XGBoost 入门实战 - xgboost的基础应用
"""本节内容* 直接使用XGBoost训练毒蘑菇分类"""import xgboost as xgbfrom sklearn.metrics import accuracy_score # 计算分类正确率import timefrom matplotlib import pyplotimport graphviz"""整体流程1、构造学习器2、训练模型3、预测"""# 数据读取"""* XGBoost可以加载libsvm格式的文本数据,* libsvm的文件格式(原创 2020-06-01 22:23:50 · 290 阅读 · 0 评论 -
神器Anaconda
1、什么是AnacondaAnaconda就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。Anaconda利用工具/命令conda来进行package和environment的管理,并且已经包含了Python和相关的配套工具。conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理与环境管理。包管理与pip的使用类似;2、安装anaconda安装:https://www.anaco原创 2020-06-01 22:20:37 · 1226 阅读 · 0 评论 -
XGBoost 简介
Boosting是一种可以用来减小监督式学习中偏差的机器学习算法。一组“弱学习者”的集合能否生成一个“强学习者”?弱学习者一般是指一个分类器,它的结果只比随机分类好一点点;强学习者指分类器的结果非常接近真值。GBDTGradient Boosting Decision Tree,全名叫梯度提升决策树,使用的是Boosting的思想。gbdt通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。因为训练的过程是通过原创 2020-06-01 22:14:29 · 895 阅读 · 0 评论 -
Python机器学习
1、为什么使用PythonPython已经成为许多数据科学应用的通用语言,它既有通用编程语言的强大功能,也有特定领域脚本语言(比如MATLAB或R)的易用性。Python有用于数据加载、可视化、统计、自然语言处理、图像处理等各种功能的库。这个大型工具箱为数据科学提供了大量的通用功能和专用功能。使用Python的主要优点之一就是利用终端或者其他类似Jupyter Notebook的工具能够直接与代码进行交互;机器学习和数据分析本质都是迭代过程,有数据驱动分析。这些过程必须要有快速迭代和易于交互的工具。原创 2020-06-01 22:11:13 · 182 阅读 · 0 评论 -
XGBoost OSX安装
事先需要准备的,可以用brew安装:libomp(xgboost支持多线程需要)cmake(build xgboost需要)brew install libompbrew install cmakeXGBoost下载失败,尤其是子模组,搜索错误其实一般都是说postBuffer,其实应该是没梯子网络导致的,连了梯子下载丝般顺滑,我猜你可能是在找这个问题,所以写在前面1.pip install看一眼就行,暂时没发现谁的博文说自己用这种方式安装成功了,也可以试试// 这个库包含了 OpenMP原创 2020-05-18 11:02:50 · 640 阅读 · 0 评论 -
机器学习基础知识 -- 学习摘记
机器学习机器学习本质是一项监督分类/回归问题,"监督"表示你有许多样本,假设你知道这些样本的正确答案,我们不断地把样本交给机器,并告诉机器这些样本是正确或错误的,对机器进行训练,最终达到机器学习的目的。1、有监督学习(数据有label)监督学习就是教会计算机去完成任务,如:根据你已经标记为垃圾邮件的邮件学习识别垃圾邮件,根据你喜欢的电影推荐其他你可能喜欢的电影…监督学习可以理解为以下两种模...原创 2020-04-28 20:17:56 · 303 阅读 · 0 评论 -
人工智能、机器学习、深度学习 -- 学习摘记
一、概念1、人工智能人工智能(Artificial intelligence)简称AI。人工智能是计算机科学的一个分支,它企图了解智能的本质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能目前分为弱人工智能和强人工智能和超人工智能。弱人工智能:(ArtificialNarrow ...原创 2020-04-28 20:14:23 · 1632 阅读 · 0 评论