自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 集成学习AdaBoost—原理简述及代码实现

集成学习AdaBoost—知识点简述及代码实现集成学习的简单介绍Boosting简单介绍AdaBoost的工作原理及代码实现弱学习器训练算法:基于错误提升分类器的性能数据说明单层决策树的生成函数完整AdaBoost算法的实现本文为《机器学习》与《机器学习实战》的读书笔记集成学习的简单介绍集成学习通过构建并结合多个学习器来完成学习任务,集成学习的一般过程是:先产生一组 “个体学习器” ,再用某种策略将它们结合起来。这样的个体学习器又称为基学习器或弱学习器,它们通常为决策树、BP神经网络算法等现有的学

2020-08-13 17:47:26 2397

原创 朴素贝叶斯—原理简述及代码实现

朴素贝叶斯—知识点简述及代码实现简要知识贝叶斯决策论条件概率朴素的含义模型中的条件概率应用示例及代码实现数据准备朴素贝叶斯算法朴素贝叶斯分类函数测试结果简要知识适用数据类型:标称型数据目标:预测样本所属类别贝叶斯决策论朴素贝叶斯是贝叶斯决策轮的一部分,而贝叶斯决策论的核心思想是:选择计算结果中 高概率 对应的类别。假设现有一木桶:显然,经过计算我们得知从中取得白球的概率P1=1/3,取得黑球的概率为P2=2/3,有P2 > P1。此时从中摸球,则根据贝叶斯决策论我们预测摸得的球为

2020-08-06 20:23:46 3907

原创 PCA降维—原理简述及代码实现

PCA降维—知识点简述及代码实现应用数据降维的目的特征值分析PCA的工作原理代码实现应用数据PCA降维适用于特征属性为连续数值型数据,目标变量为标称型数据的数据集,例如下面的西瓜数据集:密度含糖量是否好瓜10.6970.460是20.7740.376是30.6340.264否40.6080.318否50.5560.215否注: 当然这里是假设西瓜“是否好瓜”仅受这两个因素的影响,真实情况下西瓜数据集不适用于此,因为西瓜

2020-08-06 15:56:36 1951 1

原创 Python爬取京东书籍信息(包括书籍评论数、简介等)

Python爬取京东书籍信息(包括书籍评论数、简介等)一. 工具二. 准备爬取的数据三. 内容简述四. 页面分析(一) 寻找目录中商品所在标签(二) 寻找页面中能爬取到的所有数据(三) 寻找评论数所在链接(四) 寻找书籍简介所在链接五. 代码整合一. 工具PyCharmScrapyChrome浏览器二. 准备爬取的数据items.pyimport scrapyclass JdbookItem(scrapy.Item): # define the fields for your

2020-08-02 18:08:11 4630

原创 决策树—原理简述及代码实现

决策树—代码实现

2020-07-29 16:00:53 505

原创 机器学习—决策树基础

决策树基础本文为周志华老师《机器学习》的读书笔记定义决策树是一类常见的机器学习算法,可基于离散型与连续型属性来生成决策树。决策树学习的目的是生成一棵泛化能力强,即处理未见示能力强的决策树。形状如下:决策树通过递归过程来生成,在决策树基本算法中,有三种情况会导致递归返回:当前节点包含的样本全属于同一类别,无需划分;当前属性集为空集,或是所有样本在所有属性上取值相同,无法划分;当前节点包含的样本集合为空,不能划分。划分选择从根节点开始,在每一个节点处我们都需要不断地选择一个最优的划分

2020-07-15 21:02:34 536

原创 线性/逻辑回归与随机梯度下降—原理简述

本文整理机器学习算法中的线性回归和逻辑回归算法的笔记,其中利用随即梯度下降更新参数。只整理其中的数学原理,不涉及实现代码。目录线性回归随即梯度下降逻辑回归线性回归输入数据:x(X);输出数据:y(Y);拟合的函数:可写做 y = h(x);对于每一条数据,用x1,x2,x3…xn来表示其各个特征分量,则可以做出一个估计函数:,其中可设x0=1,则有θ0 * x0 = θ0 ,θ0可以充当线性方程中的常数项;将上式用向量的方式来表示:;接下来需要有一个机制去评估函数y = h.

2020-07-15 11:40:09 298

原创 python数据科学—Matplotlib

学习笔记目录简易线性图简易散点图可视化异常处理…Matplotlib库简易线性图:举一个最常见的例子,线性方程 y = f (x) 的可视化In[1]: %matplotlib inline import matplotlib.pyplot as plt plt.style.use('seaborn-whitegrid') import numpy as npIn[2]: fig = plt.figure() #创建一个图形 fig

2020-05-14 15:31:13 152

原创 python数据科学—Pandas

学习笔记目录Pandas对象:数据的取值与选择Pandas数值运算方法缺失值的处理:层级索引:合并与连接数据集:累积与分组:Pandas库Pandas对象:Pandas有三个基本数据结构:Series、DataFrame和IndexSeries对象:Series对象与一维的NumPy数组很像,本质的差异是前者多了索引。这个索引可以是隐式的,也可以利用index参数显示定义。所以说Series是特殊的字典。注:与字典不同的是,Series对象还支持数组形式的操作,如通过切片

2020-05-14 11:41:30 168

原创 python数据科学—NumPy

学习笔记目录从头创建数组NumPy基础NumPy用于计算的通用函数NumPy的聚合(最大/小值等)函数数组的计算之广播数组的布尔掩码花哨的索引数组的排序NumPy库从头创建数组:NumPy有许多内置的函数可以用来创建数组import numpy as npnp.zeros(5, dtype=int) #建一长度为5,数值均为0的数组np.ones((3, 5), dtype=float) #建一3x5的数值均为1的浮点型数组np.full((3, 5), 4.44) #

2020-05-14 10:00:33 109

原创 Python爬虫篇--3

学习笔记目录一. 正则表达式二. 抓去网页的思路三. BeautifulSoup类(HTML解析库)一. 正则表达式python的re库:match()方法:两个参数分别是需传入的正则表达式和需要匹配的字符串(细节:标记匹配目标、贪婪与非贪婪、修饰符、转义匹配);search()方法:用途如:利用正则表达式获取第一对“歌手、歌名”对应信息;findall()方法:用途如:利...

2020-04-02 23:46:34 101

原创 Python爬虫篇--2

爬虫基础篇(3.30-3.31)重新收集了request的内容目录一. 爬取网页的通用代码框架二. requests库的七个主要方法三. requests库的request方法一. 爬取网页的通用代码框架import requestsdef getHTMLText(url): try: r = requests. get(url, tim...

2020-04-01 00:21:47 163

原创 Python爬虫篇--1

学习笔记(3.27-3.29)这几天主要学爬虫的基础知识,然后跟着一些示例进行尝试,接下来还得进行一些简单的实战,才能更好地掌握。下面是记录的一些基础知识的笔记。一. 爬虫基础HTTP基本原理:访问网站时分为两个步骤:请求;响应1.请求:①常见的两种请求有GET和POST;②请求网址:URL;③请求头:包 含Cookie、Referer、User-Agent等重要信息;2.响应:①响...

2020-03-30 01:35:28 151

原创 推荐系统的初步学习

学习记录(3.25-3.26)最初这两天吧,先是花一点时间把anaconda跟pycharm装好,然后了解了一下readme文件是怎么写的,才知道需要用到markdown,而且刚刚好我这个CSDN新手可以用markdown来写博客,好像挺巧的hhh。接着我就开始学习《推荐系统实践》,先大概地学习了一二章的前部分内容。我觉得既然是想做音乐推荐下载器的话,那就必须先对推荐系统进行学习。而下...

2020-03-27 00:06:24 208

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除