自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 SVM的分类超平面的数学推导

给出数学推导,每个向量的意义不再赘述转换原问题确定每个支持向量下的超平面:min y(w^T+b)/||w||间隔最大的为所求最优的超平面 max min y(w^T+b)/||w|| ,即求:arg maxwT,b{minx yi×(wTxi+b)1∣∣w∣∣},yi即labeliarg \space \underset{w^T,b} {max}

2018-10-25 01:31:02 1602

原创 线性回归 Python 语言实现

先占一个坑,最近几周在做一个比赛,十一月份回来补代码发上来注释掉免得又鸽了。。。。《机器学习实战》这本书有几点不适合入门者深入学习的地方是关键代码没有给出具体原理,而介绍方式是对机器学习每个基础算法进行讲解,所以经常在学习几个章节之间会感觉到断层,需要其他一些地方自行理解。线性回归这章后面的优化方式又讲的太多没讲清,我认为这是一个问题,博客也不好记。最好在一个专门的章节讲优化方式。公式推导见...

2018-10-24 18:36:32 399

原创 线性回归系数,局部加权线性回归系数的数学推导

用最小二乘法Ordinary Least Square即通过最小化误差的平方和寻找数据的最佳函数匹配∑i=1m(y−xiTw)2\sum_{i=1}^{m}(y-x_i^Tw)^2i=1∑m​(y−xiT​w)2用矩阵表示:(y−Xw)T(y−Xw)(y-Xw)^T(y-Xw)(y−Xw)T(y−Xw)对这个式子求导,令其等于0,解出www即为最优解。结论为w^=(XTX)−1...

2018-10-18 18:09:20 2391 1

原创 最大似然函数

补一下概率论的知识,不会还得翻书,稍微记一下几个点。1.MLE:最大似然估计2.确定最值点:∂∂θjL=0或∂∂θjlnL=0\frac{\partial}{\partial \theta_j}L=0 或 \frac{\partial}{\partial \theta_j}ln L=0∂θj​∂​L=0或∂θj​∂​lnL=03.最大似然估计的不变性:若θ^\hat{\theta}θ^是θ...

2018-10-12 10:41:24 1076

原创 逻辑回归分类器(Logistic Regression)

目录Logistic回归概述Logistic回归分类器,Sigmoid 函数最优化理论确定回归系数(weight)梯度上升法数学推导随机梯度上升处理数据的缺失值实例:预测病马死亡率吃了概率论的亏逻辑回归(Logistic Regression)概述直观来说,用一条直线对一些现有的数据点进行拟合的过程,就叫做回归。Logistic分类的主要思想:根据现有数据...

2018-10-11 18:26:07 11087 1

原创 朴素贝叶斯分类器-文档分类

朴素贝叶斯理论概述条件概率用朴素贝叶斯进行文档分类文本分类代码文档词袋模型实例:朴素贝叶斯过滤垃圾邮件朴素贝叶斯理论概述朴素贝叶斯(navie bayes)是贝叶斯决策理论的一部分,只考虑最简单的假设,用 Python 将文本切分为词向量,然后利用词向量对文档分类。优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标...

2018-10-08 21:21:34 1101

原创 concurrent.futures 并发爬取 wos 的部分专利号和施引专利

工作上需要爬取 wos 的一些专利号和施引专利,做成了一个 excel 表格。施引专利在系统默认的导出里是没有的。第一次实际运用了concurrent.futures 来处理并发下载,确实很简单。一开始用 scrapy 框架貌似连接非常慢,不知道什么原理,三次连接两次超时,于是手写了一个用很多 try/except 结构的 spider 。一定要记得写日志和异常处理!!!!全文基本上没有很难...

2018-10-06 22:27:19 1077

原创 scrapy 爬取 arxiv.org 论文

和同学想要建立一个检索 arxiv.org 论文的网站,这是一个 demoGithub地址:https://github.com/Joovo/Arxiv鸽了好久把博客补了,主要实战里熟练了 scrapy 的操作:scrapy shell 检验 xpath 正确性reponse.xpath().extract() 转换为字符串列表str.strip()处理数据获取 xpath 的子节点...

2018-10-06 14:53:00 2654 2

原创 一个OneDark风格的Pycharm配色方案

无聊手撸了一个:一个 OneDark 风格的 Pycharm 配色方案放在Github上了.Github链接

2018-10-02 12:25:59 8894 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除