- 博客(9)
- 收藏
- 关注
原创 SVM的分类超平面的数学推导
给出数学推导,每个向量的意义不再赘述转换原问题确定每个支持向量下的超平面:min y(w^T+b)/||w||间隔最大的为所求最优的超平面 max min y(w^T+b)/||w|| ,即求:arg maxwT,b{minx yi×(wTxi+b)1∣∣w∣∣},yi即labeliarg \space \underset{w^T,b} {max}
2018-10-25 01:31:02 1602
原创 线性回归 Python 语言实现
先占一个坑,最近几周在做一个比赛,十一月份回来补代码发上来注释掉免得又鸽了。。。。《机器学习实战》这本书有几点不适合入门者深入学习的地方是关键代码没有给出具体原理,而介绍方式是对机器学习每个基础算法进行讲解,所以经常在学习几个章节之间会感觉到断层,需要其他一些地方自行理解。线性回归这章后面的优化方式又讲的太多没讲清,我认为这是一个问题,博客也不好记。最好在一个专门的章节讲优化方式。公式推导见...
2018-10-24 18:36:32 399
原创 线性回归系数,局部加权线性回归系数的数学推导
用最小二乘法Ordinary Least Square即通过最小化误差的平方和寻找数据的最佳函数匹配∑i=1m(y−xiTw)2\sum_{i=1}^{m}(y-x_i^Tw)^2i=1∑m(y−xiTw)2用矩阵表示:(y−Xw)T(y−Xw)(y-Xw)^T(y-Xw)(y−Xw)T(y−Xw)对这个式子求导,令其等于0,解出www即为最优解。结论为w^=(XTX)−1...
2018-10-18 18:09:20 2391 1
原创 最大似然函数
补一下概率论的知识,不会还得翻书,稍微记一下几个点。1.MLE:最大似然估计2.确定最值点:∂∂θjL=0或∂∂θjlnL=0\frac{\partial}{\partial \theta_j}L=0 或 \frac{\partial}{\partial \theta_j}ln L=0∂θj∂L=0或∂θj∂lnL=03.最大似然估计的不变性:若θ^\hat{\theta}θ^是θ...
2018-10-12 10:41:24 1076
原创 逻辑回归分类器(Logistic Regression)
目录Logistic回归概述Logistic回归分类器,Sigmoid 函数最优化理论确定回归系数(weight)梯度上升法数学推导随机梯度上升处理数据的缺失值实例:预测病马死亡率吃了概率论的亏逻辑回归(Logistic Regression)概述直观来说,用一条直线对一些现有的数据点进行拟合的过程,就叫做回归。Logistic分类的主要思想:根据现有数据...
2018-10-11 18:26:07 11087 1
原创 朴素贝叶斯分类器-文档分类
朴素贝叶斯理论概述条件概率用朴素贝叶斯进行文档分类文本分类代码文档词袋模型实例:朴素贝叶斯过滤垃圾邮件朴素贝叶斯理论概述朴素贝叶斯(navie bayes)是贝叶斯决策理论的一部分,只考虑最简单的假设,用 Python 将文本切分为词向量,然后利用词向量对文档分类。优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标...
2018-10-08 21:21:34 1101
原创 concurrent.futures 并发爬取 wos 的部分专利号和施引专利
工作上需要爬取 wos 的一些专利号和施引专利,做成了一个 excel 表格。施引专利在系统默认的导出里是没有的。第一次实际运用了concurrent.futures 来处理并发下载,确实很简单。一开始用 scrapy 框架貌似连接非常慢,不知道什么原理,三次连接两次超时,于是手写了一个用很多 try/except 结构的 spider 。一定要记得写日志和异常处理!!!!全文基本上没有很难...
2018-10-06 22:27:19 1077
原创 scrapy 爬取 arxiv.org 论文
和同学想要建立一个检索 arxiv.org 论文的网站,这是一个 demoGithub地址:https://github.com/Joovo/Arxiv鸽了好久把博客补了,主要实战里熟练了 scrapy 的操作:scrapy shell 检验 xpath 正确性reponse.xpath().extract() 转换为字符串列表str.strip()处理数据获取 xpath 的子节点...
2018-10-06 14:53:00 2654 2
原创 一个OneDark风格的Pycharm配色方案
无聊手撸了一个:一个 OneDark 风格的 Pycharm 配色方案放在Github上了.Github链接
2018-10-02 12:25:59 8894 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人