机器学习
文章平均质量分 75
JeangLee
技术在于折腾
展开
-
机器学习_逻辑回归分类
逻辑回归分类是机器学习中常用的一种分类方法,采用单位阶跃函数的特点进行分类。本文试图用理论推导、python实现来说明该算法。单位阶跃函数单位阶跃函数即Sigmoid函数,其值范围在0~1之间,并且在x=0处会产生跳跃。表达式如下: g(z)=11+e−z g(z)=\frac{1}{1+e^{-z}} 函数图形如下。该图形有个特点是,当x<<0时,f(x)=0; 当x>>0时,f(x)=原创 2017-07-14 22:40:51 · 487 阅读 · 0 评论 -
机器学习_朴素贝叶斯算法识别手写数字
朴素贝叶斯算法是基于条件概率的一种分类算法,通过概率大小来进行分类,经常用于分类文档。本文用python实现朴素贝叶斯算法,并用kaggle识别手写数字的数据集来训练,得到81%的准确率。虽然准确率可能比不上其它如SVM、神经网络等算法,但是朴素贝叶斯算法相对来说简单,计算速度也较快。朴素贝叶斯理论说明朴素贝叶斯的基本公式: P(c1|w)>P(c0|w)P(c1|w)...原创 2017-07-17 23:59:16 · 6491 阅读 · 4 评论 -
机器学习_scikit-learn中的SVM
支持向量机(SVM)是一种可用于分类和回归的有效监督学习方法,是一种基于最大间隔的分类器。对于 SVM 的理解需要很多数学理论知识,尤其是对于拉格朗日对偶求解的理解。由于水平有限,文章并未用python实现SVM算法,而是用Scikit-learn中的libsvm来简单介绍下支持向量机的用法。原创 2017-07-23 20:54:39 · 941 阅读 · 0 评论 -
Python数据库基本操作
最近有个项目由于版本原因使某些重要数据丢失、未存储到数据库中,需要从线上故障日志中统计这些数据,并将统计结果输出并补偿数据库。刚开始对python并不是很熟练,最先在服务器上采用grep|awk等命令获取想要的格式化数据文件后,由于数据冗余,所以手动采取措施显然不现实,因此想到用Java来读取文件并进行此数据操作,可代码写下来发现太繁杂了,不适合做日志数据处理。经Leader提醒,毅然决定采...原创 2018-04-05 21:58:21 · 363 阅读 · 0 评论