机器学习
文章平均质量分 95
zheng_weibin
一个转行数据分析的菜鸟,希望有朝一日学成独孤九剑纵横江湖
展开
-
不用框架,Python实现手写数字识别
不用框架,纯Python识别手写字体 有一句话说得好,要有造轮子的技术和用轮子的觉悟,今年来人工智能火的不行,大家都争相学习机器学习,作为学习大军中的一员,我觉得最好的学习方法就是用python把机器学习算法实现一遍,下面我介绍一下用逻辑回归实现手写字体的识别。逻辑回归知识点回顾 线性回归简单又易用hθ(x)=θTxhθ(x)=θTxh_\theta(x)=\theta...原创 2018-06-15 15:27:38 · 10264 阅读 · 5 评论 -
用python从零开始搭建神经网络
用python从零开始搭建人工神经网络什么是人工神经网络?分类神经网络主要是处理分类问题,比如垃圾邮件识别:现在有一封电子邮件,把其中的所有词汇提取出来,放到机器里,机器判断这封邮件是否垃圾邮件。这种能自动对输入的东西进行分类的机器,就叫做分类器(classifier)。 分类器的输入是一个数值向量,叫做特征向量。比如在垃圾邮件识别例子中,用0,1分别代表字典中的单词在...原创 2018-06-28 11:09:51 · 7092 阅读 · 6 评论 -
利用决策树算法预测西瓜的好坏
最近看完了《机器学习实战》和天池直播课堂中的决策树算法,觉得意犹未尽,特别是信息熵部分理解并不透彻,于是又把西瓜书中的决策树看了,略有感悟,希望与大家分享一下,下面我按照自己的理解,尽量用通俗的语言总结记录下决策树算法。1.决策树介绍举个通俗的栗子来解释一下什么是决策树,想象一个女孩的母亲要给这个女孩介绍男朋友: 女儿:有没有房子?母亲:有。 女儿:长的帅不帅?母亲:挺帅...原创 2018-09-05 16:39:57 · 12639 阅读 · 3 评论 -
利用朴素贝叶斯进行新闻文本分类
初探文本分类,本文使用的数据是5000条中文新闻文本数据,目的是使用朴素贝叶斯算法,对中文新闻文本进行分类预测。流程如下:文本数据载入及清洗搜狗新闻数据源:http://www.sogou.com/labs/resource/ca.php我们从搜狗下载的数据是类似XML的带标签对的数据,因此需要使用正则表达式或者BeautifulSoup等工具处理为dataframe格式,如下图,大家通过...原创 2018-09-19 15:50:44 · 14676 阅读 · 5 评论