机器学习-实战-Python
橘子派
计算机科学与艺术
展开
-
机器学习-实战-入门-iris数据分析
作者:橘子派声明:版权所有,转载请注明出处,谢谢。源码地址:https://github.com/sileixinhua/Python_data_science_by_iris本项目为机器学习的学习笔记 用iris.csv作为数据集 测试了一下功能代码实验环境:Windows10SublimeAnaconda 1.6.0Python3.6原创 2017-04-22 21:43:52 · 14596 阅读 · 0 评论 -
机器学习-实战-入门-MNIST手写数字识别
作者:橘子派声明:版权所有,转载请注明出处,谢谢。源码地址:https://github.com/sileixinhua/Python_Machine_Learning_Sklearn_MNIST实验环境:Windows10SublimeAnaconda 1.6.0Python3.6代码功能包括:一.ubyte数据集转换成csv形式#原创 2017-04-22 21:49:49 · 4483 阅读 · 3 评论 -
机器学习-实战-入门-不同语种的识别
作者:橘子派声明:版权所有,转载请注明出处,谢谢。源码地址:https://github.com/sileixinhua/Python_sklearn_svm_language实验环境:Windows10SublimeAnaconda 1.6.0Python3.6语言识别数据集的基本数据分析方法,包括SVM算法。#运用sklearn的SV原创 2017-04-22 21:54:54 · 3374 阅读 · 0 评论 -
机器学习-实战-入门-linearSVC和SVC,身高体重与胖瘦关系的分类与预测
作者:橘子派声明:版权所有,转载请注明出处,谢谢。源码地址:https://github.com/sileixinhua/Python_sklearn_svm_linearSVC_SVC实验环境:Windows10SublimeAnaconda 1.6.0Python3.6根据现有身高和体重训练模型,再对测试集做出判断代码功能一.根据原创 2017-04-22 21:59:55 · 17946 阅读 · 1 评论 -
爬取妹子图(python):爬虫(bs+rq)+ gevent多线程
爬取妹子图:爬虫(bs+rq)+ gevent多线程简介我观察爬取妹子图算是爬虫专业户必做的事情之一,所以我也做了一个,结果是有3.45GB,49847张图。Beautiful Soup + Requests 的学习算是告一段落了,下面开始尝试scrapy和Sasila。https://github.com/DarkSand/Sasila推荐一下Sasila。scrapy的确对于新手很不友好。开发环原创 2017-07-15 19:51:47 · 7034 阅读 · 5 评论 -
谣言识别系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)
谣言识别系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)简介谣言识别系统是新闻分类系统的后续,这次我补充了正确新闻的数据集,为了体现新闻的绝对正确性,我爬取了澎湃新闻的数据。谣言的数据集爬取与处理请参考我的新闻处理系统的数据集,请看点开下面的网址。http://blog.csdn.net/sileixinhua/article/details/74943336所原创 2017-07-13 19:46:49 · 16157 阅读 · 5 评论 -
新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)
新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(SVM)简介新闻分类系统可以对十种新闻进行自动分类并显示准确性的结果。(交叉验证准确性在65%~70%,数据集一共3183,可增加数据集提高准确率。)系统分为三部分:爬虫部分,使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站,其实原创 2017-07-11 12:12:24 · 22443 阅读 · 17 评论