2017年07月_橘子派

12月 10月 08月 07月 06月 05月 04月

原创谣言识别系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

谣言识别系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）简介谣言识别系统是新闻分类系统的后续，这次我补充了正确新闻的数据集，为了体现新闻的绝对正确性，我爬取了澎湃新闻的数据。谣言的数据集爬取与处理请参考我的新闻处理系统的数据集，请看点开下面的网址。http://blog.csdn.net/sileixinhua/article/details/74943336所

2017-07-13 19:46:49 16059 5

原创新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（SVM）简介新闻分类系统可以对十种新闻进行自动分类并显示准确性的结果。（交叉验证准确性在65%~70%，数据集一共3183，可增加数据集提高准确率。）系统分为三部分：爬虫部分，使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站，其实

2017-07-11 12:12:24 22354 17

原创我的AI转型之路与AI之我见（非985211的奋斗路程与视角）

前言我是一名传统网页（php+ruby）和应用开发（android）转型AI相关开发的码农。在非985211高校出身的情况下，我前期自己买书学习，到现在考研上课全身心的投入智能系统的开发当中来，在算法当中理解了数据和模型，对一些基本问题的解决和现在社会上的环境风气有自己的看法，在这里不吐不快，和大家分享一下。对于人工智能的入门和基础理解我有一篇综述的博客文章，手把手的入门机器学习的”Hello Wo

2017-07-16 14:52:57 29249 53

原创爬取妹子图(python)：爬虫（bs+rq）+ gevent多线程

爬取妹子图：爬虫（bs+rq）+ gevent多线程简介我观察爬取妹子图算是爬虫专业户必做的事情之一，所以我也做了一个，结果是有3.45GB，49847张图。Beautiful Soup + Requests 的学习算是告一段落了，下面开始尝试scrapy和Sasila。https://github.com/DarkSand/Sasila推荐一下Sasila。scrapy的确对于新手很不友好。开发环

2017-07-15 19:51:47 7028 5

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 谣言识别系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

原创 新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

原创 我的AI转型之路与AI之我见（非985211的奋斗路程与视角）

原创 爬取妹子图(python)：爬虫（bs+rq）+ gevent多线程

空空如也

空空如也

原创谣言识别系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

原创新闻分类系统（Python）：爬虫（bs+rq）+数据处理（jieba分词）+分类器（贝叶斯）

原创我的AI转型之路与AI之我见（非985211的奋斗路程与视角）

原创爬取妹子图(python)：爬虫（bs+rq）+ gevent多线程