自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

橘子派

计算机科学与艺术

  • 博客(4)
  • 收藏
  • 关注

原创 谣言识别系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)

谣言识别系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)简介谣言识别系统是新闻分类系统的后续,这次我补充了正确新闻的数据集,为了体现新闻的绝对正确性,我爬取了澎湃新闻的数据。谣言的数据集爬取与处理请参考我的新闻处理系统的数据集,请看点开下面的网址。http://blog.csdn.net/sileixinhua/article/details/74943336所

2017-07-13 19:46:49 16059 5

原创 新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)

新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(SVM)简介新闻分类系统可以对十种新闻进行自动分类并显示准确性的结果。(交叉验证准确性在65%~70%,数据集一共3183,可增加数据集提高准确率。)系统分为三部分:爬虫部分,使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站,其实

2017-07-11 12:12:24 22354 17

原创 我的AI转型之路与AI之我见(非985211的奋斗路程与视角)

前言我是一名传统网页(php+ruby)和应用开发(android)转型AI相关开发的码农。在非985211高校出身的情况下,我前期自己买书学习,到现在考研上课全身心的投入智能系统的开发当中来,在算法当中理解了数据和模型,对一些基本问题的解决和现在社会上的环境风气有自己的看法,在这里不吐不快,和大家分享一下。对于人工智能的入门和基础理解我有一篇综述的博客文章,手把手的入门机器学习的”Hello Wo

2017-07-16 14:52:57 29249 53

原创 爬取妹子图(python):爬虫(bs+rq)+ gevent多线程

爬取妹子图:爬虫(bs+rq)+ gevent多线程简介我观察爬取妹子图算是爬虫专业户必做的事情之一,所以我也做了一个,结果是有3.45GB,49847张图。Beautiful Soup + Requests 的学习算是告一段落了,下面开始尝试scrapy和Sasila。https://github.com/DarkSand/Sasila推荐一下Sasila。scrapy的确对于新手很不友好。开发环

2017-07-15 19:51:47 7028 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除