自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Python—爬取图库(一)

爬取图库(一)1. 选取网站,构造思路: *a*.选取网址url:http://desk.zol.com.cn/dongman/haizeiwang/ ![在这里插入图片描述](https://img-blog.csdnimg.cn/2019030312214851.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,sha...

2019-03-03 12:37:22 422

原创 爬虫爬爬(二):下载小说全集

爬取小说全集:选择url:http://www.136book.com/(还是选择136书屋)随便选一篇已更新完的小说,我选的url:http://www.136book.com/huidao/点击查看源码:我们发现这些链接都在div id=“book_detail” class=“box1”,ol class="clearfix"盒子中li标签的href里面。2. 思路:1:...

2019-02-28 14:46:05 2131

原创 NLP文本分类(一)Excel文档批量转txt

**NLP文本处理(一):Excel文档批量转txt**1:打开Excel文档,简单处理一下排序问题(我的第一列是文本,第二列是打好的标签),给他们简单的按标签排个序分分类。点击数据一栏,选择好排序顺序。2:任选一个表格栏按下ALT+F11键进入VBA模式。Sub ExChange()Dim I As IntegerFor I = 2 To 70 '我有70条0标签数据,第一...

2019-02-26 20:20:54 1120

原创 Python—爬取图库(二):做马赛克拼图图片

https://www.iplaysoft.com/andreamosaic.html

2019-03-03 14:29:01 722 1

原创 Python爬虫爬爬(一):爬取小说全集地址

爬取小说全集地址模块库准备:urllib模块与BeautifulSoup安装过程:urillib库是python的内置库无需安装BeautifulSoup库安装:Win+R输入CMD命令进入控制台,再输入pip install BeautifulSoup。请注意pip版本状态。选取合适的爬取网址:这里我们用136书屋作为我们第一个实战例子:url:http://www.136...

2019-02-27 01:02:46 979 1

原创 NLP文本分类(二)结巴对Txt文件的分词及除去停用词

结巴对Txt文件的分词及除去停用词安装结巴:Win+R输入CMD进入控制台,输入pip install jiebapip install jieba如果提醒 pip版本不够,就根据它的提醒upgrade一下原文档:上代码:我用的是jupyter如果不知道如何进入请同上进入控制台pip install jupyter-notebook安装完后 控制台输入jupyter-noteb...

2019-02-26 21:01:37 4871

原创 win10专业版,家庭版简要安装paddlepaddle

**win10下安装paddlepaddle(失败N次成功两次总结经验专业版,家庭版都行)** paddlepaddle官网下有相关的win系统安装包,本篇以装失败经验概述paddle安装大致过程,比较简要! 与官网给定的参考手册安装方法有某些不同。1:[官网下载地址](http://www.paddlepaddle.org/documentation/docs/zh/1....

2018-12-07 12:46:22 1880

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除