原博文
2019-07-09 09:46 −
有些数据是没有专门的数据集的,为了找到神经网络训练的数据,自然而然的想到了用爬虫的方法开始采集数据。一开始采用了网上的一个动态爬虫的代码,发现爬取的图片大多是重复的,有效图片很少。 动态爬虫:
from lxml import etree import requests import re im...
相关推荐
2019-12-22 16:14 −
1 with open('E:/信息.docx','rb') as f:
2 read_data = f.read()
3 f.closed
‘rb’ 以二进制形式读取指定路径的文件;
再以二进制形式写入指定路径'wb'。
1 with open('E:/信息(2)....
0
156
2019-12-13 17:24 −
## 一、编码: ### (一)编码分类 ①ascii编码: 占有1个字节,8位,可表示2**8个字符,(py2默认编码方式)。 ②unicode: 万国码,占有4个字节,32位,可表示2**32个字符。 ③utf-8: 对万国码压缩:保留8位的倍数,多余的0去掉ÿ