python
文章平均质量分 79
HHXUN
天道酬勤
展开
-
python语法(一)
list:就是数组,py中不用定义数据的类型,而且list中可以有不同数据类型的数据。 是有序的组合,可以随时添加和删除数据。 len(list名称)获得list元素的个数; list.append(数据):往list中添加数据; list.insert(1,数据):往索引号1的位置插入数据; list.pop():删除list末尾的数据; list.pop(index原创 2017-10-26 10:34:39 · 382 阅读 · 0 评论 -
BeautifulSoup爬取花千骨小说(学习笔记)
安装pip install beautifulsoup4 从HTML或者XML文件中提取数据 安装HTML解析器pip install lxml html中包括Tag,Name,Attributes。 Beautifulsoup用NavigableString类来包装tag中的字符串。 遍历文档树,搜索文档树,修改文档树。 爬虫思路: 分析13原创 2017-10-26 10:38:10 · 490 阅读 · 0 评论 -
python学习笔记(BeautifulSoup4)
BeautifulSoup4是一个从html或者xml中提取数据的py库。 lxml是局部遍历,BS是基于HTML DOM的,会载入整个文档,解析整个DOM树,时间和空间都会大很多。 #创建BS对象 soup = BeautifulSoup(html) #格式化打印出整个soup对象的内容 print (soup.prettify()) 1.Tag 就是ht原创 2018-01-14 21:50:05 · 3933 阅读 · 0 评论