python
文章平均质量分 69
18.5AU_
这个作者很懒,什么都没留下…
展开
-
python网络爬虫:使用XPath进行网页解析
python网络爬虫使用XPath进行网页解析使用Xpath解析网页Xpath介绍XML路径语言(XML Path Language),它是一种基于XML的树状结构,在数据结构树中找寻节点,确定XML文档中某部分位置的语言。需要把源文件转成树状结构,再对树状结构应用相应的xpath查询语句基本语法使用Xpath需要从lxml库中导入etree模块,还需使用HTML类对需要匹配的HTML对象进行初始化(XPath只能处理文档的DOM表现形式)。HTML类的基本语法格式如下。lxml.e原创 2021-05-05 00:14:17 · 5361 阅读 · 0 评论 -
python网络爬虫:使用正则表达式解析网页
python网络爬虫使用正则表达式解析网页Python正则表达式正则表达式是一种可以用于模式匹配和替换的工具,可以让用户通过使用一系列的特殊字符构建匹配模式,然后把匹配模式与待比较字符串或文件进行比较,根据比较对象中是否包含匹配模式,执行相应的程序(替换删除等)。严格的字符匹配python只支持re模块进行正则表达式的书写严格的字符匹配示例查找import reexample_obj = "1. A small sentence. - 2. Another tiny sentence.原创 2021-05-04 14:11:11 · 2943 阅读 · 0 评论 -
python网络爬虫:谷歌开发者工具介绍
python网络爬虫解析网络使用chrome开发者工具查看网页chrome浏览器提供了一个非常便利的开发者工具,供广大web开发者使用,该工具提供包括查看网页元素、查看请求资源列表、调试JS等功能。该工具其中一个打开方式可通过右键单击chrome浏览器页面,在弹出菜单中单击图所示的“检查”选项打开。也可以单击chrome浏览器右上角快捷菜单,如图所示,单击“更多工具”选项中的“开发者工具”选项,或使用快捷键组合Ctrl+Shift+I。chrome开发者工具目前包括了9个面板,界面如图所示。原创 2021-05-04 12:48:16 · 348 阅读 · 0 评论 -
python基础:统计小说词频
题目要求:用Python统计小说中各单词出现的频次,并按频次由高到低排序。读取文件f = open('C:/Users/dell/Desktop/散文.txt','r')txt = f.read(100)f.close()print(txt)f = open('C:/Users/dell/Desktop/散文.txt','r')txt_lines = f.readlines()#换行符f.close()print(txt_lines)统计txt中单词的频次import ref =原创 2021-04-27 20:27:42 · 2347 阅读 · 0 评论