Story–teller-CSDN博客

原创 Python爬虫入门（三）数据提取（BeautifulSoup）

BeautifulSoup4库和lxml一样，BeautifulSoup也是一个基于HTML/XML的解析器，主要功能也是如何解析和提取html/xml数据Lxml只会局部遍历，而beautifulsoup是基于HTML DOM(Document Object Model)的，会载入整个文档，解析整个DOM树，因此需要的时间和内存开销会大，性能要低于lxmlBeautifulsoup...

2019-11-17 15:51:35 892

原创 Python爬虫入门（二）数据提取（lxml）

XPath语法和lXml模块什么是XPath？Xpath是一门在xml和html文档中查找信息的语言，可用来在xml和html文档中对元素和属性进行遍历Xpath开发工具chrome插件xpath helper Firefox插件try xpathXpath语法：选取节点：XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。...

2019-11-14 18:38:25 807

原创 Python爬虫入门（一）网络请求

url组成scheme://host:port/path?query-string=xxx/anchorscheme：代表的是访问的协议，一般为http或者https以及ftp等。host：主机名，域名，比如www.baidu.compath：查找路径query-string：查询字符串。anchor：锚点，后台一般不用管，前端用来页面定位的http和https协...

2019-11-11 12:02:45 379

原创 C语言回文字符串

“回文串”是一个正读和反读都一样的字符串，字符串由数字和小写字母组成，比如“level”或者“abcdcba”等等就是回文串。请写一个程序判断读入的字符串是否是“回文”。输入：包含多个测试实例，每一行对应一个字符串，串长最多100字母。输出：对每个字符串，输出它是第几个，如第一个输出为"case1:"；如果一个字符串是回文串，则输出"yes",否则输出"no"，在yes/no之前用一个空格...

2019-10-07 20:06:47 14733 2

weatherSpider.py

这是一个用BeautifulSoup写的一个爬虫小实例，能够爬取中国天气网全国城市的最低气温，并将气温最低排名前十的城市提出来，用pyecharts生成柱状图。

2019-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人