- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 Python爬虫入门(三)数据提取(BeautifulSoup)
BeautifulSoup4库和lxml一样,BeautifulSoup也是一个 基于HTML/XML的解析器,主要功能也是如何解析和提取html/xml数据Lxml只会局部遍历,而beautifulsoup是基于HTML DOM(Document Object Model)的,会载入整个文档,解析整个DOM树,因此需要的时间和内存开销会大,性能要低于lxmlBeautifulsoup...
2019-11-17 15:51:35 892
原创 Python爬虫入门(二)数据提取(lxml)
XPath语法和lXml模块什么是XPath?Xpath是一门在xml和html文档中查找信息的语言,可用来在xml和html文档中对元素和属性进行遍历Xpath开发工具chrome插件xpath helper Firefox插件try xpathXpath语法:选取节点:XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。...
2019-11-14 18:38:25 807
原创 Python爬虫入门(一)网络请求
url组成scheme://host:port/path?query-string=xxx/anchorscheme:代表的是访问的协议,一般为http或者https以及ftp等。host:主机名,域名,比如www.baidu.compath:查找路径query-string:查询字符串。anchor:锚点,后台一般不用管,前端用来页面定位的http和https协...
2019-11-11 12:02:45 379
原创 C语言回文字符串
“回文串”是一个正读和反读都一样的字符串,字符串由数字和小写字母组成,比如“level”或者“abcdcba”等等就是回文串。请写一个程序判断读入的字符串是否是“回文”。输入:包含多个测试实例,每一行对应一个字符串,串长最多100字母。输出:对每个字符串,输出它是第几个,如第一个输出为"case1:";如果一个字符串是回文串,则输出"yes",否则输出"no",在yes/no之前用一个空格...
2019-10-07 20:06:47 14733 2
weatherSpider.py
2019-11-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人