自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python爬虫入门(三)数据提取(BeautifulSoup)

BeautifulSoup4库和lxml一样,BeautifulSoup也是一个 基于HTML/XML的解析器,主要功能也是如何解析和提取html/xml数据Lxml只会局部遍历,而beautifulsoup是基于HTML DOM(Document Object Model)的,会载入整个文档,解析整个DOM树,因此需要的时间和内存开销会大,性能要低于lxmlBeautifulsoup...

2019-11-17 15:51:35 892

原创 Python爬虫入门(二)数据提取(lxml)

XPath语法和lXml模块什么是XPath?Xpath是一门在xml和html文档中查找信息的语言,可用来在xml和html文档中对元素和属性进行遍历Xpath开发工具chrome插件xpath helper Firefox插件try xpathXpath语法:选取节点:XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。...

2019-11-14 18:38:25 807

原创 Python爬虫入门(一)网络请求

url组成scheme://host:port/path?query-string=xxx/anchorscheme:代表的是访问的协议,一般为http或者https以及ftp等。host:主机名,域名,比如www.baidu.compath:查找路径query-string:查询字符串。anchor:锚点,后台一般不用管,前端用来页面定位的http和https协...

2019-11-11 12:02:45 379

原创 C语言回文字符串

“回文串”是一个正读和反读都一样的字符串,字符串由数字和小写字母组成,比如“level”或者“abcdcba”等等就是回文串。请写一个程序判断读入的字符串是否是“回文”。输入:包含多个测试实例,每一行对应一个字符串,串长最多100字母。输出:对每个字符串,输出它是第几个,如第一个输出为"case1:";如果一个字符串是回文串,则输出"yes",否则输出"no",在yes/no之前用一个空格...

2019-10-07 20:06:47 14733 2

weatherSpider.py

这是一个用BeautifulSoup写的一个爬虫小实例,能够爬取中国天气网全国城市的最低气温,并将气温最低排名前十的城市提出来,用pyecharts生成柱状图。

2019-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除