自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Beautiful soup

Xpath XPath(XML Path Language)是一门在XML文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历。 lxml lxml类库是一个Html/XML的解析器,主要功能是如何解析和提取HTML/XML数据。 Beautiful soup 使用lxml库时需要编写和测试XPath语句,显然降低了开发效率。除了lxml以外,还可以使用Beautiful Soup来提取...

2019-04-04 11:34:32 365

原创 python中json文件字典内容的提取

python中json文件内容的提取 import json with open('3_.json', mode='r', encoding='gbk') as f2: setting = json.load(f2) for i in setting: if setting[i]: print(setting[i]) 大概的结构就是这样. ...

2019-04-01 20:22:43 10089

原创 python中的xpath解析定位

爬取的网站:http://jbk.39.net/chancegz/ 这里只针对个别属性值: #例如:'别名'下的span标签文本,‘发病部位’下的span标签文本以及‘挂号科室‘下的span标签文本 # def disease(url): text = get_html(url) tree = etree.HTML(text) bm = tree.xpath('//ul[...

2019-04-01 13:36:45 6476 1

原创 strip() 和 split()的区分

strip() 和 split()的区分 strip翻译为删除、清除,而split译为分裂、分开。 strip Python中的 strip() 方法用来删除括号内指定字符串头部和尾部字符,当括号内为空时默认为删除空格、换行符或字符序列。需要注意的是该方法只能删除开头或者是结尾的字符,无法删除字符串中间部分的字符。 str = "str123456str" print str.strip( 'st...

2019-03-27 16:13:41 1869

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除