自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Beautiful soup

XpathXPath(XML Path Language)是一门在XML文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历。lxmllxml类库是一个Html/XML的解析器,主要功能是如何解析和提取HTML/XML数据。Beautiful soup使用lxml库时需要编写和测试XPath语句,显然降低了开发效率。除了lxml以外,还可以使用Beautiful Soup来提取...

2019-04-04 11:34:32 360

原创 python中json文件字典内容的提取

python中json文件内容的提取import jsonwith open('3_.json', mode='r', encoding='gbk') as f2: setting = json.load(f2) for i in setting: if setting[i]: print(setting[i])大概的结构就是这样....

2019-04-01 20:22:43 10080

原创 python中的xpath解析定位

爬取的网站:http://jbk.39.net/chancegz/这里只针对个别属性值:#例如:'别名'下的span标签文本,‘发病部位’下的span标签文本以及‘挂号科室‘下的span标签文本#def disease(url): text = get_html(url) tree = etree.HTML(text) bm = tree.xpath('//ul[...

2019-04-01 13:36:45 6465 1

原创 strip() 和 split()的区分

strip() 和 split()的区分strip翻译为删除、清除,而split译为分裂、分开。stripPython中的 strip() 方法用来删除括号内指定字符串头部和尾部字符,当括号内为空时默认为删除空格、换行符或字符序列。需要注意的是该方法只能删除开头或者是结尾的字符,无法删除字符串中间部分的字符。str = "str123456str"print str.strip( 'st...

2019-03-27 16:13:41 1838

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除