- 博客(4)
- 收藏
- 关注
原创 Beautiful soup
XpathXPath(XML Path Language)是一门在XML文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历。lxmllxml类库是一个Html/XML的解析器,主要功能是如何解析和提取HTML/XML数据。Beautiful soup使用lxml库时需要编写和测试XPath语句,显然降低了开发效率。除了lxml以外,还可以使用Beautiful Soup来提取...
2019-04-04 11:34:32 367
原创 python中json文件字典内容的提取
python中json文件内容的提取import jsonwith open('3_.json', mode='r', encoding='gbk') as f2: setting = json.load(f2) for i in setting: if setting[i]: print(setting[i])大概的结构就是这样....
2019-04-01 20:22:43 10091
原创 python中的xpath解析定位
爬取的网站:http://jbk.39.net/chancegz/这里只针对个别属性值:#例如:'别名'下的span标签文本,‘发病部位’下的span标签文本以及‘挂号科室‘下的span标签文本#def disease(url): text = get_html(url) tree = etree.HTML(text) bm = tree.xpath('//ul[...
2019-04-01 13:36:45 6479 1
原创 strip() 和 split()的区分
strip() 和 split()的区分strip翻译为删除、清除,而split译为分裂、分开。stripPython中的 strip() 方法用来删除括号内指定字符串头部和尾部字符,当括号内为空时默认为删除空格、换行符或字符序列。需要注意的是该方法只能删除开头或者是结尾的字符,无法删除字符串中间部分的字符。str = "str123456str"print str.strip( 'st...
2019-03-27 16:13:41 1898
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人