sss650216-CSDN博客

原创 Beautiful soup

XpathXPath（XML Path Language）是一门在XML文档中查找信息的语言，可用来在XML文档中对元素和属性进行遍历。lxmllxml类库是一个Html/XML的解析器，主要功能是如何解析和提取HTML/XML数据。Beautiful soup使用lxml库时需要编写和测试XPath语句，显然降低了开发效率。除了lxml以外，还可以使用Beautiful Soup来提取...

2019-04-04 11:34:32 416

原创 python中json文件字典内容的提取

python中json文件内容的提取import jsonwith open('3_.json', mode='r', encoding='gbk') as f2: setting = json.load(f2) for i in setting: if setting[i]: print（setting[i]）大概的结构就是这样....

2019-04-01 20:22:43 10182

原创 python中的xpath解析定位

爬取的网站：http://jbk.39.net/chancegz/这里只针对个别属性值：#例如：'别名'下的span标签文本，‘发病部位’下的span标签文本以及‘挂号科室‘下的span标签文本#def disease(url): text = get_html(url) tree = etree.HTML(text) bm = tree.xpath('//ul[...

2019-04-01 13:36:45 6571 1

原创 strip() 和 split()的区分

strip() 和 split()的区分strip翻译为删除、清除，而split译为分裂、分开。stripPython中的 strip() 方法用来删除括号内指定字符串头部和尾部字符，当括号内为空时默认为删除空格、换行符或字符序列。需要注意的是该方法只能删除开头或者是结尾的字符，无法删除字符串中间部分的字符。str = "str123456str"print str.strip( 'st...

2019-03-27 16:13:41 2151

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人