- 博客(4)
- 收藏
- 关注
原创 python解析xml一些心得体会
本文仅针对使用elementtree解析xml的情况。1、使用.text获取某个标签文本的时候,一定注意判断返回值是不是None。因为None是python里一个很特殊的变量,拥有独特的类型NoneType,无法视同字符串进行操作。2、使用find获取到某个节点,实际获取的是这个节点所包含的所有子节点,可以通过数组索引获取指定的子节点。例如newNode = root.find(‘tagna...
2018-12-13 09:45:23 339
原创 使用pandas做数据统计时的一些笔记
1、读取csv格式数据时,在ide下显示会有省略号。原因:pandas默认的显示数据行数有限制;解决方法:pd.set_option(‘display.max_columns’, 100)即可。2、数据列数较多时,默认会折行显示,对阅读带来一定的困难。原因:pandas默认的显示宽度有限制;解决方法:·pd.set_option(‘display.width’, 500)即可。...
2018-12-13 09:45:10 214
原创 初学pyspider跳过的坑
1、JS问题。使用pyspider抓取一些网页时,如果网页使用JS做渲染,将会遇到抓取不成功的情况,具体的表现就是在pyspider开发界面左侧,web页面某些元素显示不出来。解决办法是,使用phantomjs进行JS加载和抓取。注意,下载安装phantomjs之后,记得将~\phantomjs\bin加入到PATH中,然后在启动pyspider时使用pyspider all将phantomjs...
2018-12-13 09:44:43 2538
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人