- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 数据处理常用方法及示例——Python数据清洗
Python用request获取到的网页数据常常要经过筛选处理,转化为我们需要的数据之后再保存到本地,但有些数据过于杂乱要经过多步处理才能转化为我们所需的数据,其实这也算是一种反爬措施。今天总结一些常用的数据处理方法,涉及到 re 正则库和 xpath(lxml库)语法一、str.replace() ---- 替换描述Python中 replace() 方法把字符串中的 old(旧字符串) ...
2019-12-15 22:00:08 824
原创 关于Python在安装库(pip install xxx)时的常见问题以及解决方法
Python提供了很多的库(也可称模块、框架),使用起来也非常的方便,相对来说它也极大的减少了我们的代码量,但在安装我们所需要的库时,经常会出现一些问题导致安装失败。常见的问题主要是:安装超时(raise ReadTimeoutErrorself._pool, None, ‘Read timed out.’)和提示“找不到满足要求的版本(ERROR: Could not find a versio...
2019-12-10 18:18:35 2719 2
原创 Python爬虫+数据清洗+数据可视化基础案例
最近迷上了Python爬虫,我们的hadoop课程也正好涉及到了这个内容,所以就想结合课程内容(爬取京东手机评论https://item.jd.com/100003060627.html#crumb-wrap)写一篇关于python爬虫到数据可视化的完整流程打开网站https://item.jd.com/100003060627.html#crumb-wrap检查...
2019-12-04 22:56:52 22599 4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人