![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 67
liuyunfeng_c
这个作者很懒,什么都没留下…
展开
-
pandas数据清洗实例-apply|applymap
pandas数据清洗爬取的上海房价数据*正则表达式*pandas数据清洗前言从某网中爬取了上海浦东地区的房价数据,如下所示,发现“单价”和“房屋总价”两项数据都是文本型数据,且都含有单位或者标点符号,不利于分析应用。接下来,我就通过正则表达式的方式来对数据进行处理。...原创 2021-12-23 11:17:50 · 1107 阅读 · 0 评论 -
Python爬虫——个股的股价与成交量分析
一、 前言写在前面:不是人人都是巴菲特,作为普通小韭菜不要幻想一夜暴富!!!踹开临门一脚,投点小钱,进去冲个浪还是挺有意思的,注意总结经验,最大程度的减少被割的概率。年轻人还是要脚踏实地!股谚云:“股市上什么都能骗人,唯有成交量不能骗人。”成交量通常比股价先行,股市上有"先见量后见价"之说。开局一张图,接下来慢慢编(来自资深小韭菜的挣扎):根据美国的股市分析家葛兰碧(Joe Granville)著名的“量价理论”的核心思想:影响股价走势的关键因素就是成交量(此处不考虑政策等其他因素)。如果只关注K原创 2020-07-11 20:32:21 · 2325 阅读 · 1 评论 -
py爬虫调用高德地图API——查看全国有机场的城市
一、工具1、爬虫工具:requests(爬虫包)、xpath(定位指定信息)2、分析工具:pandas(数据分析工具)、tableau(可视化)3、数据来源:高德地图、国家统计局官网二、调用高德地图API在高德地图开发文档里面创建应用以后获得自己的key,然后根据需要查看开发文档(本处选择“搜索POI”)爬取到的数据默认是json格式,通过关键字逐层筛选就可以获得指定信息在这里插入...原创 2019-12-01 17:03:55 · 1565 阅读 · 0 评论 -
爬虫练习——某网站上海房价分析
前言实验数据来源自某看房网站,通过爬虫一共爬取了一千六百多条数据。能力有限,实验结果仅供参考。该网站几乎没有什么反爬虫措施,原理很简单,所以关键就是定位自己想要的信息。工具1、爬虫工具:request(爬虫包)、xpath(定位指定信息)2、分析工具、pandas(数据分析工具)、tableau(可视化)数据爬取本次实验一共获取了以上三种数据:地址、单价和标签。先尝试了正则表达式过...原创 2019-11-23 20:34:53 · 1053 阅读 · 1 评论