- 博客(7)
- 收藏
- 关注
原创 总结下selenium爬虫的坑
1,用的Chrome,默认情况下Chrome是自动更新的,之前没碰到过这点。在爬虫时测着测着,就会报错,Chromedriver版本对不上。解决方法,一是更新的你的Chromedriver,二是取消Chrome浏览器的自动更新。这里留白,稍后补下具体解决方法。2,问题描述:centos7环境爬取京东商品页面,driver.get(url),之后查看driver.current_url,发现当前U...
2019-05-08 23:44:50 3493 1
原创 python数据分析初探小结(matplotlib,Numpy,Pandas)简单分析下IMDB250电影情况
每次爬虫爬到了许多数据,虽然有点成就感,但是只能干看着,还是不行。所以来看下python三大数据分析利器。本次以爬取到的IMDB250电影数据为例,使用pandas处理数据,并用matplotlib画图将数据结果展示出来。首先来看下爬到的部分数据结果,从MongoDB中取出来cli = pymongo.MongoClient()collection = cli.movie.imdb#...
2019-03-25 21:58:41 841
原创 python数据结构与算法(堆排序,希尔排序,归并排序)
继续排序算法。这几天下来,对算法有了点了解,但是还是感觉到不透彻,老规矩,还是多总结多磨。一.堆排序(Heapsort)先吐槽下,对于非计算机专业,这个算法花了点时间去理解- -。堆排序,百度百科就一句话,“是指利用堆这种数据结构所设计的一种排序算法”。刚接触到,一脸懵。这里接触到一些计算机的基本概念,这里阐述下。首先来看什么是堆。个人总,堆是一种基本数据结构,与之相对的是栈。...
2019-03-15 00:22:37 256
原创 python数据结构与算法(冒泡,选择,插入,快速)
近期总结。一.冒泡排序(Bubble Sort)冒泡排序,是一种简单的排序算法,实现方式可以简单理解为依次比较两个相邻元素,根据由大到小或者由小到大的规则,进行交换。由冒泡的名称也可联想一二,这种排序方式会使较大或者较小的元素慢慢浮到顶端。具体运作如下(升序为例):1.一个序列,从第一位元素开始,比较第一第二位,若第一位值大于第二位(不符合升序规则),将两个元素交换位置;否则继续比较第二和...
2019-03-13 00:26:21 292
原创 (python爬虫)-selenium的常规操作并爬取拉勾网信息
爬虫小练习,selenium有段时间没用了,以拉钩为例重温下,本文较为详细的总结了操作selenium的常规用法,总共四部分,前三部分常规操作,最后一部分贴出完整爬取拉钩信息并简单存储Redis数据库的代码。话不多说,本次以操练selenium为主要目的,对selenium常用操作进行简单的梳理,不再赘述selenium的安装操作。本次选用selenium+chromedriver进行操作,在...
2019-03-09 22:35:38 589
原创 (python算法)LeetCode-版本号比较
第一次笔试,发挥的很糟糕(基础不好是硬伤),碰到了版本号比较这个问题,回来后搜了下,发现在LeetCode里有,正好再仔细研究下。以下是原题比较两个版本号 version1 和 version2。如果 version1 > version2 返回 1,如果 version1 < version2 返回 -1, 除此之外返回 0。示例 1: 输入: version1 = “0.1...
2019-03-07 20:46:43 1260
原创 (python基础)各种打印三角形
萌新的自我修养,基础不好就得练,今天正好碰上各种打印三角形,这种题看似很简单,情况稍微变一变,还是挺有意思,就花了点时间整理了一下。总共囊括直角,等腰(分每行为n个和每行为2n+1个),数字三角共三大类的多种情况。1.直角三角形,这种最简单,for和while皆可,左右上下变换,都是一样的套路,掌握每行要输几个*,变range里的值和‘*’的乘值,或者添加空格。这里举两个例子:1.1直角三角形...
2019-03-05 22:35:31 12832
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人