自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 总结下selenium爬虫的坑

1,用的Chrome,默认情况下Chrome是自动更新的,之前没碰到过这点。在爬虫时测着测着,就会报错,Chromedriver版本对不上。解决方法,一是更新的你的Chromedriver,二是取消Chrome浏览器的自动更新。这里留白,稍后补下具体解决方法。2,问题描述:centos7环境爬取京东商品页面,driver.get(url),之后查看driver.current_url,发现当前U...

2019-05-08 23:44:50 3475 1

原创 python数据分析初探小结(matplotlib,Numpy,Pandas)简单分析下IMDB250电影情况

每次爬虫爬到了许多数据,虽然有点成就感,但是只能干看着,还是不行。所以来看下python三大数据分析利器。本次以爬取到的IMDB250电影数据为例,使用pandas处理数据,并用matplotlib画图将数据结果展示出来。首先来看下爬到的部分数据结果,从MongoDB中取出来cli = pymongo.MongoClient()collection = cli.movie.imdb#...

2019-03-25 21:58:41 828

原创 python数据结构与算法(堆排序,希尔排序,归并排序)

继续排序算法。这几天下来,对算法有了点了解,但是还是感觉到不透彻,老规矩,还是多总结多磨。一.堆排序(Heapsort)先吐槽下,对于非计算机专业,这个算法花了点时间去理解- -。堆排序,百度百科就一句话,“是指利用堆这种数据结构所设计的一种排序算法”。刚接触到,一脸懵。这里接触到一些计算机的基本概念,这里阐述下。首先来看什么是堆。个人总,堆是一种基本数据结构,与之相对的是栈。...

2019-03-15 00:22:37 240

原创 python数据结构与算法(冒泡,选择,插入,快速)

近期总结。一.冒泡排序(Bubble Sort)冒泡排序,是一种简单的排序算法,实现方式可以简单理解为依次比较两个相邻元素,根据由大到小或者由小到大的规则,进行交换。由冒泡的名称也可联想一二,这种排序方式会使较大或者较小的元素慢慢浮到顶端。具体运作如下(升序为例):1.一个序列,从第一位元素开始,比较第一第二位,若第一位值大于第二位(不符合升序规则),将两个元素交换位置;否则继续比较第二和...

2019-03-13 00:26:21 287

原创 (python爬虫)-selenium的常规操作并爬取拉勾网信息

爬虫小练习,selenium有段时间没用了,以拉钩为例重温下,本文较为详细的总结了操作selenium的常规用法,总共四部分,前三部分常规操作,最后一部分贴出完整爬取拉钩信息并简单存储Redis数据库的代码。话不多说,本次以操练selenium为主要目的,对selenium常用操作进行简单的梳理,不再赘述selenium的安装操作。本次选用selenium+chromedriver进行操作,在...

2019-03-09 22:35:38 574

原创 (python算法)LeetCode-版本号比较

第一次笔试,发挥的很糟糕(基础不好是硬伤),碰到了版本号比较这个问题,回来后搜了下,发现在LeetCode里有,正好再仔细研究下。以下是原题比较两个版本号 version1 和 version2。如果 version1 > version2 返回 1,如果 version1 < version2 返回 -1, 除此之外返回 0。示例 1: 输入: version1 = “0.1...

2019-03-07 20:46:43 1243

原创 (python基础)各种打印三角形

萌新的自我修养,基础不好就得练,今天正好碰上各种打印三角形,这种题看似很简单,情况稍微变一变,还是挺有意思,就花了点时间整理了一下。总共囊括直角,等腰(分每行为n个和每行为2n+1个),数字三角共三大类的多种情况。1.直角三角形,这种最简单,for和while皆可,左右上下变换,都是一样的套路,掌握每行要输几个*,变range里的值和‘*’的乘值,或者添加空格。这里举两个例子:1.1直角三角形...

2019-03-05 22:35:31 12723

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除