自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大公爵的博客

生命的意义视事业而不在年寿

  • 博客(5)
  • 收藏
  • 关注

原创 Python——网络数据采集(三)

网络数据采集过程中你应该考虑的两个问题: 该数据采集器需要消耗的网络流量(越少越好); 该数据采集器对目标网站服务器的负载(越低越好); ...

2018-12-20 12:01:42 426 1

原创 假如生活欺骗了你

生活是一种磨练,带来苦难的同时也在嘲笑幼稚。 小编作为一名初出茅庐的职场菜鸟,最近刚离开一家公司,有很多感悟与体会。假如生活欺骗了你,你要记住: 当你尚未成为公司正式员工时,请不要和公司谈“归属感”(比如实习生);在你尚未成为公司核心成员时,请不要和公司谈“感情”。 如果你拿到一份工作轻松而薪水又很优越的offer,请先对自己进行评估,当你的工资水平远远高于你的公司贡献值时,那就是你该走的时候了...

2018-12-15 15:05:02 200

原创 SQL学习指南(一)

构建SQL语句 create table person (person_id SMALLINT UNSIGNED, fname VARCHAR(20), lname VARCHAR(20), gender ENUM('M', 'F'), birth_date DATE, city VARCHAR(20), state VARCHAR(20), country VARCHAR(20), p...

2018-12-06 14:31:21 613

原创 Python——网络数据采集(二)

使用BeautifulSoup的 find() 和 findAll() 抓取目标标签下的内容: 使用beautifulsoup解析后的网页通常是一种带标签的类文本形式,个人认为难点就是怎么通过层层标签的阻拦,抓取到目标内容。 findAll (tag, attributes, recursive, text, limit, keywords) find(tag, attributes, recur...

2018-12-02 15:12:31 284

原创 Python——网络数据采集(一)

使用原始的urllib库请求网站访问; 使用beautifulsoup库解析网站的元素; 考虑是否会有报错的情况,做优化。 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.baidu.com") bsObj = BeautifulSoup(html.r...

2018-12-01 15:52:15 278

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除