- 博客(5)
- 收藏
- 关注
原创 Python——网络数据采集(三)
网络数据采集过程中你应该考虑的两个问题: 该数据采集器需要消耗的网络流量(越少越好); 该数据采集器对目标网站服务器的负载(越低越好); ...
2018-12-20 12:01:42 426 1
原创 假如生活欺骗了你
生活是一种磨练,带来苦难的同时也在嘲笑幼稚。 小编作为一名初出茅庐的职场菜鸟,最近刚离开一家公司,有很多感悟与体会。假如生活欺骗了你,你要记住: 当你尚未成为公司正式员工时,请不要和公司谈“归属感”(比如实习生);在你尚未成为公司核心成员时,请不要和公司谈“感情”。 如果你拿到一份工作轻松而薪水又很优越的offer,请先对自己进行评估,当你的工资水平远远高于你的公司贡献值时,那就是你该走的时候了...
2018-12-15 15:05:02 200
原创 SQL学习指南(一)
构建SQL语句 create table person (person_id SMALLINT UNSIGNED, fname VARCHAR(20), lname VARCHAR(20), gender ENUM('M', 'F'), birth_date DATE, city VARCHAR(20), state VARCHAR(20), country VARCHAR(20), p...
2018-12-06 14:31:21 613
原创 Python——网络数据采集(二)
使用BeautifulSoup的 find() 和 findAll() 抓取目标标签下的内容: 使用beautifulsoup解析后的网页通常是一种带标签的类文本形式,个人认为难点就是怎么通过层层标签的阻拦,抓取到目标内容。 findAll (tag, attributes, recursive, text, limit, keywords) find(tag, attributes, recur...
2018-12-02 15:12:31 284
原创 Python——网络数据采集(一)
使用原始的urllib库请求网站访问; 使用beautifulsoup库解析网站的元素; 考虑是否会有报错的情况,做优化。 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.baidu.com") bsObj = BeautifulSoup(html.r...
2018-12-01 15:52:15 278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人