笔记
hungry Pythoner
这个作者很懒,什么都没留下…
展开
-
kaggle房屋预测前百分之2
这个比赛是通过所给的有关房屋的一些特征数据对房价进行预测。特征包括房子面积、卧室数量、街道情况等等共计79个特征 导入数据 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline traininitial=pd.read_csv(...原创 2020-05-01 22:36:00 · 457 阅读 · 1 评论 -
series.str.extract()方法与series.apply()的一个场景应用以及sns.countplot()柱状图排序问题
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from pylab import * mpl.rcParams['font.sans-serif']=['SimHei'] mpl.rcParams['font.size']=25 sns.set_style('...原创 2020-04-27 00:26:19 · 838 阅读 · 1 评论 -
selenium拉勾网爬取数据分析岗位的所有职位信息
由于拉勾网对于特定的职位信息最多只显示30页,所以笔者通过更改不同搜索条件来可能多的获取更多的职位信息。 本文中的方法为半自动化的selenium,当然存在有许多可以改进的地方,仅供参考学习。 1、进入到关键字为数据分析师的主页面 from lxml import etree from selenium.webdriver import Chromefrom selenium.webdriver....原创 2020-04-26 18:33:50 · 375 阅读 · 0 评论 -
初次尝试采用requests库爬取拉勾网信息(2020-04-25)
```java import requests原创 2020-04-26 17:14:55 · 335 阅读 · 0 评论