自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 kaggle房屋预测前百分之2

这个比赛是通过所给的有关房屋的一些特征数据对房价进行预测。特征包括房子面积、卧室数量、街道情况等等共计79个特征 导入数据 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline traininitial=pd.read_csv(...

2020-05-01 22:36:00 457 1

原创 series.str.extract()方法与series.apply()的一个场景应用以及sns.countplot()柱状图排序问题

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from pylab import * mpl.rcParams['font.sans-serif']=['SimHei'] mpl.rcParams['font.size']=25 sns.set_style('...

2020-04-27 00:26:19 839 1

原创 selenium拉勾网爬取数据分析岗位的所有职位信息

由于拉勾网对于特定的职位信息最多只显示30页,所以笔者通过更改不同搜索条件来可能多的获取更多的职位信息。 本文中的方法为半自动化的selenium,当然存在有许多可以改进的地方,仅供参考学习。 1、进入到关键字为数据分析师的主页面 from lxml import etree from selenium.webdriver import Chromefrom selenium.webdriver....

2020-04-26 18:33:50 375

原创 初次尝试采用requests库爬取拉勾网信息(2020-04-25)

```java import requests

2020-04-26 17:14:55 335

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除