自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 初识大数据,一定要知道的知识!

初识大数据一、大数据的发展历程二、大数据的核心概念三、大数据的影响四、大数据的核心技术一、大数据的发展历程第一阶段:萌芽期(20世纪90年代至21世纪初) 随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和只是管理技术开始被应用,如数据仓库、专家系统、知识管理系统等。第二阶段:成熟期(21世纪前10年)Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动了大数据技术的快速突破,大数据解决方案逐渐走向成熟,形成了并行计算与分布式系统两大核心技术,谷歌的GFS 和 Map

2020-08-24 21:12:36 2179

原创 Python3 爬取房价 采用lxml + xpath

Python3 爬取房价 采用lxml + xpath 爬取网址:房网本人爬取此网站的目的是,后续的数据的可视化分析。想要知道后续内容请关注博主分析网站可以从中发现我们所需要的信息都在li 标签中,既然目标清晰,我们便可以写代码了调式过程这里用到了xpath-helper 插件例如小区名编写主要代码保存数据,我这选用的mysql 保存。 # 创建连接 db = pymysql.Connect( host='localhost',

2020-08-17 16:19:00 352 1

原创 Python做出来的数据可视化真香!!

本文数据为博主自己爬取最新 Python3 爬取前程无忧招聘网 mysql和excel 保存数据学完可视化,准备自行爬取数据,自行分析。在实践中获得书上没有的知识,源于书本,高于书本。最新可视化分析前程无忧招聘网1、数据预处理2、进行数据清洗3、数据可视化(pyecharts)1、数据预处理将存储在mysql 中的数据进行数据预处理在jupyter notebook中进行调试导出至excel 获得初步的数据结果2、进行数据清洗部分代码展示# 构造想要分析的目标岗位,做一个

2020-08-11 17:28:33 7501 221

原创 Pandas——Series快速转换为DataFrame

Pandas——Series转换为DataFrame下面是给出的例子因为我想对后面的数字处理,所以想把它转换为DataFramesalary_level = df.groupby("公司类型")["工资水平"].mean()# print(type(salary_level))# salary_level# Series转换为DataFrametype_salary=pd.DataFrame({'公司类型':salary_level.index,'平均工资':salary_level.val

2020-08-11 14:11:58 3403

原创 Jupyter notebook无法显示pyecharts 图形界面 ----解决方法

本人因昨天在Jupyter notebook 上运行了pyecharts ,但今早发现,图形界面无法显示了解决方法如下:下文采用官方说明-----------资源引用步骤1:在本地终端输入git clone https://github.com/pyecharts/pyecharts-assets.git步骤二:python3 -m http.server之后会出现 (不需要输入)Serving HTTP on 0.0.0.0 port 8000 (http://0.0.0.0:8

2020-08-11 14:05:04 15257 8

原创 Python 安装selenium Pycharm和mac终端

由于我的mac 终端的python 不与Pycharm 中的python 相连,所以我只想在Pycharm 中安装selenium。Pycharm安装selenium 第一步在 pycharm 终端 安装seleniumpip3 install -i https://pypi.doubanio.com/simple/ selenium第二步 查看自己谷歌浏览器的版本第三步 去http://chromedriver.storage.googleapis.com/index.html 下载chr.

2020-08-06 14:24:32 307

原创 Python 导入pyecharts模块绘图时报错: “所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ”的解决方法

解决方法:第一步先卸载pyechartspip3 uninstall pyecharts第二步指定安装版本pip3 install -i https://pypi.doubanio.com/simple pyecharts==1.7.0 这样便完成了。

2020-08-03 23:32:33 4944 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除