自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (28)
  • 收藏
  • 关注

原创 【数据分析师-数据分析项目案例一】600w+条短租房数据案例分析

短租房数据案例分析1 前言1.1 数据集1.2 数据分析思路梳理2 数据分析2.1 数据加载2.2 数据查看3 数据可视化3.1 每天房屋入住率3.2 房屋月份价格走势3.3 房屋星期价格特征3.4 不同社区的房源数量3.5 房源评分情况3.6 房源价格情况3.7 不同社区与房源价格的关系3.8 品质房和普通房3.8 配套设施和房价的关系3.9 房型和房价的关系3.10 配套设施必备类型3.11 床位的数量和房价的关系3.12 关联关系探索4 特征工程5 机器学习1 前言1.1 数据集本案例中的

2021-08-29 14:35:50 5657 20

原创 【数据分析师-数据分析项目案例】大数据预处理

大数据预处理0 前言1 数据标准化1.1 标准化定义1.2 为什么要进行数据标准化?1.3 实例操作2 数据缩放化2.1 0-1缩放2.2 实例操作3 数据归一化3.1 数据归一化定义3.2 实例操作4 二值化4.1 二值化定义5.2 实际操作5 独热编码5.1 独热编码定义5.2 实例操作七、标签编码7.1 标签编码定义7.2 实例操作6 缺失值处理6.1 处理方式6.2 实例操作手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details

2021-08-25 12:23:26 2385

原创 【数据分析师-python基础】python基础语法精讲

python基础语法精讲1 从数字开始1.1 理解整数、浮点数、复数几种类型对象1.2 掌握运算及其相关的常用函数2 变量、表达式和语句2.1 变量作用及定义的方法2.2 变量命名原则和习惯:2.3 语句与表达式2.4 数据类型转化3 字符串数据类型3.1 字符串索引与切片3.2 字符串基础操作3.3 字符串常用方法3.4 input语句4 列表数据类型4.1 列表数据定义4.2 列表的索引和切片4.3 列表的操作方法4.3.1 单个元素操作4.3.2 列表所有元素操作5 元祖数据类型5.1 元祖数据定义5

2021-08-23 18:26:09 1542 4

原创 【数据分析师---数据可视化】第二章:plotly绘图基础篇

plotly绘图基础篇1 Plotly简介与安装2 Plotly简单绘图入门3 Plotly绘制散点图和饼图4 Plotly绘图流程详细梳理5 Plotly绘制密度图和三维散点图5.1 绘制2D密度图5.2 绘制3D散点图6 Plotly在线编辑绘图7 Plotly绘制金融数据图7.1 离线模式和在线模式绘图差异7.2 绘制时间滑动条7.3 添加时间转换器按钮7.3 绘制蜡烛图7.4 使用cufflinks模块绘制金融指标图7.4.1 绘制趋势图7.4.2 绘制MACD指标图7.4.3 绘图布林带指标图7.

2021-08-08 16:04:36 6263 5

原创 【数据分析师---数据可视化】第二章:plotly绘图进阶篇(地图可视化,动态数据可视化)

plotly绘图进阶篇1 地图可视化1.1 模块安装与地理数据基础知识1.2 地图数据GeoJson数据生成1.3 使用choropleth功能进行地图可视化1.4 使用geojson功能绘制地理区域1.5 使用choroplethmapbox进行地图可视化2 绘制动态数据图2.12.22.32.41 地图可视化1.1 模块安装与地理数据基础知识folium模块就是用来获取地理坐标以及围栏信息的模块,绘制图形时使用plotly模块。folium模块属于第三方模块,需要手动安装,可以选择在jupyter

2021-08-08 15:46:45 6060 1

原创 【数据分析师---数据可视化】第一章:Matplotlib绘图

第一章:Matplotlib绘图1 Matplotlib概念与安装2 Matplotlib简单使用1 Matplotlib概念与安装Matplotlib 图形可视化 Python 包,它提供了一种高度交互式界面,便于大家能够做出多种有吸引力的统计图表;同时,可以使用这些工具创建各种图形:包括简单的散点图、正弦曲线,甚至是三维图形;在 Python 科学计算社区,经常使用它完成数据可视化的工作;在接下来的梳理,学习一下这个库的神奇功能!如果使用的是Anaconda环境,在下载软件完毕后,Matplot

2021-08-05 11:46:08 2339 3

多分类多字段箱型图或者小提琴图绘制测试数据

博文【python科研绘图】多分类多字段箱型图或者小提琴图绘制中的测试数据

2022-12-01

中国地图绘制的json文件

用于补充【python数据分析】绘制疫情可视化地图、气泡图中地图文件数据

2022-04-21

数据分析师专栏中的机器学习的源代码

针对于博客中评论一直有人需求源代码,这里上传源代码供学习参考,对于数据,也在资源里(数据分析师专栏中的机器学习的补充数据)可以找到,加油学习

2022-04-19

博客中数据分析师专栏,机器学习部分的补充数据文件

博客中数据分析师专栏,机器学习部分的补充数据文件 有文件缺少可以直接私信博主补充

2022-04-19

大数据实战项代码.zip

大数据实战项目中的代码和web文件中的文件

2021-12-08

opencv人脸识别实战操作.zip

本资源包含了博客:利用open-cv对黄晓明、AB、刘亦菲图片进行人脸识别一文中的所需材料和源代码,用于交流学习,不涉及商业用途

2020-12-14

上海行政区、人口和道路的gis数据.zip

用于博客python数据分析实战中餐馆选址中的数据支撑,包含了上海市行政区、人口和城市道路三个gis数据,可以直接加载

2020-11-25

mysql和navicat.zip

本资源用于博客:Mysql 5.x安装过程梳理中的软件部分,文件中包含了mysql5.540版本的数据库文件和navicat15版本的软件安装包,只用作于学习交流参考。

2020-11-16

时间序列分析.zip

资源是博客:时间特征序列分析汇总(以2021-2019年槽罐车事故数据为例)一文中的数据和ipynb文件,用于对于交流和学习

2020-11-10

贝叶斯新闻分类实战项目文本和停用词数据

本资源是对贝叶斯新闻分类实战项目详解博客一文中的数据资料补充,包含了文本数据,停用词,ipynb文件,仅供读者参考

2020-10-22

信用卡欺诈项目数据和文件.zip

本资源用于博客栏目中的机器学习实例详解中逻辑回归案例模板——信用卡欺诈检测,包含数据和完整的流程ipynb文件

2020-10-09

上海餐饮数据.zip

本数据集作为【python数据分析实战】城市餐饮店铺选址问题(1)—— 对不同菜系进行比较,并筛选出可开店铺的餐饮类型 中的数据支撑

2020-06-16

全国县级边界shp低分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国县级地图的json数据格式

2020-05-26

全国市级边界shp高分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国市级地图的json数据格式

2020-05-26

virus_data.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,数据整理不易

2020-05-26

链家网出租房源详细信息

本资源就是作为链家网出租房信息的爬虫数据,旨在用于博客正则表达式分组及pandas实用操作一文的数据来源。

2020-05-23

江苏省科学技术综合奖.zip

本数据为江苏省科学技术综合奖近十年来的全部的获奖人员及详细信息的名单,包含了doc、xls和pdf数据,主要用来做项目分享

2020-05-16

项目:知乎数据.zip

本资源为知乎数据信息爬取,用于做python数据分析实战项目,数据字段包含_id 关注的收藏夹、关注、关注者、关注的问题、关注的话题、关注的专栏、职业1、职业2、回答、提问 、收藏、个人简介、居住地、所在行业、教育经历、职业经历等信息

2020-05-08

数据爬取:六普常住人口数.zip

本资源为全国第六次人口普查各省市常住人口数量,共统计各省市数据量677条,其中包含各省的统计以及其下辖的区县的人口数据 。用于统计分析和数据处理

2020-05-08

机器学习数据.zip

本资源作为专栏机器学习专栏的原始数据,包含了简单的数据,未处理的数据和最终处理完成后的房价数据,用于机器学习相关知识的学习

2020-05-07

项目:电商打折套路解析.zip

本资源为淘宝美妆双十一前后的爬虫数据,时期为11月5-11月14号,作为本博客的python数据分析实战的电商套路分析的数据来源

2020-05-07

项目:国产烂片深度揭秘.zip

本数据资源来源于豆瓣电影数据的爬虫所得,共有数据2458条,作为本博客栏目下的python数据实战分析中国产烂片深度解析的数据来源

2020-05-07

中国全部31个省市区的经纬度信息数据(2020年4月29日爬取)

该压缩包中包含全国各省市区的汇总经纬度数据(精度在小数点5位及以上),还有按照各个省份分别统计的市区县对应的经纬度数据。数据爬取时间为2020年4月29日爬取

2020-04-29

机器学习源码.zip

用于博客中机器学习部分的参考,作为资源的补充,进行知识的分享,资料的运行环境是在jupyter notebook下进行的

2020-04-25

鲁迅对于《祝福》中祥林嫂的情感倾向分析.ipynb

本资源是博客【python舆情分析(5)】 情感倾向分析之鲁迅《祝福》里对祥林嫂(特定人物)的情感倾向 的资料补充,作为学习资料进行参考的

2020-03-26

projects.zip

该资源是作为【机器学习(14)】指定路径下文件的选取、数据缺失值查询及处理、帕累托分析、多文件数据合并与线性回归预测一条龙解析(全过程函数式编程)博客的资源补充

2020-03-19

2_class.rar

这个资源仅用于本博客(【深度学习】利用tensorflow2.0卷积神经网络进行卫星图片分类实例操作详解)的复习分享用,

2020-02-12

auto_office1.zip

用于输出目录所有文件夹这篇文章的示例,读者可以根据文章的内容和代码进行auto_office1.zip压缩文件的使用

2020-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除