自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (27)
  • 收藏
  • 关注

原创 克拉克松Clarkson Research情报网注册登录及进行数据查询(以世界造船厂分布为例)

克拉克松Clarkson Research情报网注册登录及进行数据查询步骤梳理(以世界造船厂分布为例)1 克拉克松介绍2 克拉克松情报网3 账户注册登录4 信息查询1 克拉克松介绍Clarksons Research is a global market leader in the provision of data and intelligence across shipping, trade, offshore and energy克拉克松研究公司是一家在航运、贸易、离岸和能源领域提供数据和情报的

2021-11-23 10:51:22 7811 8

原创 【机器学习】多项式回归案例五:正则惩罚解决过拟合(Ridge回归和Lasso回归)

正则惩罚解决过拟合(Ridge回归和Lasso回归)案例五: 正则惩罚解决过拟合(Ridge回归和Lasso回归)3.2.1 模块记载与数据读入3.2.2 特征工程3.2.3 模型搭建与应用手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121460567(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息案例五: 正则惩罚解决

2021-11-21 21:26:23 2366

原创 【机器学习】多项式回归案例四:员工职位与薪回归模型分析

员工职位与薪资多项式回归模型3 多项式回归案例四:员工职位与薪资多项式回归模型3.1.1 模块加载与数据读入3.1.2 数据可视化3.1.3 模型创建与应用3.1.4 模型对比3.1.5 模型过拟合手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121458428(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息3 多项式回归

2021-11-21 19:34:09 3720

原创 【机器学习】线性回归实战案例三:股票数据价格区间预测模型(国外+国内数据)

股票数据价格区间预测模型(国外+国内数据)案例三:股票数据价格区间预测模型(国外+国内数据)2.3.1 模块加载与忽略警告设置2.3.2 加载数据和数据筛选2.3.3 探索式数据分析(EDA)2.3.4 探究字段之间的关联性2.3.5 特征工程2.3.6 模型创建与应用2.3.7 模型对比2.3.8 预测结果可视化2.3.9 国内茅台股票数据集应用手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121452962(CSDN博主:B

2021-11-21 14:04:23 15420 18

原创 【机器学习】线性回归实战案例二:车辆零售价回归模型分析步骤详解

线性回归实战案例二:车辆零售价回归模型分析步骤详解案例二:车辆零售价回归模型2.2.1 模块加载与忽略警告设置2.2.2 加载数据和表头处理2.2.3 探索式数据分析(EDA)2.2.4 探究字段之间的关联性2.2.5 特征工程2.2.6 模型创建与应用对比手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121431534(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站

2021-11-19 21:52:39 2385 4

原创 【机器学习】线性回归实战案例一:多元素情况下广告投放效果分析步骤详解

线性回归实战案例一:多元素情况下广告投放效果分析步骤详解2 线性回归2.1 案例一:多元素情况下广告投放效果分析2.1.1 模块加载与绘图布局样式设置2.1.2 加载数据和数据筛选2.1.3 探索式数据分析(EDA)2.1.4 探究字段之间的关联性2.1.5 模型创建与拟合2.1.6 数据标准化/缩放化2.1.7 模型验收2.1.8 模型对比手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121382191(CSDN博主:Be_

2021-11-17 17:01:04 3773 3

原创 【大数据实战项目八】使用机器学习算法进行预测分析并进行网上部署

使用机器学习算法进行预测分析并进行网上部署9 使用机器学习算法进行预测分析9.1 数据探索式分析9.1.1 环境配置与数据读入9.1.2 探究延误航班有多少数据量9.1.3 探究出发延期到达提前的数据量9.1.4 探究延误的平均时间9.1.5 探究延误的原因9.2 特征工程9.2.1 去除空值9.2.2 时间数据处理9.3 模型创建,评估与保存9.3.1 模块导入与数据加载9.3.2 数据随机采样与标签数据处理9.3.3 数据集中字段处理9.3.4 数据集划分9.3.5 模型创建与评估9.3.6 模型保存9

2021-11-13 21:50:35 4963 2

原创 【大数据实战项目七】数据探索(航空公司与飞机数据统计与补充)

这里写目录标题8 数据探索8.1 数据初探8.2 数据分组汇总8.3 利用Flask进行数据展示8.4 利用爬虫获取补充数据8.5 丰富网址主页信息8.5.1 航空公司信息的补充展示8.5.2 飞机详细信息的补充展示手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121304149(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息

2021-11-13 14:43:05 4101 1

原创 【大数据实战项目六】数据实体提取与数据扩充

数据实体提取与数据扩充7.1 获取飞机具体航班数量并保存到数据库7.2 利用Flask进行数据展示7.3 数据查找与索引添加7.4 利用爬虫获取补充数据手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121296019(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息经过上面一系列的操作,现在在我们需要进行数据分析中非常重要的

2021-11-12 21:11:57 1968

原创 【大数据实战项目五】数据结果图形可视化

数据结果图形可视化6 数据结果图形可视化6.1 航班数据的时令特征6.2 利用Flask进行数据展示6.3 创建接口数据6.4 创建可视化图形手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121287432(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息6 数据结果图形可视化按照数据分析的金字塔,最底层的数据记录:包含收

2021-11-12 14:28:33 2089

原创 【大数据实战项目四】Mongo/ES数据储存及利用Flask进行结果展示

Mongo/ES数据储存及利用Flask进行结果展示5 数据储存及结果展示5.1 将数据保存到MongoDB5.2 利用Flash进行数据结果展示5.2.1 将数据展示到指定页面5.2.2 数据筛选显示5.2.3 美化数据输出5.2.4 多数据分页显示5.2.5 制作具有查询功能的页面手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121283758(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布

2021-11-12 11:08:41 1856 8

原创 【大数据实战项目三】Spark数据读取、处理以及保存

Spark数据读取、处理以及保存手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121204749(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息...

2021-11-08 11:54:03 5881

原创 【大数据实战项目二】Spark环境和Mongo、ES数据库安装,以及数据库与Spark,Python联动

Spark和Mongodb软件安装与python交互测试3.1 python处理文件3.2 搭建Spark开发环境和测试3.3 搭建Mongodb和ES数据库及测试3.3.1 Mongodb安装3.3.2 Mongodb与python代码互动3.3.3 Mongodb与Spark交互3.3.4 ES数据库安装3.4 搭建Flask网站和数据测试手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121185626(CSDN博主:Be

2021-11-06 22:25:01 1204 4

原创 【大数据实战项目一】数据下载以及工具软件的使用

数据下载以及工具软件的使用1 数据从哪里来?数据怎么用?1.1 本项目中使用的数据——飞机航班数据1.2 结构化数据与非结构化数据1.3 结构表的特征提取和呈现1.4 数据分析金字塔1.5 数据下载2 大数据实战项目中工具软件的选择2.1 原始数据收集器使用的技术——Kafka2.2 原始数据存储使用到的技术——HadoopHDFS2.3 原始数据批处理使用到的技术——Spark、PySpark、SparkSQL2.4 结果数据存储使用到的技术——Mongodb ES2.5 结果数据展示用到的技术——Fla

2021-11-06 21:23:51 2391

原创 基于DataFrame两字段使用pyechaerts绘制网络关系图,并封装函数直接调用

基于DataFrame两字段使用pyechaerts绘制网络关系图,并封装函数直接调用1 背景2 数据准备3 图形绘制全部代码4 注意要点5 补充数据手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121160765(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息1 背景在进行数据可视化的过程中,有时会发现涉及到多字段的相

2021-11-05 13:01:03 372

原创 按照分组将多行数据合并成为一个单元格的数据(explode方法的相反操作)

按照分组将多行数据合并成为一个单元格的数据1 背景2 问题解决手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121157833(CSDN博主:Be_melting) 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息1 背景在进行数据分析过程中,有人会有如下的需求,就是统计相同编号下的sku情况,具体需求如下给出的具体示意流程如下仔细观察一下,其实就是p

2021-11-05 10:25:50 1262 2

原创 【数据分析师-数据分析项目案例三】多因素房价预测分析案例

多因素房价预测分析案例1 数据来源2 数据加载和基本的ETL2.1 模块导入和数据加载2.2 数据清洗3 数据可视化3.1 地理可视化3.2 关系矩阵和热力图3.3 添加衍生字段3.4 字符串字段的可视化4 机器学习4.1 特征工程4.2 模型选择4.2.1 线性回归模型4.2.2 随机森林模型4.2.3 梯度爆炸模型手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121125433(CSDN博主:Be_melting) 知识

2021-11-03 17:18:18 4348 1

多分类多字段箱型图或者小提琴图绘制测试数据

博文【python科研绘图】多分类多字段箱型图或者小提琴图绘制中的测试数据

2022-12-01

中国地图绘制的json文件

用于补充【python数据分析】绘制疫情可视化地图、气泡图中地图文件数据

2022-04-21

数据分析师专栏中的机器学习的源代码

针对于博客中评论一直有人需求源代码,这里上传源代码供学习参考,对于数据,也在资源里(数据分析师专栏中的机器学习的补充数据)可以找到,加油学习

2022-04-19

博客中数据分析师专栏,机器学习部分的补充数据文件

博客中数据分析师专栏,机器学习部分的补充数据文件 有文件缺少可以直接私信博主补充

2022-04-19

大数据实战项代码.zip

大数据实战项目中的代码和web文件中的文件

2021-12-08

opencv人脸识别实战操作.zip

本资源包含了博客:利用open-cv对黄晓明、AB、刘亦菲图片进行人脸识别一文中的所需材料和源代码,用于交流学习,不涉及商业用途

2020-12-14

上海行政区、人口和道路的gis数据.zip

用于博客python数据分析实战中餐馆选址中的数据支撑,包含了上海市行政区、人口和城市道路三个gis数据,可以直接加载

2020-11-25

mysql和navicat.zip

本资源用于博客:Mysql 5.x安装过程梳理中的软件部分,文件中包含了mysql5.540版本的数据库文件和navicat15版本的软件安装包,只用作于学习交流参考。

2020-11-16

时间序列分析.zip

资源是博客:时间特征序列分析汇总(以2021-2019年槽罐车事故数据为例)一文中的数据和ipynb文件,用于对于交流和学习

2020-11-10

贝叶斯新闻分类实战项目文本和停用词数据

本资源是对贝叶斯新闻分类实战项目详解博客一文中的数据资料补充,包含了文本数据,停用词,ipynb文件,仅供读者参考

2020-10-22

信用卡欺诈项目数据和文件.zip

本资源用于博客栏目中的机器学习实例详解中逻辑回归案例模板——信用卡欺诈检测,包含数据和完整的流程ipynb文件

2020-10-09

上海餐饮数据.zip

本数据集作为【python数据分析实战】城市餐饮店铺选址问题(1)—— 对不同菜系进行比较,并筛选出可开店铺的餐饮类型 中的数据支撑

2020-06-16

全国县级边界shp低分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国县级地图的json数据格式

2020-05-26

全国市级边界shp高分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国市级地图的json数据格式

2020-05-26

virus_data.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,数据整理不易

2020-05-26

链家网出租房源详细信息

本资源就是作为链家网出租房信息的爬虫数据,旨在用于博客正则表达式分组及pandas实用操作一文的数据来源。

2020-05-23

江苏省科学技术综合奖.zip

本数据为江苏省科学技术综合奖近十年来的全部的获奖人员及详细信息的名单,包含了doc、xls和pdf数据,主要用来做项目分享

2020-05-16

项目:知乎数据.zip

本资源为知乎数据信息爬取,用于做python数据分析实战项目,数据字段包含_id 关注的收藏夹、关注、关注者、关注的问题、关注的话题、关注的专栏、职业1、职业2、回答、提问 、收藏、个人简介、居住地、所在行业、教育经历、职业经历等信息

2020-05-08

数据爬取:六普常住人口数.zip

本资源为全国第六次人口普查各省市常住人口数量,共统计各省市数据量677条,其中包含各省的统计以及其下辖的区县的人口数据 。用于统计分析和数据处理

2020-05-08

机器学习数据.zip

本资源作为专栏机器学习专栏的原始数据,包含了简单的数据,未处理的数据和最终处理完成后的房价数据,用于机器学习相关知识的学习

2020-05-07

项目:电商打折套路解析.zip

本资源为淘宝美妆双十一前后的爬虫数据,时期为11月5-11月14号,作为本博客的python数据分析实战的电商套路分析的数据来源

2020-05-07

项目:国产烂片深度揭秘.zip

本数据资源来源于豆瓣电影数据的爬虫所得,共有数据2458条,作为本博客栏目下的python数据实战分析中国产烂片深度解析的数据来源

2020-05-07

中国全部31个省市区的经纬度信息数据(2020年4月29日爬取)

该压缩包中包含全国各省市区的汇总经纬度数据(精度在小数点5位及以上),还有按照各个省份分别统计的市区县对应的经纬度数据。数据爬取时间为2020年4月29日爬取

2020-04-29

机器学习源码.zip

用于博客中机器学习部分的参考,作为资源的补充,进行知识的分享,资料的运行环境是在jupyter notebook下进行的

2020-04-25

鲁迅对于《祝福》中祥林嫂的情感倾向分析.ipynb

本资源是博客【python舆情分析(5)】 情感倾向分析之鲁迅《祝福》里对祥林嫂(特定人物)的情感倾向 的资料补充,作为学习资料进行参考的

2020-03-26

projects.zip

该资源是作为【机器学习(14)】指定路径下文件的选取、数据缺失值查询及处理、帕累托分析、多文件数据合并与线性回归预测一条龙解析(全过程函数式编程)博客的资源补充

2020-03-19

2_class.rar

这个资源仅用于本博客(【深度学习】利用tensorflow2.0卷积神经网络进行卫星图片分类实例操作详解)的复习分享用,

2020-02-12

auto_office1.zip

用于输出目录所有文件夹这篇文章的示例,读者可以根据文章的内容和代码进行auto_office1.zip压缩文件的使用

2020-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除