辣梨的分析屋
码龄4年
关注
提问 私信
  • 博客:37,850
    社区:3
    动态:830
    38,683
    总访问量
  • 15
    原创
  • 508,020
    排名
  • 23
    粉丝
  • 0
    铁粉

个人简介:私信取数据

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2020-11-13
博客简介:

weixin_52509748的博客

查看详细资料
个人成就
  • 获得26次点赞
  • 内容获得23次评论
  • 获得440次收藏
  • 代码片获得193次分享
创作历程
  • 3篇
    2023年
  • 9篇
    2022年
  • 3篇
    2021年
成就勋章
TA的专栏
  • 数据分析
    8篇
  • tableau
    3篇
  • sql
    3篇
  • 自动化
    2篇
  • 机器学习
    2篇
  • python
    2篇
  • R
    3篇
兴趣领域 设置
  • Python
    python
  • 后端
    爬虫
  • 人工智能
    数据挖掘机器学习数据分析分类回归
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

猴痘数据分析

本次项目将通过python和九数云工具分析全球猴痘数据,提高人民群众对猴痘的警惕和对自身的保护,本文将围绕全球猴痘数据,剖析猴痘疫情的影响和危害,为人民敲响警钟,积极做好猴痘疫情防控和自身保护。
原创
发布博客 2023.08.02 ·
754 阅读 ·
2 点赞 ·
1 评论 ·
11 收藏

爬虫第八天 1、学会xpath模糊查询 2、学会beautifulsoup解析数据 3、列表页和详情页的爬取

发布动态 2023.06.12

爬虫第六天 1、学习正则解析网页 2、学习xpath解析网页(可以右键网页html复制路径,自动生成路径) 3、网址html解码可以到head meta charset=查看

发布动态 2023.06.08

爬虫第五天 1、学习request中的proxy,auth,ssl认证,cookies,response 2、通过session代替cookiejar 3、正则表达式和在python的使用

发布动态 2023.06.06

爬虫第四天 1、urllib传递请求头和cookie,通过cookiejar抓取用户登录的cookie,并生成opener,通过带有cookie的opener去访问个人中心 (登录参数需要进行转译,post请求要求的bytes) 2、两个错误:urlerror,httperror 3、熟悉requests的get post操作

发布动态 2023.06.06

爬虫第三天 学习了付费代理如何应用到爬虫上,熟悉代码

发布动态 2023.06.02

爬虫第二天

安全套接层:SSL第三方的CA数字证书(HTTPS相对于HTTP多了一个加密证书,http端口:80,https端口443)urlopen为什么可以请求数据:handler处理器。不⽀持代理的添加,所以我们需要自定义这个功能。handler: 系统的urlopen()模拟真实的浏览器发送请求。也不知道我们使⽤了代理。对⽅不知道我们真实的。对⽅不知道我们真是的。
原创
发布博客 2023.06.01 ·
520 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

这个月新目标——学会爬虫

发布动态 2023.06.01

爬虫第一天

http的请求方式getpost请求put请求(不完全)delete(删除一些信息)head(请求头发送⽹络请求需要带⼀定的数据给服务器不带数据也可以请求头⾥⾯Accept:⽂本的格式编码格式⻓链接短链接Cookie:验证⽤的Host:域名Referer:标志从哪个⻚⾯跳转过来的浏览器和⽤户的信息返回数据:response。
原创
发布博客 2023.06.01 ·
541 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

自动化——批量重命名

自动化——批量重命名。
原创
发布博客 2022.12.10 ·
419 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

自动化——自动解压(zip、7z、rar)带密码

批量解压压缩包。
原创
发布博客 2022.12.10 ·
1389 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

拒绝摆烂

发布动态 2022.11.22

天猫复购预测之挑战Baseline 0.65

天猫复购预测0.65
原创
发布博客 2022.09.20 ·
1373 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

棋牌游戏用户流失预测——Xgboost调参

本项目通过对棋牌游戏数据的探索,通过python数据处理以及可视化,最后进行数据建模预测,整个项目分为项目目的的确定、数据的预处理、对数据的分析和项目总结这五个部分。
原创
发布博客 2022.09.07 ·
2184 阅读 ·
0 点赞 ·
0 评论 ·
14 收藏

SQL+Tableau化妆品数据分析

本项目通过对化妆品10月、11月、12月、1月、2月的用户行为数据的探索,通过SQL数据处理以及tableau可视化,整个项目分为项目目的的确定、数据的预处理、对数据的分析和项目总结这五个部分。
原创
发布博客 2022.07.24 ·
1892 阅读 ·
2 点赞 ·
4 评论 ·
28 收藏

天猫订单数据综合分析

一、项目介绍本项目通过对天猫成交数据的探索,通过python对数据预处理,整个项目分为项目目的的确定、数据的预处理、对数据的分析和项目总结这五个部分。(本项目参考微信公众号凹凸数据)二、项目流程项目目的从结果指标出发确定目标,通过过程指标定位问题,提出合理建议数据来源本数据集来源于和鲸社区一共收录了发生在一个月内的28010条数据数据字段:'订单编号', '总金额', '买家实际支付金额', '收货地址 ', '订单创建时间', '订单付款时间 ', '退款金额'共7个字段
原创
发布博客 2022.02.23 ·
4201 阅读 ·
4 点赞 ·
0 评论 ·
45 收藏

R语言建立ARIMA模型预测数据

目录确定研究目的以及确定因变量和自变量数据预处理判断有无缺失值创建时间序列平稳性检验季节性处理白噪声检验模型选取与模型评估最终模型与预测结论确定研究目的以及确定因变量和自变量研究目的:建立ARIMA模型,预测接下来的 14 天的数值。数据预处理判断有无缺失值发现存在七个缺失值,用对应序列平均值填充,观察缺失值位置,发现数据出现连续缺失,故取数据前后间隔一个点,取两点的平均值填充。创建时间序列以7天为一周期,观察序列图,发现数据呈
原创
发布博客 2022.02.17 ·
12070 阅读 ·
8 点赞 ·
6 评论 ·
180 收藏

R语言建立指数平滑模型预测数据

确定研究目的以及确定因变量和自变量研究目的:建立指数平滑模型,预测接下来的 14 天的数值。目录确定研究目的以及确定因变量和自变量数据预处理缺失值处理创建时间序列分割训练集和测试集简单指数平滑法构建模型霍特模型AAN(相加误差,相加趋势,无季节性)温斯特模型AAA(相加误差,相加趋势,有季节性)最终模型与预测数据预处理缺失值处理发现存在七个缺失值,用对应序列平均值填充,观察缺失值位置,发现数据出现连续缺失,故取数据前后间隔一个点,取两点的平均值..
原创
发布博客 2022.02.17 ·
3190 阅读 ·
0 点赞 ·
1 评论 ·
24 收藏

R语言构建多元线性回归模型预测汽车的耗油效率

目录确定研究目的以及确定因变量和自变量数据预处理缺失值处理异常值处理估计回归模型参数,建立模型判断数据是否满足多重线性回归假设条件(1)、线性(2)、独立性(3)、正态性(4)、方差齐性(5)、消除异方差对模型进行回归检验预测确定研究目的以及确定因变量和自变量研究目的:建立多元线性回归模型,预测汽车的耗油效率 MPG。本次实验的 basic 数据集包含 1 个因变量(mpg)和 5 个自变量(cylinders, displaceme...
原创
发布博客 2022.02.17 ·
4948 阅读 ·
6 点赞 ·
4 评论 ·
93 收藏

拉勾招聘数据分析

一、项目背景毕业季的到来,每个大学生也引来了自己的就业问题,应该去怎样的城市,公司的融资水平,公司的规模,薪资水平,工作经验等都是每个大学生头疼的问题,为了更好的方便就业,用数据说话,本篇通过11个城市的招聘信息,从公司规模,薪资水平,工作经验分析就业选择。二、项目介绍本项目主要是以拉勾招聘网对11个城市的招聘信息分析,主要通过tableau和sql分析,整个项目可分为项目目的的确定,数据来源,数据分析,项目总结(因数据处理是,没有重复值和缺失值,所以不做此步骤)。三、项目流程项目目的
原创
发布博客 2021.08.29 ·
1073 阅读 ·
1 点赞 ·
3 评论 ·
9 收藏
加载更多