自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (3)
  • 收藏
  • 关注

原创 pandas数据处理与分析实战

01批量读取指定路径下文件,将需要合并相同格式的csv文件放入一个文件夹内,直接调用即可。涉及企业内部数据,数据不公开,欢迎评论指正或私聊。02数据准备,使用merge内连接表格,匹配数据。03根据业务需求,筛选并分组计算数据。sheet2数据展示(客户名称已码)sheet1数据展示。sheet3数据展示。sheet4数据展示。sheet5数据展示。

2024-05-02 15:56:03 244 2

原创 爬虫——Xpath和Beautifulsoup实例

(由于是一年前写的代码,可能网站开发更新会有一些变动,代码仅供参考),如有不准确欢迎评论区讨论,致谢~的用法,后续会整理一些之前写过的实例。,包括点击公司名称后跳转的子页面表格。本篇通过一个案例分享。

2024-01-17 15:10:09 493

原创 平稳与非平稳序列的拟合及预测

时间序列分析基于R,主要包括建模步骤;单位根检验——DF检验、ADF检验;模型识别;参数估计——矩估计、极大似然估计、最小二乘估计;模型检验——模型的显著性检验、参数的显著性检验;模型优化——问题的提出、AIC准则、BIC准则;序列预测。

2022-05-09 22:05:47 4887 3

转载 使用决策树进行个人信用风险评估

最近在学习机器学习分类算法,本文转载于Ashmore的博客,数据集及原文链接放于文末决策树方法介绍决策树简介决策树(decision tree)是一种基本的分类与回归方法。如下图所示的流程图就是一个决策树,长方形代表判断模块(decision block),椭圆形成代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引出的左右箭头称作为分支(branch),它可以达到另一个判断模块或者终止模块。我们还可以这样理解,分类决策树模型是一种描述对实例进行分类的树形

2022-04-20 21:58:40 1472

原创 应用线性回归预测医疗费用

公司为了赚钱,保险需要募集比花费在受益者的医疗服务上更多的年度保费,因此,保险公司投入了大量的时间和金钱来研发能精确预测医疗费用的模型。医疗费用很难估计,因为花费最高的情况是罕见的而且似乎是随机的。但是有些情况对于特定的群体还是比较普遍存在的。例如,吸烟者比不吸烟者得肺癌的可能性更大,肥胖的人更有可能得心脏病。此分析的目的是利用病人的数据来预测这部分群体的平均医疗费用。这些估计可以用来创造一个精算表,根据预期的治疗费用来设定年度保费价格是高一点还是低一点。1.收集数据为了便于分析,我们使用一个模拟数

2022-04-19 23:07:50 4931 3

原创 《时间序列分析》

时间序列分析基于R学习小结第一章~第三章文章目录时间序列分析基于R学习小结一、第一章时间序列分析简介1、输入指令的规则2、赋值指令的写法一、第一章时间序列分析简介1、输入指令的规则通常一行只编辑一条指令,如果一行内要编辑多条指令,可以用分号来分隔不同的指令,就可以将多条指令一次性执行了。【例1-1】赋值x=3x=\sqrt{3}x=3​,y=20.3y=2^{0.3}y=20.3,计算x+y的值,并在二维坐标轴中标注点(x,y)(x,y)(x,y)的位置。#例 1-1> x=sqr

2022-04-13 22:01:58 570 2

原创 汽车价格离群值检测案例

《数据科学导引》汽车价格离群值检测案例第二章案例4(评论可以私发数据表)文章目录《数据科学导引》汽车价格离群值检测案例前言一、数据集描述二、导入数据集并切分三、特征提取并构建线性回归模型四、离群值检测五、标准化对离群值检测的影响六、测试集的验证七、在测试集上使用LOF进行离群值检测前言离群点(Outliers),简单而言就是离其余数据点非常远的数据点。它们会极大的影响后续的分析结果,甚至产生有误导的分析结果。Vast向3个行业的出版商、市场和搜索引擎提供数据,这三个行业包括汽车、房地产和休闲、

2022-03-29 00:29:36 2929 3

原创 如何使用LaTeX制作表格

LaTeX制作表格今天真的是学到了!先看代码~当然我们现在导言区引入宏包:\documentclass{ctexart}\usepackage{amsmath}\usepackage{amssymb}\usepackage{booktabs}\usepackage[table ]{ xcolor}\usepackage{latexsym}\usepackage{longtable}在正文区设置表格格式:\begin{document}\begin{table}[htbp]%注释1

2020-12-16 15:04:48 5634

原创 搞定数学建模论文——快速上手texstudio

前言首先,texstudio不能单独使用,我们需要安装miktex或者latex,安装之后,我们就可以在texstuidio界面的编辑区编辑论文了,它可以根据我们的命令对论文进行排版。在开始之前,我们需要设置一下:第一步,打开“选项”—“设置Texstudio(第一个)”—“常规”—“语言”,下拉选择“zh_CN”,就转换成了中文模式;第二步,打开“构建”—“默认编译器”,下拉选择“XeLaTex”;第三步,打开“编辑器”—“默认字体编码”,下拉选择“UTF-8”;最后,点击右下角的“确认”。

2020-12-14 21:42:39 1582

《时间序列分析-基于R》课程的所有数据

我在读大学期间有幸修过时间序列的课程,需要利用R语言建立各种时序模型,稍作整理之前发布了两篇时间序列的博客,有很多网友私信我需要数据,特在此上传到资源。另外给大家推荐一个网站,https://www.math.pku.edu.cn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/rsoft.html 此讲义为北京大学数学科学学院金融数学系金融数学应用硕士《金融时间序列分析》授课备课资料。 课程采用Ruey S. Tsay的《金融数据分析导论:基于R语言》 (An Introduction to Analysis of Financial Data with R)作为主要教材之一。比博主本科学习的内容拓展了很多,有兴趣的朋友可以去看看学习一下。备课笔记的PDF版本可以通过点击页面最上方的PDF图标下载。

2023-04-06

数据分析师轻松上路——拆解方法(MECE法则)

学习了MECE法则,主要包括流程拆解法;二分法;象限拆解法;杜邦分析法;AARRR;PEST;RFM;SWOT;5W1H。详细整理了各种拆解方法的原理以及步骤。 MECE分析法是 Mutually Exclusive Collectively Exhaustive的首字母缩写词,中文意思是"相互独立、完全穷尽",即所谓的 "无重复、无遗漏"。在按照 MECE 原则将某个整体(不论是客观存在的还是概念性的整体)划分为不同的部分时,必须保证划分后的各部分符合以下要求:各部分之间相互独立 (Mutually Exclusive) — “相互独立”意味着问题的细分是在同一维度上,并有明确区分、不可重复的。所有部分完全穷尽 (Collectively Exhaustive) — “完全穷尽” 则意味着全面、完整,没有遗漏或缺失。当我们在分析解决问题,或对复杂事物进行分明别类时,往往会用到MECE法则。它能有效的帮我们对问题进行结构化分析,或对事物进行归类分组,避免因思维混乱而出现重叠或遗漏的逻辑问题。最后拓展介绍了5W2H的方法。

2022-04-22

决策树与朴素贝叶斯算法原理

在学习《数据科学导引》第四章分类算法——决策树及朴素贝叶斯时可以参考本课件,基本原理通俗易懂,并举了相关例子,在决策树剪枝部分对课本内容做了补充,有兴趣可以翻阅。 汇报前查阅了很多相关资料,进行了整合和总结,如果有不甚清晰的地方可以私聊探讨,本人在课堂上对本部分做讲解的时候收到了很好的反响。 如果有不同的见解及学习方法,欢迎在评论区留言提问或提出建议。

2022-04-20

汽车价格离群值检测数据集

汽车价格离群值检测数据集

2022-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除