![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 72
y老番茄y
这个作者很懒,什么都没留下…
展开
-
《深入浅出数据分析》第十三章
文章目录整理数据一、Excel二、正则表达式三、去重四、补充介绍正则表达式 整理数据 这章进行了简单的数据清洗。 一、Excel 一开始拿到散乱的数据,先用Excel进行分列。 散乱的数据: 这里先处理 FirstName ,可以看到这一列的问题是,每个名字前面都多一个^字符,用Excel工具去掉即可。 先列出来几个书中提到的函数: 函数 作用 FIND 返回指定字符串的位置 LEFT 取单元格左边的字符 RIGHT 取单元格右边的字符 TRIM 删除单元格中的空.原创 2021-07-23 11:59:49 · 141 阅读 · 0 评论 -
《深入浅出数据分析》第十二章——R语言lattice数据包
文章目录R语言一、散点图二、补充 R语言 从上一章开始,就都涉及到R语言的内容了,在这记录一下,就当给自己做的笔记。 一、散点图 这次要绘制的是散点图,并且求出它的回归方程。 首先,还是加载csv文件。和上一个一样就不多写了。 之后就可以直接绘制散点图了。 这个图主要是比较职员期望的加薪幅度和实际的加薪幅度,并且依据数据建立回归模型,用来分析加薪幅度,以便获取大幅度的加薪。 plot(x, y) 最后图片长这样。 计算相关系数r r用来量度变量的相关性。r的范围为-1~1,0表示无相关性,.原创 2021-07-22 18:27:50 · 1345 阅读 · 0 评论 -
《深入浅出数据分析》第十章第十一章
文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。 提示:以下是本篇文章正文内容,下面案例可供参考 一、pandas是什么? 示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 二、使用步骤 1.引入库 代码如下(示例): import numpy as np import.原创 2021-07-20 17:31:15 · 257 阅读 · 0 评论 -
《深入浅出数据分析》第九章——R语言
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录记录第一次接触R语言一、R语言下载安装二、运行三、补充1.加载csv文件2.hist函数 记录第一次接触R语言 《深入浅出数据分析》第九章讲到R语言,在这记录一下,就当给自己做的笔记。 一、R语言下载安装 安装地址:https://www.r-project.org/ 安装上没有什么问题,就根据自己电脑,按着顺序来就行了。 二、运行 第一次打开里面长这样: 书中第九章是要用R绘制直方图。 所以先加载数据 。 书中的数据地址已经原创 2021-07-18 16:55:27 · 644 阅读 · 3 评论