day01
1. 课前准备
1.1 实用软件下载
一些实用的软件有XMind(用来制作思维导图)、Typora(用来写笔记)、飞秋(用来传输小文件)、uTorrent(用来传输大文件)、KM(用来破解未激活的windows系统和未激活的office)。
1.2 什么是数据分析
数据分析是指用适当的统计学分析的方法对收集来的那些不全、误差很大的数据进行提炼、清洗从而进行分析,从中得到有用的信息和结论加以进行详细的研究和概括的一个过程。
1.3 为什么学数据分析
-
数据分析现在是顶级组织的优先事项
-
由于您研究的公司未来的趋势,所以数据分析师通常是作为公司决策的核心
-
数据分析专业人员可以选择广泛的职位和领域。
-
高薪和更多工作机会
-
在金融,制造业,信息技术,通信,物流,零售,汽车等众多行业都设置了相关的岗位
1.4数据分析的应用领域
-
理解客户、满足客户需求
数据的应用目前在这领域是最广为人知的。重点是如何应用数据更好的了解客户以及他们的爱好和行为。企业非常喜欢搜集社交方面的数据、浏览器的日志、分析出文本和传感器的数据,为了更加全面的了解客户。在一般情况下,建立出数据模型进行预测。
-
业务流程优化
数据也更多的帮助业务流程的优化。可以通过利用社交媒体数据、网络搜索以及天气预报挖掘出有价值的数据,其中数据的应用最广泛的就是供应链以及配送路线的优化。
-
医疗的研发和改善
在生活中,我们可以利用穿戴的装备(如智能手表或者智能手环)对自己的身体情况生成最新的数据,这让我们可以根据我们热量的消耗以及睡眠模式来进行追踪以及进行营养的补充。 在医疗行业,数据分析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA.并且让我们可以制定出最新的治疗方案。同时可以更好的去理解和预测疾病。就好像人们戴上智能手表等可以产生的数据—样,数据同样可以帮助病人对于病情进行更好的治疗。数据技术目前已经在医院应用监视早产婴儿和患病婴儿的情况,通过记录和分析婴儿的心跳,医生针对婴儿的身体可能会出现不适症状做出预测。这样可以帮助医生更好的救助婴儿。
-
提高体育成绩
在生活中,我们可以利用穿戴的装备(如智能手表或者智能手环)对自己的身体情况生成最新的数据,这让我们可以根据我们热量的消耗以及睡眠模式来进行追踪以及进行营养的补充。 在医疗行业,数据分析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA.并且让我们可以制定出最新的治疗方案。同时可以更好的去理解和预测疾病。就好像人们戴上智能手表等可以产生的数据—样,数据同样可以帮助病人对于病情进行更好的治疗。数据技术目前已经在医院应用监视早产婴儿和患病婴儿的情况,通过记录和分析婴儿的心跳,医生针对婴儿的身体可能会出现不适症状做出预测。这样可以帮助医生更好的救助婴儿。
-
改善城市
大数据工具曾经就被谷歌公司利用研发谷歌自驾汽车。丰田的普瑞就配有相机、GPS以及传感器,在交通上能够安全的驾驶,不需要人类的干预,还可以应用优化智能电话。美国安全局利用数据进行恐怖主义打击,甚至监控人们的日常生活。而企业则应用数据技术进行防御网络攻击。警察应用数据工具进行捕捉罪犯,信用卡公司应用大数据工具来拦截欺诈性交易。
-
金融交易
数据在金融行业主要是应用金融交易。高频交易是数据应用比较多的领域。其中数据算法应用于交易决定。现在很多股权的交易都是利用数据算法进行,这些算法现在越来越多的考虑了社交媒体和网站新闻来决定在未来几秒内是买出还是卖出。
2. excel的起源
从1979年问世的一款杀手级应用VisiCalc到1982年Lotus 1-2-3,不断的优化和功能的集成。知道1993年Windows平台的Excel第五版的推出,随着平台的逐渐风靡,Windows渐渐的把垄断地位给夺走,同时把lotus公司收购。至今,excel因其强大的功能以及不断优化和改进的用户体验深受喜爱,至今没有其他软件能够超越它。
3. excel的使用
3.1 保护工作簿和工作表
-
工作簿的扩展名
xls excel97-2003版,可以有宏
xlsx excel2007-2016版默认的文件格式,不能有宏
xlsm excel2007-2016版默认的文件格式,能有宏
-
对工作簿进行加密
文件 > 信息 > 保护工作簿 > 密码加密
-
保护工作簿结构
审阅 > 保护工作簿 > 输入密码 > 确认密码
-
保护单元格不被修改
审阅 > 保护工作表 > 输入密码 > 确认密码
-
保护部分单元格不被修改
开始 > 字体/对齐方式/数字 > 保护 > 锁定 > 审阅 > 保护工作表
3.2 快速输入数据
-
一些系统自带的列表或者文字+数字的类型可以直接下拉填充柄
-
自定义列表
文件 > 选项 > 高级 > 编辑自定义列表 > 新序列 > 添加 > 确定
-
纯数字的列要按住ctrl键然后下拉填充柄
-
对于等差、等比数列以及按工作日、月、年填充可以点击单元格鼠标右键,下拖,选择序列,等差、等比数列或者工作日、月、年,取步长和终止值
或者:开始 > 编辑 > 填充 > 序列 -
多个不连续单元格输入同一个数据
ctrl + enter -
文本记忆式输入法
鼠标右键 > 从下拉列表中选择 -
数据验证方法
方法1:数据 > 数据验证 > 数据验证 > 允许 > 序列 > 来源 > 输入
方法2:数据 > 数据验证 > 数据验证 > 允许 > 序列 > 来源 > 选中 -
数字自定义格式
开始 > 字体/对齐方式/数字 > 数字 > 自定义 > 类型 > 输入 > [=1]"男"H[=0]"女”注意:只能有2个值,0或者1
-
同时填充多个工作表
连续的单元格使用shift
不连续的单元格使用ctrl -
巧妙利用自动更正选项,快速录入数据
文件 > 选项 > 校对 > 自动更正选项 > 自动更正 > 添加 -
输入函数
=INT(10+89*RAND())
随机输出10~99之间的一个数
3.3 导入数据
-
导入txt数据
数据 > 自其他来源 > 自文本 > 预览 > 分隔符 > 逗号 > 确定
-
导入Access数据库
数据 > 自其他来源 > 自文本 > 自Access数据库 > 分隔符 > 逗号 > 确定
3.4 自定义数据
-
开始 > 字体/对齐方式/数字 > 数字 > 自定义 > 0"元/年”整数
100元一年
-
开始 > 字体/对齐方式/数字 > 数字 > 自定义 > @"季度”字符串/文本
第一季度
-
开始 > 字体/对齐方式/数字 > 数字 > 自定义 > [绿色]0.0%;[红色] (0.0%);[蓝色]0.0;
<正数>;<负数>;<零>;<文本>
大于0为绿色,小于0为红色,等于0为蓝色
3.5 文本数据转数值数据
- =A1*1
- =A1/1
- =A1+0
- =A1-0
- =–A1
- =VALUE(A1)
3.6 标准化规范化数据
-
不规范日期(2014.1.1)
开始 > 查找和选择 > 替换 > . > 全部替换如果出现了类似二O一四年一月二日这样的结构
可以修改为短日期开始 > 日期 > 短日期
-
不规范日期(980102)
=–TEXT(F3,"##-##-##"")注意:(1)TEXT(A2,"##-##-##"")是文本类型
(2)–是修改为日期类型
(3)开始 > 日期 > 短日期 -
分列:固定宽度/日期格式(20140101)
O一四年一月二日这样的结构可以修改为短日期开始 > 日期 > 短日期
-
不规范日期(980102)
=–TEXT(F3,"##-##-##"")注意:(1)TEXT(A2,"##-##-##"")是文本类型
(2)–是修改为日期类型
(3)开始 > 日期 > 短日期 -
分列:固定宽度/日期格式(20140101)
数据 > 分列 > 日期 > 完成