数据分析
DA之路
NEFU(Math B.S)----PLOYU(IT Msc)
Data Analysis
展开
-
基础介绍---5.Git使用指南
基础介绍---Git使用指南Git 简单应用学习目标学习内容练习仓库资源与工具Git 简单应用学习目标能够使用常见的 Git 命令,以便在后面的任务中可以将自己的代码提交到 GitHub 上,并且可以使用 GitHub 可以友好的和小伙伴一起协作打怪升级。学习内容如何在系统上安装 Git如何配置 Git 基本信息:git config如何把文件增加到.gitignore里以忽略它如何初始化版本库:git init如何查看仓库的状态:git status如何把某个文件添加到 Git 暂存原创 2021-11-09 16:14:41 · 243 阅读 · 0 评论 -
基础介绍---4.Git Getting Started
基础介绍---4.Git Getting StartedGit 简单应用学习目标学习内容练习仓库资源与工具Git 简单应用学习目标能够使用常见的 Git 命令,以便在后面的任务中可以将自己的代码提交到 GitHub 上,并且可以使用 GitHub 可以友好的和小伙伴一起协作打怪升级。学习内容如何在系统上安装 Git如何配置 Git 基本信息:git config如何把文件增加到.gitignore里以忽略它如何初始化版本库:git init如何查看仓库的状态:git status如何把原创 2021-11-09 16:08:11 · 256 阅读 · 0 评论 -
基础介绍---3.Markdown支持
基础介绍---3.Markdown支持Markdown支持本节学习目标学习内容资源与工具Markdown支持本节学习目标能够熟练掌握 Markdown 语法,并能够使用 Markdown 来写博客。学习内容各种header, 如#, ##, ###, 等等,以及=====, ------文字修饰:**, __分隔符 ------列表:-以及1.插入图片:插入链接: 及 <>引用: >行内代码:code,以及代码块 ````````(注意都是三个`)表格资源与原创 2021-11-09 15:59:34 · 240 阅读 · 0 评论 -
基础介绍---2.如何提问
基础介绍---如何提问如何提问学习目标学习内容资源与工具如何提问学习目标提问是学习过程中必须掌握的技能,它又分为两个场景:如何当面向人请教技术问题如何在问答网站上提问。学习内容遇到问题时,如何全面正确的分析问题,找到关键因素如何使用“向小黄鸭提问”的方法来帮助自己理清路在向人提问前应该做好哪些准备工作在提问时如何清楚的表达自己的问题,并有效与对方沟通在网上问答网站提问时,有什么需要注意的地方好用的技术类问答网站资源与工具技术类问答网站(国内)技术类问答网站(国外提问原创 2021-11-09 15:51:22 · 185 阅读 · 0 评论 -
基础介绍---1.初识Linux
基础介绍---1.初识Linux初识Linux本节学习目标本节内容其他资料推荐初识Linux本节学习目标初步掌握Linux系统的命令本节内容什么是Linux系统?Linux操作系统诞生于1991 年10 月5 日(这是第一次正式向外公布时间),是一套免费使用和自由传播的类Unix操作系统。Linux存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。但Linux原创 2021-11-09 11:51:08 · 605 阅读 · 0 评论 -
hands-on-data-analysis-数据建模及模型评估
第三章 模型搭建和评估–建模经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模,下一节我们学习评估。我们拥有的泰坦尼克号的数原创 2020-08-28 10:49:34 · 292 阅读 · 0 评论 -
hands-on-data-analysis-数据可视化
hands-on-data-analysis-数据可视化2.7 如何让人一眼看懂你的数据?2.7.1 任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化2.7.2 任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。2.7.3 任务三:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)。2.7.4 任务四:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)2.原创 2020-08-25 20:52:20 · 354 阅读 · 0 评论 -
hands-on-data-analysis-数据重构
hands-on-data-analysis-数据重构2 第二章:数据重构2.4 数据的合并2.4.1 任务一:将data文件夹里面的所有数据都载入,观察数据的之间的关系2.4.2:任务二:使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_up2.4.3 任务三:使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上原创 2020-08-23 17:40:23 · 299 阅读 · 0 评论 -
hands-on-data-analysis-数据清洗及特征处理
hands-on-data-analysis-数据清洗及特征处理2 第二章:数据清洗及特征处理数据清洗简述2.1 缺失值观察与处理2.1.1 任务一:缺失值观察2.1.2 任务二:对缺失值进行处理2.2 重复值观察与处理2.2.1 任务一:请查看数据中的重复值2.2.2 任务二:对重复值进行处理2.2.3 任务三:将前面清洗的数据保存为csv格式2.3 特征观察与处理2.3.1 任务一:对年龄进行分箱(离散化)处理2.3.2 任务二:对文本变量进行转换2.3.3 任务三(附加):从纯文本Name特征里提取出原创 2020-08-21 20:21:24 · 213 阅读 · 0 评论 -
hands-on-data-analysis-数据加载及探索性数据分析
hands-on-data-analysis-数据加载及探索性数据分析原创 2020-08-19 21:20:38 · 853 阅读 · 0 评论 -
数据分析学习笔记(五)数据可视化
数据分析学习笔记(五)数据可视化数据可视化之美常见的初级图表图标的基础概念散点图气泡图单轴散点图折线图面积图柱形图直方图饼图漏斗图雷达图常见的高级图表树形图桑基图热力图关系图箱线图标靶图词云图地理图图表绘制Excel绘制绘图配色可视化BI数据可视化之美优点:直观,缺点:阅读性差数据可视化数据可视化的目的是让数据更高效,让读者更高效阅读,而不单是自己使用。突出数据背后的规律 — 突出重要的因素 — 最后是美观常见的初级图表图标的基础概念维度和度量维度是常用类别度量是数值,具体的用原创 2020-06-17 22:45:03 · 922 阅读 · 0 评论 -
数据分析学习笔记(四)Excel
数据分析学习笔记(四)Excel为什么要学习ExcelExcel的学习路径1Excel的必知必会Excel的常见函数什么是函数常见函数文本清洗函数关联匹配函数逻辑运算函数计算统计函数时间序列函数Excel的常见技巧Excel的快捷键数据类型数据透视表条件格式和迷你图分列数组自定义名称自定义下拉菜单冻结删除重复项分列工具库切片用Excel进行数据分析餐食数据为什么要学习ExcelExcel的学习路径1Excel的必知必会Excel保证新版本培养好的数据表格习惯主动性搜索多练习Excel原创 2020-06-08 23:49:20 · 350 阅读 · 0 评论 -
数据分析学习笔记(三)业务
数据分析学习笔记(三)业务为什么业务重要经典的业务分析指标指标市场营销指标为什么业务重要经典的业务分析指标模型未动 , 指标先行如果你不能衡量(指标)它,你就无法增长(偏向业务模型)它指标指标建立的要点:核心指标(整个公司部门都认同的大指标)比如创业初期,新增用户量是核心指标;中期,需要用户带动,用户活跃是指标;到后期,需要商业化,营收是指标。从结构化角度来考虑,就是金字塔的塔尖。好的指标应该是比率好的指标应该能带来显著效果(落地)e.g.提高商品销量··提高市场占有原创 2020-06-04 12:40:52 · 437 阅读 · 0 评论 -
数据分析学习笔记(二)数据分析三思维七技巧
数据分析学习笔记(二)What 三种核心思维结构化公式化业务化Why 数据分析的思维技巧How 如何在业余时间锻炼分析能力What 三种核心思维结构化结构化思考来自麦肯锡 金字塔思维金字塔思考方式核心论点寻找金字塔的塔顶,它可以是假设,是问题是预测,是原因结构拆解自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系MECE相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善验证不论核心论点还是分论点,都应该是可量化的用数据说话。它们必然是可验证的例子:现在有原创 2020-05-10 22:51:59 · 1852 阅读 · 0 评论 -
数据分析学习笔记(一)主要流程和内容
数据分析学习笔记(一)写在最前面的话数据分析需要的主要内容数据分析的结构层次底层数据的收集/产品端收集数据业务化/产品需要什么样的数据?数据可视化/产品的表现如何?数据决策和执行/怎么让产品更好数据模型/产品开始自动化和系统化的运营数据战略/指导未来总结数据分析的整个流程:写在最前面的话最近找实习屡屡碰壁,想找机器学习的,奈何代码能力还不够,找数据分析的,奈何没有数据分析思维以及业务方面的相关知识。前阵子开始集中学习数据分析的课程,增强自己的数据分析理论知识,并以博文来做输出提高记忆。数据分析需要的原创 2020-05-09 12:52:04 · 669 阅读 · 0 评论