data cleaning(数据清洗) 课程笔记

使用机器学习(ML), data mining 对数据进行分析之前, 需要使用大量的数据预处理工作。 因为没有干净的数据, 很难对数据进行更进一步的分析。 

在这本课程中, 主要cover 如下几个内容:

(1)如何获取原始数据(raw data)

(2) 如何将这些具有噪声的raw data 变得更加的tidy, 以便为我们进一步的分析做准备。 有哪些data cleaning(数据清理的技术)

(3)使用工具R, 完成一些任务


Q: 在进行数据分析前, 我们希望的数据是什么样子的呢?

我们希望我们的数据如下图excel所示:

formated data:

(1)每一个行(row)是一个record

(2)每一列(column)代表一个variable。


这也是我们运用数据清洗等数据预处理技术之后, 希望产生的效果。但是我们实际中获取到的raw data 是千奇百怪的, 充满噪声的, 例如下面的形式:


或者:


等等, 不一而足。


那么数据在哪里呢?

可能在数据库中。 例如两个免费的数据库mysql, mangoDB等等。 我们可能从这些数据库中选取一些数据子集进行处理等等。或者数据来源于API, 调查, 网站上等等




本课程的主要任务如下:


红色的表示数据的预处理过程。 data analysis 是比较高级的任务。例如我们可以使用机器学习, 数据挖掘等知识去进行数据分析。

data commnication: 是分析之后, 如何去使用分析得到的结果了。

使用Armbian安装OpenWrt是可能的,但需要一些额外的步骤和准备工作。 首先,确保你的设备兼容ArmbianOpenWrtArmbian是一个适用于ARM架构的开源操作系统,OpenWrt是一种支持嵌入式设备的Linux操作系统。你需要在设备的官方网站上查找信息,确认是否有ArmbianOpenWrt的支持。 一旦确认设备兼容,你可以开始准备安装。首先,下载Armbian操作系统的最新版本,并将其写入SD卡或USB设备中。接下来,将SD卡或USB设备插入到你的设备上,并启动设备。 一旦设备启动,你需要登录到Armbian系统中。你可以使用SSH等工具登录到设备的控制台。 在控制台上,你需要下载OpenWrt安装包。你可以在OpenWrt官方网站上找到最新的可用版本。确保选择与你的设备相匹配的安装包。 下载安装包后,你需要将其上传到你的设备中。可以使用SCP等工具来进行上传。 一旦安装包上传完成,你需要解压安装包并运行安装命令。不同的设备可能会有不同的安装命令,所以你可能需要查阅OpenWrt文档或设备的官方网站来获取准确的安装步骤。 安装过程完成后,你应该能够在Armbian中看到OpenWrt的界面。你现在可以通过浏览器登录到OpenWrt,并进行相应的设置和配置。 需要注意的是,安装过程可能会有一些具体的差异,具体取决于你使用的设备和版本。在进行任何操作之前,最好先查阅相关的文档和指南,以确保正确和顺利地完成安装过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值