linux 文本随机抽样_给数据科学家的Linux命令行实用工具

最新推荐文章于 2023-03-28 21:22:05 发布

VIP文章锋语声

最新推荐文章于 2023-03-28 21:22:05 发布

阅读量507

点赞数

文章标签： linux 文本随机抽样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33994072/article/details/111964574

版权

原标题：给数据科学家的Linux命令行实用工具

——没有Python和各类酷炫的库时的硬核数据分析

数据科学总是与R、Excel、SQL相关联，最重要的是，它与Python及其大量高级库(如pandas、NumPy等)相关联，这并不奇怪。然而，如果我说，你不需要所有这些东西就可以提供相当完整和信息丰富的数据分析。我想和大家分享一组Linux命令行工具，它提供了一个简单、快速的Linux风格模拟你最喜欢的数据工具。所以，我想表明的是，数据科学家不受特定环境的约束，也不被他的武器宝库所局限。

1. 获取数据

对我们来说幸运的是，Linux有各种用于显示文件内容的工具。但是，为了公平地找出Python类似物，我们在此排除所有文本编辑器，因为它们需要手动完成所有的工作。我们寻找脚本，可能以pandas的方式行动。

head/tail

这些是从文件中获取确切的行的简单的工具：

head -n 5 example_data.csv — 得到前5行

head -n -15 example_data.csv — 得到除最后15行之外的所有行

tail -n 15 example_data.csv — 得到文件中的最后15行

tail -n +15 example_data.csv — 得到从第15行开始的所有行

column

如果我们想看到一个格式化的表，而不是原始数据-我们有另一个命令。

column -s"," -t example_data.csv

-s提供文件中的列分隔符，-t只提供格式设置。它将产生这样的产出：

col1 col2 col3

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
linux 文本随机抽样_给数据科学家的Linux命令行实用工具

原标题：给数据科学家的Linux命令行实用工具——没有Python和各类酷炫的库时的硬核数据分析数据科学总是与R、Excel、SQL相关联，最重要的是，它与Python及其大量高级库(如pandas、NumPy等)相关联，这并不奇怪。然而，如果我说，你不需要所有这些东西就可以提供相当完整和信息丰富的数据分析。我想和大家分享一组Linux命令行工具，它提供了一个简单、快速的Linux风格模拟你最喜欢...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。