日常工作中的数据处理(shell,python,java)

工作中常常需要在linux线上环境处理数据,比如:处理log分析,mysql数据提取等等。

你可能首先想到的是shell,或在python。
shell确实简练,但是有时候并不好用,比如复杂数据的统计,shell显得过于简陋。
python当然可以应对多种需求,由于linux 都标配了python,熟悉python 那是相当方便。
不过对于业界 java语言的普及度是很高的,很多同事在处理数据的时候,由于对python不熟悉,效率很低,要把数据搞到本地,再tmd写java处理,实在坑爹。

下面兄弟谈下java在linux下的配置java环境以及处理数据,尤其是引用第三方的jar包,自我感觉相当方便~

第一步:配置jdk环境。
vim .profile

export JAVA_HOME=/home/q/java/jdk1.6.0_20
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:~/java/lib/*.jar

注意:最后我指定了:~/java/lib/*.jar ,这些jar包是jdk提供之外的jar包。

第二步:配置 Djava.ext.dirs,java编译和执行时引用jdk之外的jar包

alias jc='javac -Djava.ext.dirs=/home/xinchun.wang/java/lib'
alias jr='java -Djava.ext.dirs=/home/xinchun.wang/java/lib'


第三步:测试

import org.apache.commons.lang.StringUtils;
public class Test2{
public static void main(String[] args){
System.out.println(StringUtils.isEmpty(""));
System.out.println(StringUtils.isEmpty("hellow"));
}
}

执行:

jc Test2.java
jr Test2

输出:
true
false

至此:已经成功配置~

总结:
shell :实在不好用,但是简单的数据处理以及统计,那是简洁高效方便
python:胜任所有场景,熟悉的话,就优先使用啦,尤其是在执行环境多变的情况,可移植性好,比如给dba执行一个db数据处理的情况,对方可能没有装java环境,或者环境配置不一致,这块java不让python。
java:胜任所有场景,移植性(因为不同组的同事可能不装java环境,但是python肯定都有)相对python较差。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
会计研究文本数据的重要性显着增加。 为了帮助研究人员理解和使用文本数据,本专着定义和描述了文本数据的常用度量,然后演示了使用 Python 编程语言收集和处理文本数据。 该专着充满了示例代码,这些代码复制了最近研究论文的文本分析任务。在专着的第一部分,我们提供了 Python 入门指南。 我们首先描述 Anaconda,它是 Python 的一个发行版,它提供了文本分析所需的库及其安装。 然后,我们介绍了 Jupyter notebook,这是一种改进研究工作流程并促进可复制研究的编程环境。 接下来,我们将教授 Python 编程的基础知识,并演示使用 Pandas 包的表格数据的基础知识。专着的第二部分重点介绍会计研究常用的特定文本分析方法和技术。 我们首先介绍正则表达式,这是一种用于在文本查找模式的复杂语言。 然后我们将展示如何使用正则表达式从文本提取特定部分。 接下来,我们介绍将文本数据(非结构化数据)转换为表示感兴趣变量(结构化数据)的数值度量的想法。 具体来说,我们介绍了基于字典的方法:1) 测量文档情绪,2) 计算文本复杂度,3) 识别前瞻性句子和风险披露,4) 收集文本的信息量,以及 5) 计算不同片段的相似度文本。 对于这些任务的每一个,我们都引用了相关论文并提供了代码片段来实现这些论文的相关指标。最后,专着的第三部分侧重于自动化文本数据的收集。 我们介绍了网络抓取并提供了从 EDGAR 下载文件的代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值