java
文章平均质量分 60
nickname_oo
做饭的程序员
展开
-
java.lang.NoClassDefFoundError: javax/servlet/http/HttpServletResponse
今天在Intelij IDEA运行之前的项目,突然报java.lang.NoClassDefFoundError: javax/servlet/http/HttpServletResponse这种错,怎么都不行,按照网上找的各种帖子,原因帖子上都有说,我不再啰嗦,但是支的招都不好使,一顿折腾后,下面这招解决了问题:1、pom文件修改为:<dependency> <groupId>javax.servlet</groupId> <artifa原创 2020-10-16 21:44:58 · 3762 阅读 · 1 评论 -
java通过JDBC连接hiveserver
最近需要用到这个,先放这里吧,用的时候可以直接用了1、hive依赖hadoop,将hdfs当作文件存储介质,那是否意味着hive需要知道namenode的地址? 实际上在hive的hive-env.sh 中配置了 HADOOP_HOME=/home/install/hadoop-2.5.12、hive的本地模式和远程模式有什么区别? hive本质上是将sql语法解析为mapredu...转载 2018-05-15 11:00:21 · 478 阅读 · 0 评论 -
IntelliJ IDEA 配置Tomcat 运行Web项目并打war包
1、配置web项目1.1、首先引入项目File ---> open 弹出框中选中待引入的项目;若为maven项目,可以点一下右面的 Maven Projects,引入相关依赖(在此之前可以先在命令窗口中执行下mvn clean install)1.2、把项目配置好,主要是配置好JDK等等,如下:1.3开始配置项目File ----> project...原创 2018-05-17 10:58:14 · 85142 阅读 · 14 评论 -
MD5算法
MD5的全称是Message-Digest Algorithm 5(信息-摘要算法),是基于消息摘要原理的,消息摘要的基本特征就是很难根据摘要推算出消息报文。消息摘要(Message Digest)又称为数字摘要(Digital Digest)。它是一个唯一对应一个消息或文本的固定长度的值,它由一个单向Hash加密函数对消息进行作用而产生。如果消息在途中改变了,则接收者通过对收到消息的新产转载 2018-01-13 21:46:17 · 268 阅读 · 0 评论 -
ftpserver配置
简单的说,apache的ftpserver只需要我们配置两个文件:ftpd-typical.xml和users.properties(在安装目录的res/conf文件夹下),然后linux下通过bin目录下的ftpd.sh指令(windows用ftpd.bat),启动服务就可以了(ftpd指令需要传递一个参数,为res/conf/ftpd-typical.xml),详细介绍如下:1、下载原创 2017-12-29 07:25:35 · 3688 阅读 · 0 评论 -
hive数据直接写入到es索引中
1、创建索引 put: http://es.dm.csdn.net/item_for_related post: http://es.dm.csdn.net/item_for_related/item/_mapping { "blog": { "_all": { "enabled": false原创 2017-11-23 11:41:54 · 3882 阅读 · 0 评论 -
java.lang.VerifyError: Expecting a stackmap frame at branch target 16 类似java异常
报异常的方法内使用了Java 7的新特性:自动资源释放,类似于try(){},即在try后面跟一括号,在括号里面对一些资源赋值,try里面的代码块执行完毕之后会自动释放try后面的括号中声明的资源。Java 7 会使用新的Class类型校验器,新的类型校验器将老的校验器分为两步:1、类型推断2、类型校验新的类型校验器通过在javac编译时嵌入类型信息到bytecod原创 2017-10-17 13:54:04 · 1437 阅读 · 0 评论 -
redis-cli 将内容写入文件中
echo "keys 'cf_a1s2_*'" | redis-cli -h '127.0.0.1' -p 6379 -a '123456' > /tmp/cf_a1_keys.txt原创 2017-10-24 18:02:21 · 8288 阅读 · 0 评论 -
htmlunit中 java.lang.NoClassDefFoundError: org/apache/http/cookie/CookieSpecProvider 异常
使用htmlunit时报出如下错误:java.lang.NoClassDefFoundError: org/apache/http/cookie/CookieSpecProviderat com.gargoylesoftware.htmlunit.WebClient.createWebConnection(WebClient.java:1962)at com.gargoylesoftw原创 2017-07-26 10:06:37 · 4416 阅读 · 0 评论 -
验证码识别
其实,验证码识别其实就是用好用好tesseract-ocr,下面我先说下步骤:1、去https://github.com/tesseract-ocr/tesseract/wiki 下载tesseract-ocr,然后安装一下;2、代码中pom中加入:<dependency> <groupId>net.sourceforge.tess4j</groupId>...原创 2018-05-15 15:44:23 · 725 阅读 · 0 评论 -
kafka connect
一. Kafka Connect简介 Kafka是一个使用越来越广的消息系统,尤其是在大数据开发中(实时数据处理和分析)。为何集成其他系统和解耦应用,经常使用Producer来发送消息到Broker,并使用Consumer来消费Broker中的消息。Kafka Connect是到0.9版本才提供的并极大的简化了其他系统与Kafka的集成。Kafka Connect运用用户快速定义并实现各种Con...转载 2018-05-16 14:18:43 · 12067 阅读 · 1 评论 -
appscan常见问题修改
jsp中添加:<meta http-equiv="Content-Security-Policy" content="script-src 'self'; object-src 'none'; style-src cdn.example.org third-party.org; child-src https:">servlet中添加:/**解决Missing "C...原创 2019-07-01 16:21:27 · 2407 阅读 · 0 评论 -
Maven错误:was cached in the local repository, resolution will not be reattempted until the update
解决办法:命令中增加个参数U,如下:mvn -U clean install -Dmaven.test.skip=trueuse-Uparameter to force a check for the updated releases and snapshots on remote repositories, and resolve this issue.Actually you c...原创 2019-05-17 11:07:30 · 7888 阅读 · 1 评论 -
tika
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。利用Tika,我们可以获得文件的实际类型(https://blog.csdn.net/helihongzhizhuo/article/details/90404387)、文件的编码格式(https://blog.csdn.net/helihongzhizhuo/article/details/9040...原创 2019-05-21 13:54:04 · 355 阅读 · 0 评论 -
Tika获取文件类型
public String getfiletype(String file){ File f = new File(file); AutoDetectReader dr = null; Tika tika = new Tika(); //创建一个Tika类 //利用Tika的detect方法检测文件的实际类型 Sy...原创 2019-05-21 12:04:09 · 3170 阅读 · 0 评论 -
解压rar和zip文件名中文乱码问题,以及获取zip文件中的内容
import java.io.*;import java.util.Enumeration;import java.util.zip.ZipEntry;import com.github.junrar.Archive;import com.github.junrar.rarfile.FileHeader;import org.apache.commons.compress.archiv...原创 2019-05-21 10:41:40 · 2622 阅读 · 1 评论 -
解析zip java.lang.IllegalArgumentException: MALFORMED报错信息
这个错误是由于编码问题,需要先检测文件编码,修改后代码如下:File file = new File(sfile);// //利用Tika的AutoDetectReader类检测文件的编码格式 dr = new AutoDetectReader(new FileInputStream(file)); String cha...原创 2019-05-15 11:23:50 · 5972 阅读 · 0 评论 -
maven install报错:BASE64Decoder是内部专用API,可能会在未来发行版本中删除
今天遇到sun.misc.BASE64Decoder是Sun的专用API,可能会在未来版本中删除 的错误算是maven的一个bug,升级下版本就好了,修改pom的配置,我之前version是2.1,改成2.5.1后确实好了,2.1是error,而到了2.5.1变成了warning,如下:pom修改如下:<plugins> <plugin>...原创 2019-03-27 09:38:52 · 11048 阅读 · 1 评论 -
linux系统下selenium webdriver
1、selenium各版本selenium各版本 http://mvnrepository.com/artifact/org.seleniumhq.selenium/selenium-java2、确认使用的selenium版本及版本对应的firefox从selenium 3.0.0开始就要求firefox为48及以上版本,可以通过selenium changelog查看。chang...原创 2018-09-30 11:21:00 · 4533 阅读 · 1 评论 -
spark hive 运行Exception
1、 Error: java.lang.UnsupportedOperationException: Not implemented by the HftpFileSystem FileSystem imp问题原因:字面意思来看就是FileSystem的一些方法(getScheme等)没有被实现,主要原因是hadoop-hdfs的jar包冲突(调用的hadoop-hdfs的jar包原创 2017-08-01 16:23:39 · 534 阅读 · 0 评论 -
java url处理常遇到的问题
1、通过HttpURLConnection得到的数据中文乱码urlConnection = (HttpURLConnection) url.openConnection(); urlConnection.setRequestMethod(method);urlConnection.setDoOutput(true);urlConnection.setDoInput(t原创 2017-06-23 14:50:12 · 603 阅读 · 0 评论 -
Intellij IDEA无法启动:Failed to create JVM:error code -4
Intellij IDEA启动 Failed to create JVM:error code -4转载 2015-10-26 11:27:38 · 11467 阅读 · 0 评论 -
Windows下Git配置与使用指南
windows下git的安装及配置原创 2015-08-13 10:51:26 · 1021 阅读 · 0 评论 -
GC overhead limit exceeded
问题产生原因:根据sun的说法: "if too much time is being spent in garbage collection: if more than 98% of the total time is spent in garbage collection and less than 2% of the heap is recovered, an OutOfMemory转载 2015-09-01 16:19:07 · 735 阅读 · 0 评论 -
java字符串排序
1、非中文的排序@Test public void testSort() { String[] arr = {"张三", "李四", "王五", "123fS", "23AB","zA","xA","fA","lS"}; Arrays.sort(arr); String s = Arrays.toString(arr); s = s.substring转载 2015-04-02 11:24:52 · 510 阅读 · 0 评论 -
eclipse代码中选中的变量灰显
在Preferences->Java->Editor->Mark Occurrences里面设置转载 2014-11-18 10:53:51 · 790 阅读 · 0 评论 -
Akka
Akka是什么?转载 2014-07-30 18:14:53 · 1529 阅读 · 1 评论 -
新词发现初研究
60%的分词错误是由新词导致的一、新词的概念 目前,在中文分词领域出现了新词(New Words)和未登录词(Unknown Words)两种概念。很多研究者并没有对未登录词和新词加以区别,认为它们是一样的[12][13]。通常,未登录词被定义为未在词典中出现的词[3][4][5]。(Chen,1997)通过对一个规模为300万词汇的语料统计,将未登录词分为五种类别,包括 (a转载 2016-01-05 16:39:27 · 5659 阅读 · 1 评论 -
Word2vec与LDA的聚类区别
1、首先,Word2vec是词聚类,LDA是主题词聚类2、也许在方法模型上,他们两者是不同的,但是产生的结果从语义上来说,都是相当于近义词的聚类,只不过LDA是基于隐含主题的,WORD2VEC是基于词的上下文的。3、更严谨的说,词向量所体现的是语义(semantic)和语法(syntactic)这些 low-level的信息。而LDA的主题词表现的是更 high-level的文章主原创 2016-03-02 17:54:18 · 14032 阅读 · 0 评论 -
Intelij idea override标红及Error:java: Compilation failed: internal java comp问题
1、sdk的配置2、project settings里面的project配置3、project settings中的modules配置4、如果仍有Error:java:Compilation failed: internal java comp错误,则需配置下面原创 2016-04-26 11:51:36 · 939 阅读 · 0 评论 -
maven打包--包含dependency的jar包
1、maven-assembly-plugin插件pom.xml中添加如下代码: maven-assembly-plugin false jar-with-dependencies原创 2017-05-09 17:15:34 · 4522 阅读 · 0 评论 -
jTessBoxEditor训练验证码图片
1. 功能介绍利用jTessBoxEditor工具进行Tesseract3.02.02样本训练,提高验证码识别需求是对某个网站的验证码进行样本训练,形成自己的语言库,来提高验证码识别率。2. 环境准备关于tesseract样本训练有一个官方流程说明, https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract#ru原创 2017-05-11 18:41:22 · 7761 阅读 · 0 评论 -
java获取百度的真实url
最近需要获取百度的搜索结果数据,可是百度的url已经加密了,无法获取真实地址,后来就用htmlunit重新抓取了一遍获取地址,效率特别低,后来想到点击url肯定有个跳转的步骤,在Header中的location中发现了真是url,于是用Jsoup连接获取跳转,代码如下:public String getRealUrlFromBaiduUrl(String url) { Conn原创 2017-05-11 18:37:38 · 3622 阅读 · 0 评论 -
java以某一编码方式读取CSV
1、mvn依赖 net.sf.opencsv opencsv 2.3 2、代码public List readCSV(String filename) { CsvReader reader = null; FileInputStream fin = null;原创 2017-05-11 18:29:50 · 3551 阅读 · 0 评论 -
Jsoup使用选择器语法来查找元素
问题你想使用类似于CSS或jQuery的语法来查找和操作元素。方法可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(inpu转载 2016-12-01 14:01:40 · 1009 阅读 · 0 评论 -
文本解析
文本解析的方式:1、正则表达式2、html的Jsoup.parser解析转载 2016-08-06 17:58:02 · 512 阅读 · 0 评论 -
字符串长度及截取(中文2字符,英文1字符)
1、计算字符串长度,中文2个字符,英文1个字符public static int realLen(String str) { int m = 0; char arr[] = str.toCharArray(); for(int i=0;i<arr.length;i++) {原创 2016-08-24 09:26:43 · 2709 阅读 · 0 评论 -
juniversalchardet 文本编码检测工具
http://code.google.com/p/juniversalchardet/原创 2014-06-20 15:19:19 · 1094 阅读 · 0 评论