搜索-推荐
文章平均质量分 92
搜索-推荐
成长的小牛233
一个很菜,仍然热爱技术热爱生活的程序猿
展开
-
dubbo启动服务启动报错.UnsatisfiedDependencyException: Error creating bean with name '***': Un
报错信息:今天部署开发环境的时候这个问题弄了一下午,由于我本地启动是好的,然后部署到服务器老是启动不了,报如上错,后来经过排查发现是provider.xml和consumer.xml中的如下代码version属性版本信息不一致。<dubbo:reference id="logService" interface="net.xinhuamm.galaxy.facade.log.LogSer...原创 2020-04-30 20:45:55 · 838 阅读 · 1 评论 -
java 将海外时区转换为北京时区
//默认为上海时区 TimeZone tz = TimeZone.getDefault(); //北京时区 tz = TimeZone.getTimeZone("GMT+8"); Date date = new Date(System.currentTimeMillis()); // 获取默认的Dat...原创 2020-08-07 19:21:30 · 2978 阅读 · 0 评论 -
重写equals和hashcode达到HashSet对象集去重的实现
public class Contract { private String contractId; private String contractName; private Date begin; private Date end; @Override public boolean equals(Object o) { if...原创 2019-03-18 00:12:34 · 278 阅读 · 0 评论 -
java单例模式双重检查
public class Singleton { private static volatile Singleton singleton; private Singleton() {} public static Singleton getInstance() { if (singleton == null) { synchr...转载 2019-01-17 20:49:32 · 317 阅读 · 0 评论 -
mysql日期格式转换
select * from news where DATE_FORMAT(news_time, '%Y-%m-%d %k:%i:%s') <= " + "'" + curDate + "'原创 2019-01-17 20:39:13 · 4500 阅读 · 0 评论 -
redis通过expire设置存活期注意问题
今天老大检查之前所做的项目发现项目过期数据仍然残留并没有删除,本以为自己设置了存活期就不用管数据了会自动删除掉,啊,果然自己太马虎了,如果是传统的kv类型,通过expire(key,alive_time)没有错误,但是由于自己项目存储结果是key对应的hash结果,但是hash中的数据不断更新,与因此key一直在改变,导致hash中的过期数据并没有得到清除。采取的解决办法,通过keys *首先...原创 2019-01-10 17:34:42 · 2895 阅读 · 0 评论 -
最全英语单词下载地址
这两天搜集英文单词做词干化处理,虽说standford-NLP可以处理,但是效率不高,自己动手找单词做映射表,找单词真的痛苦!!!放出以下地址最为保存和分享github:https://github.com/dwyl/english-words/blob/master/words.txt 里面有4M的英文单词,数据格式有txt和jsonhttps://github.com/Zhangt...原创 2018-12-30 16:05:03 · 23351 阅读 · 0 评论 -
java英文单词单复数转换
package steam;import java.util.*;import java.util.regex.*;/** * * 单复数转换类 * 2018年12月30日 */public class Inflector { private static final Pattern UNDERSCORE_PATTERN_1 = Pattern.compile("([A...转载 2018-12-30 15:58:05 · 2089 阅读 · 0 评论 -
出现特殊分隔符无法分隔解决方案
今天处理文本数据时候遇到这种文本用空格和tab正则匹配没有作用,后来问了同事发现可以用“\\uf8f5”去匹配。待处理文本:A abbr.安 A-10IInone.美空军主力近距离空中支援攻击机,无愧为“坦克杀手”。A-12none.夭折的美海军第一种隐形舰载攻击机。A-4 none.54年服役的单座轻型舰载攻击机,现仍被多国使用。A-6none.双座重...原创 2018-12-30 13:27:31 · 1420 阅读 · 0 评论 -
去掉标点符号
//去掉标点符号、空格 title = title.replaceAll("[\\pP\\p{Punct}| +]", "");原创 2018-12-19 11:58:26 · 953 阅读 · 0 评论 -
java.lang.IllegalArgumentException: URLDecoder异常解决
异常:Exception in thread "main" java.lang.IllegalArgumentException: URLDecoder: Illegal hex characters in escape (%) pattern - For input string: "u9" at java.net.URLDecoder.decode(URLDecoder.java:...转载 2018-12-24 13:02:53 · 2872 阅读 · 0 评论 -
【转载保存】接口压力测试安装与使用
https://blog.csdn.net/qq_26525215/article/details/79182674转载 2019-01-15 19:21:15 · 112 阅读 · 0 评论 -
【使用注意】linkedHashSet使用后面插入值不会覆盖掉前面值
LinkedHashSet<Keyword> linkedHashSet = new LinkedHashSet<>(); Keyword keyword2 = new Keyword("han", null, 20, false, false); linkedHashSet.add(keyword2); Keyword keyword = new Key...原创 2019-03-21 11:25:06 · 1248 阅读 · 4 评论 -
天气数据获取接口和网址汇总
免费API:https://www.sojson.com/blog/305.html爬取网址:http://www.weather.com.cn/https://www.tianqi.com/chinacity.html原创 2019-08-19 17:21:58 · 4942 阅读 · 0 评论 -
【爬虫】爬取带有cookie才能获取网页内容的新闻网站
工作任务:今天老大让我跑取一个新闻网站:https://www.yidaiyilu.gov.cn/采坑记录:https协议,如果利用http协议去请求会报出如下信息:错误:SSLHandshake错误就知道了,客户端与服务端进行连接时,需要通过SSL协议进行握手(坑)改用:重写DefaultHttpClient方法使其支持SSL协议package httpsParse...原创 2019-05-07 23:27:31 · 2307 阅读 · 0 评论 -
【工作】python识别不同国家语言类型
优秀文章推荐:地址:Python使用谷歌langdetect检测语言地址:Python3:语言探测工具langdetect和langid支持的语言类型:支持检测55种语言: af, ar, bg, bn, ca, cs, cy, da, de, el, en, es, et, fa, fi, fr, gu, he, hi, hr, hu, id, it, ja, kn, ko...原创 2019-05-06 20:16:50 · 7212 阅读 · 0 评论 -
【使用注意】Jsoup的select方法
之前做了一个频道抓取:获取div Elements div_e; div_e = doc.select("div"); Iterator<Element> div_it = div_e.iterator(); while (div_it.hasNext()) { 处理逻辑 }我是想通过select ...原创 2019-04-03 10:35:55 · 526 阅读 · 0 评论 -
【使用注意】特殊中括号[]的特殊json数组
@Test public void demo93() throws Exception { String str = "[\"a\", \"b\", \"c\"]"; //生成json数组 JSONArray createArray = new JSONArray(); createArray.put("a"); createArray.put("b"); creat...原创 2019-04-10 16:46:33 · 804 阅读 · 0 评论 -
DButils工具使用笔记以及常见问题总结
入门:https://www.cnblogs.com/smyhvae/p/4085684.html一、字段名称和实体类命名不用解决办法:给查询结果的显示字段取别名,如TEMPLATE_ID AS templateIdselect news_id as id, title from test where id=1二、DBUtils使用BeanListHandler及BeanHa...原创 2019-04-03 22:30:09 · 729 阅读 · 0 评论 -
常见分数值归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:一、min-max标准化(Min-Max Normalization)也称为离差标准...转载 2019-03-18 15:14:15 · 5822 阅读 · 0 评论 -
System.getProperty("user.dir")获取当前项目所在路径
System.getProperty("user.dir")记录下原创 2018-12-21 21:44:33 · 3721 阅读 · 0 评论 -
java HashMap实现中文分词器 应用:敏感词过滤实现
今天下午部门内部技术分享是分词器算法。这次的主讲是大名鼎鼎的Ansj分词器的作者-孙健。作者简介:Ansj分词器作者elasticsearch-sql(elasticsearch的sql插件)作者,支持sql查询nlp-lang自然语言工具包发起人NLPCN(自然语言处理组织)发起人等等…网站:http://www.nlpcn.org/GIT地址:https://github.co...转载 2018-12-16 02:52:38 · 600 阅读 · 0 评论 -
jetty9更改post请求长度
添加如下代码即可: static { System.setProperty("org.eclipse.jetty.server.Request.maxFormContentSize", String.valueOf(Integer.MAX_VALUE)); System.setProperty("org.eclipse.jetty.server.Request.maxFormKeys",...原创 2018-11-27 11:10:00 · 1657 阅读 · 0 评论 -
json解析双引号
解析一个json数据:{“manifest”:{ Version:“3.0”}}仔细看的话,这个字符串不是正规的json格式,Version少了双引号,应该是:{“manifest”:{ “Version”: “3.0”}}转载:https://www.cnblogs.com/afluy/p/4023838.html如果用JSONObject mainfestObject.getJSO...转载 2018-11-27 10:46:19 · 1361 阅读 · 0 评论 -
根据经纬度求最近点的三种解法java实现
geoHash优秀文章:https://blog.csdn.net/youhongaa/article/details/78816700https://blog.csdn.net/u011497262/article/details/812106341.利用geoHash把经纬转换成32进制的编码字符串2.将待搜索的坐标转换成编码与坐标库中的串进行比较,找出前缀匹配长度高放入map中,再从...原创 2018-11-30 11:26:44 · 5419 阅读 · 1 评论 -
利用正则匹配url是否合法对于有的url会浪费过长时间使程序卡死,切记!
改进:改成匹配url是否为以某个结尾的,至于非法的url就让Jsoup.connect(url)把异常抛弃 //启动该正则匹配特别的慢// public static String regex = "^([hH][tT]{2}[pP]:/*|[hH][tT]{2}[pP][sS]:/*|[fF][tT][pP]:/*)(([A-Za-z0-9-~]+).)+([A-Za-z0-9-~\\/])...原创 2018-11-21 18:20:19 · 254 阅读 · 0 评论 -
爬虫遇到路径转换的解决方案
String href = n.attr("abs:href");//jsoup自带的路径转换方法,有的时候行不通 if("".equals(href)) { href = n.attr("href"); if (href.indexOf("http") < 0) { href = getAbsoluteURL(url, href); ...原创 2018-11-21 17:26:09 · 461 阅读 · 0 评论 -
【转载保存】接口的压力测试工具
https://blog.csdn.net/luosaosao/article/details/72900072转载 2018-11-01 14:57:36 · 137 阅读 · 0 评论 -
多次访问redis造成redis连接总是断开的解决方案
之前做了一个新闻推荐项目用到redis,当把项目发布到线上去测试的时候,用两个redis的时候发现开始跑的时候没有问题,但是过一段时间当用户访问量特别大的时候有一个redis总断开连接的问题,老大采取的解决方案是把两个redis弄成10几个redis集群,这样可以减少redis断开连接的问题,然后添加重连机制的时候生成一个随机数去除以redis总数得到一个值然后去判断当前redis是否可以使用...原创 2018-08-31 18:19:28 · 17442 阅读 · 0 评论 -
网络爬虫-获取网页中的数据加伪装头,伪装成浏览器多次访问,避免单次访问导致ip被封
public static String getHtmls(String url) throws IOException { RequestConfig globalConfig = RequestConfig.custom().setCookieSpec(CookieSpecs.IGNORE_COOKIES).build(); String html = ...原创 2018-08-01 16:22:32 · 1660 阅读 · 0 评论 -
从mysql取出数据封装成json中遇到特殊字符自动转成unicode解决方案
@Test public void xxx() throws ParseException, UnsupportedEncodingException, Exception { ArrayList<JSONObject> list = new ArrayList<>(); String s = "家电偷工减料、服装质量差……还...原创 2018-08-01 16:17:16 · 2182 阅读 · 0 评论 -
java.lang.NoSuchMethodError: javax.servlet.http.HttpServletRequest.isAsyncStarted()Z 的解决
jetty 9 嵌入式开发时,启动正常,但是页面一浏览就报错如下:java.lang.NoSuchMethodError: javax.servlet.http.HttpServletRequest.isAsyncStarted()Z原因:jetty 9 依赖的servlet-api是3.X版本,如果项目中还有其它第3方开源库隐式依赖了2.x版本的servlet-api,就会报这个错。转载:...原创 2018-11-27 15:34:32 · 749 阅读 · 0 评论 -
FileOutputStream为false时候注意的问题
今天写代码时候发现,new FileOutputStream(new File(“test.txt”), false)时候test.txt文件内容会清空,记录一下!原创 2018-12-12 17:07:51 · 1202 阅读 · 0 评论 -
java英文拼写检查并自动纠正
SpellCorrect原理:https://www.cnblogs.com/jianxinzhou/p/4740392.html项目源码:package com.xq.algorithm;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.Fi...原创 2018-12-16 02:14:51 · 3680 阅读 · 3 评论 -
英语单词词干化表
博客:https://blog.csdn.net/potato012345/article/details/78091939下载地址:https://github.com/Zhangtd/MorTransformation转载 2018-12-26 18:27:22 · 1350 阅读 · 0 评论 -
利用TF-IDF提取新闻文章摘要
文章:http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html转载 2018-12-15 19:46:20 · 1290 阅读 · 0 评论 -
Java解析json出现双引号变成转义字符"解决办法
Java中:利用StringEscapeUtils.unescapeHtml4强转String newJson = StringEscapeUtils.unescapeHtml4(jsonStr);原创 2018-12-09 16:48:05 · 8788 阅读 · 1 评论 -
java文件重命名失败问题
我记得之前也遇到这个问题后来找了几个小时才找到问题,这次又花了一个小时找出这个问题,发现是自己的文件流没有关闭,一定要切记,当对文件重命名操作的时候一定要先把操作改文件的文件流关闭之后再进行重命名的操作,切记!切记!切记!...原创 2018-12-14 15:48:38 · 2172 阅读 · 0 评论 -
java求差集、并集和交集
package algorithm;import java.util.ArrayList;import java.util.List;public class SetOperation { public static void main(String[] args) { List<String> list1 = new ArrayList<String>...原创 2018-12-19 21:02:24 · 654 阅读 · 6 评论 -
java文件流操作注意
今天做了一个测试: @Test public void fileOut() throws Exception { FileOutputStream out = new FileOutputStream(new File("test.txt"), false); out.write("1".getBytes()); out.write("2".getBytes()); File ...原创 2018-12-12 18:35:23 · 185 阅读 · 0 评论