杂
xiewenbo
互联网广告行业呆过几年,旅游公司呆过几年,对机器学习,自然语言处理,图像识别,个性化推荐 有兴趣
展开
-
vim临时解决乱码的方法 e ++enc=utf-8
在vim中输入:e ++enc=utf8可以快速解决vim乱码问题,即使语言配置不正确,也可以快速解决乱码问题。这种方式的原理是: 当vim无法识别文档的编码的时候,会使用latin-1去读取,导致文档显示上出现乱码,上述命令,就会让vim用utf-8编码的方式重新加载一遍,当然如果你的文档是用gbk编码的,可以使用: e ++=enc=gbk的方式来转换。————————————————...转载 2020-01-09 14:26:21 · 3296 阅读 · 0 评论 -
某比赛-年纪预测
数据预处理清洗:所有appid,都转化成类别 统计出低频的手机型号过滤掉用unk代替特征提取:手机品牌+型号 3259个手机型号 app使用类别使用做为特征(45大类,288细类) 手机使用时间段偏好(每四小时分段) app类别 使用时长 top 5 (替换掉特征2) 手机使用总时长网络结构,256->128->64->num_classes...原创 2019-07-30 23:01:46 · 108 阅读 · 0 评论 -
词性标注在较低层编码好,而词义消歧义用上层编码更好
词性标注在较低层编码好,而词义消歧义用上层编码更好原创 2019-07-30 22:58:30 · 200 阅读 · 0 评论 -
网页转pdf
网页转Pdf:csdn:document.getElementsByClassName("meau-list")[0].hidden=true;document.getElementsByClassName("csdn-toolbar")[0].hidden=true;document.getElementsByClassName("recommend-right")[0]....原创 2019-07-30 22:57:29 · 212 阅读 · 0 评论 -
Keras中自定义复杂的loss函数
https://kexue.fm/archives/4493转载 2019-04-12 14:21:53 · 1098 阅读 · 0 评论 -
[TODO]高维空间求近似最近邻
https://www.cnblogs.com/futurehau/p/6524396.htmlhttps://www.jqr.com/article/000245转载 2019-03-15 19:43:15 · 141 阅读 · 0 评论 -
lucene 自定义排序
Lucene提供了一套强大的API来帮助我们实现自定义排序,本节我们使用一个距离搜索的例子来阐述: 其实核心是换一个comparator就成,而这个排序器用在哪里呢,如下所示:package custom;import java.io.IOException;import org.apache.lucene.search.FieldComparator;import org.apa...转载 2018-11-28 17:13:18 · 438 阅读 · 0 评论 -
乱七八糟的东西
http://www.54chen.com/http://www.cnblogs.com/BearsTaR/http://www.cnblogs.com/http://www.blogjava.net/nokiaguy/archive/2009/01/26/252564.htmlhttp://www.blogjava.net/zhuyongjp/archive/2009/02/23...原创 2011-12-06 17:17:03 · 114 阅读 · 0 评论 -
Alpha、Beta、RC、GA版本的区别
Alpha:是内部测试版,一般不向外部发布,会有很多Bug.一般只有测试人员使用。Beta:也是测试版,这个阶段的版本会一直加入新的功能。在Alpha版之后推出。RC:(Release Candidate) 顾名思义么 ! 用在软件上就是候选版本。系统平台上就是发行候选版本。RC版不会再加入新的功能了,主要着重于除错。GA:General Availability,正式发布...原创 2011-12-21 20:16:48 · 114 阅读 · 0 评论 -
分词词性列表
名词分为以下子类: n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名 nrf 音译人名 ns 地名 nsf 音译地名 nt 机构团体名 nz 其它专名 nl 名词性惯用语 ng 名词性语素(g语素代码)2. 时间词 t 时间词 tg 时间词性语素 3. 处所词 s 处所词 4. 方位词 f 方位词转载 2016-08-03 20:03:59 · 1862 阅读 · 0 评论 -
用Eclipse 统计代码行数小技巧
今天公司SQA问我目前项目代码行数有多少,我当时就是想,以前好像写过类似的统计工具但是一时又找不到公司网络又不能下载,所以想想eclipse是不是又类似功能,找了下没有,但突然一想有一个转弯方法:统计工程里面的\n个数1. 按 CTRL+H 打开查找对话框 选择file search按下图方式输入注意: I. 输入查找\n, 勾选正则式选项转载 2015-03-04 16:50:45 · 409 阅读 · 0 评论 -
近期面试总结
hadoop 相关1. shuffle,combine,partition 的作用和意义原创 2014-05-21 20:50:13 · 589 阅读 · 0 评论 -
Ubuntu设置固定ip
设定IP$sudo gedit /etc/network/interfacesauto loiface lo inet loopback auto eth0 iface eth0 inet static address 192.168.0.111netmask 255.255.255.0 gateway 192.168.0.1转载 2014-05-18 13:51:26 · 569 阅读 · 0 评论 -
纪念我的2012年10月29日
没想到第一篇真正意义上的原创,竟然是和技术无关的。在过去的12小时内,命运似乎在和我开玩笑。我的世界突然变成了黑色。我怀念的吉他,钢琴。。。还有篮球。昨夜未眠,今夜亦恐难入睡。多么希望有人可以告诉我该怎么办。我是坚强的。可是也有脆弱的时候。现在只想抱着我的吉他。还有,我的梦想。原创 2012-10-29 13:38:46 · 1479 阅读 · 0 评论 -
基于james3.0 的邮件系统(struts2.3.2 +spring3.0.1+jpa(hibernate3.6.5)实现)b/s模式 .
系统下载地址:http://download.csdn.net/detail/afgasdg/3681707一、 环境配置本系统需要的环境:apache james3.0邮件服务器、tomcat 服务器、Mysql5.1数据库二、 具体环境配置Mysql5.1 配置 使用本系统前请将mysql编转载 2012-08-10 15:15:19 · 2924 阅读 · 1 评论 -
Java开源建站工具
作者: 阮一峰日期: 2011年8月11日美国程序员Jon Scott Stevens,公布了他的创业公司所使用的开发工具清单。他的语言平台是Java,开发项目是一个网站(还未上线)。所用到的工具都是开源的,可以免费得到。在目前的创业者之中,用Java作为网站开发语言的人似乎很少。这当然不是没有原因的,Java看上去确实不像是最便捷的网站开发转载 2012-04-06 19:26:03 · 687 阅读 · 0 评论