- 博客(23)
- 资源 (15)
- 收藏
- 关注
原创 BERT小试
2020年6月16日 初次实践,尝试在自己的数据上简单跑Bert fine-tune;过程参考:https://zhuanlan.zhihu.com/p/50774647试验设置:将每个triple转化为形如"ptext : vtext"的文本,要求判断两triple间相似程度(分类问题,三种label:["contradiction", "entailment", "neutral"] 分别对应不相似、相似、中等);监督数据构造:根据某种已有文本相似度打分对triple pair打标签(例如.
2020-06-16 21:31:58 748
原创 presentation视频录制与编辑
任务:录制ppt报告视频(要求有ppt演示和讲解),生成1920*1080p的视频文件;1、视频录制:(1)推荐方式:ppt放映+zoom录制操作:①录制:将ppt调到放映模式,在zoom “会议->我的会议”中开启个人会议,选择"屏幕共享"ppt放映所在窗口,确认未静音,准备好后即可点击“录制”;②导出:zoom会自动生成mp4文件到会议默认路径,在“会议->会议录制”中即可看到有录制视频的会议的列表,选择某个会议,在右边按钮中“打开”即可打开视频文件保存的目录;tip
2020-05-16 12:55:25 3122
原创 Virtuoso Jena Provider对count的支持问题
现象:执行count语句时报错(即使将count部分去掉括号,或者改为 count distinct ?x 或 count ?x 或 count(?x)依然会报类似的错误)qstr: select (count(distinct ?x) as ?cx) where { ?s ?x. }Exception in thread "main" com.hp.hpl.jena.qu
2017-11-03 22:09:39 449
原创 从多项分布采样的Java实现
思路:将每个概率值对应到[0,1]区间内的各个子区间(概率值大小体现在子区间的长度上),每次采样时,按照均匀分布随机生成一个[0,1]区间内的值,其落到哪个区间,则该区间概率值对应的元素即为被采样的元素;算法:1、先对概率值从大到小排列(不是必要过程,是便于加速的技巧,这样每次查找时优先检测随机数是否落在大概率的区间内,减少比较次数);2、生成一个[0,1)区间内的随机
2017-10-16 12:35:04 2720
原创 Virtuoso Jena Provider查询日期型数据的bug修正
(该bug在使用virt_jena2.jar时出现,在使用virt_jena3.jar时则不会出现该bug,所以另一种避免该bug的方式是使用新版本的Virtuoso Jena Provider )现象:用jenaAPI检索出的与日期相关的literal(主要是datatype为date或year的literal),检索出来的值比原始值推迟5天;例如:Virtuoso中原始
2017-09-16 17:22:48 491
翻译 Java8官方文档学习笔记
文档地址:http://docs.oracle.com/javase/8/docs/Oracle有两个实现了Java平台标准版本(Java SE)8,即Java标准开发工具(JDK)8和Java标准运行时环境(JRE)8.JDK8是JRE8的超集,包含了JRE8的所有内容,还包括诸如编译器和调试器等在开发applet和application时必要的开发环境。JRE8提供函数库,
2017-03-06 19:34:40 2165
原创 Matlab使用技巧记录
1. matlab连mysql数据库http://bbs.pinggu.org/thread-3564639-1-1.html
2017-01-20 21:47:41 407
翻译 用户密码的加密方式
可以采用以下几种加密方式:①MD5:存在冲突的情况;②SHA1:可能被破解;③PHP的crypt()函数;可以额外传入一个salt字符串,则生成的加密字符串前两个字符取自salt字符串的前两个字符;上述几种方式均有被破解的可能,为了提高破解难度,可以将用户名和密码字符串链接起来作为加密的输入;注意:当用户忘记密码时,不要将用户设置的密码邮件给用户,而可以代之以临时密码,
2016-04-08 21:33:46 1229
翻译 Vrituoso安装经验总结
参考:https://tw.rpi.edu//web/node/3625/一、安装:目标:将Virtuoso安装到/home/目录下(默认安装在/usr/local/)Building from Upstream Source1. Installing the required build dependencies: sudo aptitude i
2016-04-02 21:21:16 4147
转载 Java 类的热替换 —— 概念、设计与实现
转载自: https://www.ibm.com/developerworks/cn/java/j-lo-hotswapcls/Java 类的热替换 —— 概念、设计与实现构建基于 Java 的在线升级系统对于许多关键性业务或者庞大的 Java 系统来说,如果必须暂停系统服务才能进行系统升级,既会大大影响到系统的可用性
2016-04-01 11:00:21 489
原创 在word中插入显示在同一行的两张图片(且各自带有题注)
先将两张图片均导入word中,位置设置为“嵌入文本行中”,调整t图片大小使得两图片刚好可以呈现在同一行。如果图片不需要题注,或者两图片共用一个题注,那么就此就可以了;而如果两图片各自要有题注,则继续进行如下操作:然后分别选中两张图片(即该操作对两张图片都要各做一次):页面布局->分栏->两栏。设置好后,将后面一张图片拖至前一张照片紧随其后,即可看到两张照片并列呈现的样子,然后分别对两张
2015-06-30 20:02:55 57424 6
原创 unicode编码转换为字符的形式
问题:在从数据库中取出数据用来建立Lucene索引时,遇到形如“\u041A\u0430\u0441\u0442\u0438\u043B\u0438\u044F - \u041B\u0430 \u041C\u0430\u043D\u0447\u0430”的字符串,length为94,而其实是字符串“Кастилия - Ла Манча”的Unicode形式(length为19)。若直接存入Luc
2013-08-07 10:51:22 1884
转载 [转] Ubuntu安装搜狗拼音输入法-sogoupinyin
http://www.ubuntuhome.com/ubuntu-install-sogoupinyin.html先要在language里下载中文伴随着Deepin 12.12 beta的发布,搜狗输入法也与我们见面了。在发布前几日Deepiner也通过各种途径向我们展示了搜狗Linux输入法,当然也掉足了胃口。来自官方的截图:当然令很多Ubuntu用户期待的是,搜狗输
2013-08-05 09:14:51 1651
转载 ubuntu安装java环境
http://www.douban.com/people/jingchaochen/ubuntu 12.10中MyEclipse 10.6+下载+安装+破解http://www.lihuoqing.cn/code/689.htmlubuntu scphttp://hi.baidu.com/zhangchu0702/item/07becf1
2013-08-05 09:13:18 640
转载 [转]windows远程登陆到ubuntu
Connect to Ubuntu 12.04 (Precise Pangolin) via Windows Remote Desktophttp://www.liberiangeek.net/2012/05/connect-to-ubuntu-12-04-precise-pangolin-via-windows-remote-desktop/Want to conne
2013-08-05 08:47:29 1259
转载 myeclipse使用技巧记录
1、保存myeclipse控制台内容到文件: Run-->Run Configurations-->Common-->Standard input and output (可能不同版本的Eclipse位置会有所不同)项中勾选 File 再选择你想要保存的文件路径(比如:E:\result.txt) (来源:http://zhidao.baidu.com/question/3287382
2013-08-03 16:37:42 661
原创 修改pdf注释中的作者
Adobe Acrobat设置注释的作者,默认情况下使用登录名作为作者,可在菜单栏“编辑”->“首选项”->“身份信息” 中看到,登录名默认为系统账户名,不可更改。如果想改注释的作者,先在身份信息中填写姓名信息,然后在“编辑”->“首选项”->“注释”->“建立注释”中,把“总是使用登录名作为作者名”去选,以后就都默认用姓名作为注释作者了
2013-06-24 16:40:14 25187 3
转载 爬虫学习笔记1--代码示例
资料1:java网络爬虫的实现 (http://developer.51cto.com/art/201103/248141.htm )爬虫框架 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。对于垂直搜索来说,聚焦爬虫,即有针对性地爬取特定主题网页的爬虫,更为适
2013-02-23 20:19:19 735
原创 用java中的java.util.zip包读取压缩文件
最近下载了点数据,压缩包的形式下几十兆,一解压就1G左右了,如果一个个解压再看内容实在是伤不起,于是想有没有不解压而读取压缩文件内容的方式,查阅网上资料,发现java中的java.util.zip包中提供了处理zip文件的API,小练习了一下,代码如下:import java.io.BufferedReader;import java.io.File;import java.io.
2012-04-19 16:08:15 7303
原创 NLTK与DataWiki
最近在做机器翻译的作业,学习一个自然语言工具包NLTK(http://www.nltk.org/),用python做的一个项目,虽然是以教学为目的的项目,但看过去做得很大很全,据说有十万行代码,而且是python代码,我对大型项目的规模没有一个定量的概念,但至少这代码行数于我而言就已经算是巨大了。文档更是非常清楚和详尽,从安装到代码和数据下载,到python的基本知识和调用语法到自然语言分析处
2011-12-06 11:03:54 1036
原创 关于工厂模式
今天受打击了,晚上回来的时候,师兄看我在看设计模式,于是问我“工厂模式”有什么好?一时语塞,顿时想不起来,只记得貌似是在里面产生一堆东西的,减少代码修改量的,又想起貌似挺多设计模式都是用来解耦合的,于是犹犹豫豫地回答“解耦合?”然后就再想不出任何实质的能够回答师兄的疑问的东西,用蕾蕾的话说,就是“又没有通过师兄的考验”。。。好在另一个学长貌似对这个还挺有研究,于是一路上都在讲解,在他的讲解中我总算
2011-11-08 20:56:46 597
原创 k-折交叉验证(k-fold CrossValidation)
k-折交叉验证(k-fold crossValidation):在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用数据集对算法效果进行测试,将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。在matlab中,可以利用:indices=crossvalind('Kfol
2011-10-26 12:16:48 11639 9
原创 用MATLAB做T检验(ttest)
t-检验:t-检验,又称student‘s t-test,可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度),假设了数据的正态性,并反应两组数据的方差在统计上是否有显著差异。matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法做的是 One-sample and pa
2011-10-26 12:10:46 95718 5
The Human-Computer Interaction Handbook 2ed[2008].pdf
2013-12-03
User Centered System Design New Perspectives on Human-Computer Interaction
2013-12-03
Hacking Vim 7.2.pdf
2013-12-03
汇编语言教程(《汇编语言》(Assembly Language)是计算机专业中一门重要的基础课程,是一种面向机器的低级语言。)
2009-12-23
C语言中调用汇编程序
2009-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人