自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 PPTV数据按照小类别分类

PPTV数据格式描述:plt int 产品线,取值101,102,103,104,110,111,分别表示ipad,iphone,apad,aphone,windows客户端,网站uidmd5 stringchannelid intipvalue string ipcity string

2015-09-14 16:10:50 496

转载 java代码中执行shell或调用系统命令

package com.fssqawj;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;public class RunExec { public static void main(String[] args) { // TODO Auto-gen

2015-09-13 18:12:05 1393

原创 Quora cqa问题抓取

quora是一个比较知名的社区问答网站,对于目前比较流行的cqa问题,通过quora提供的搜索工具来找到相似的问题进而抽取答案。事实上,quora的搜索大致是根据关键词匹配的。 String s=HttpRequest.sendGet("https://www.quora.com/search","q=Have%20you%20ever%20done%20the%20NoFap%

2015-09-13 17:51:12 2313

转载 apache下设置缓存方法详细介绍

apache下设置缓存方法详细介绍在apache中是支持一个mod_cache模板的,只有打开mod_cache模块之后我们才可以使用apache缓存,mod_cache开启后可使用两种缓存方式,一种是基于硬盘文件的缓存(mod_disk_cache ),另一种是基于内存的缓存(mod_mem_cache ),下面我来给大家介绍。默认情况下,apache安装完以后,是不允许

2015-08-31 22:50:26 1437

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-08-29 13:17:07 388

原创 同义词词林图转树

HIT同义词此林的上下位词关系不是树状结构,从图转到树型结构算法:1.察看word是否有下为词,得到下位词childlist2.若第一步childlist为空,在entity表中查找该概念对应的实体,否则对于childlist中的每个word若之前没访问过,执行第一步3.结果合并生成树型结构缺点:1.忽略了此的层次关系2.对于结构较大的概念,效率较慢

2015-06-04 11:08:39 901

原创 阿里天池特征统计工作

用御膳房的大数据处理平台提供的Sql处理我负责统计的特征:用户id,总点击量,总收藏量,总添加购物车量,总购买量,用户活跃天数/抽样时间长度,发生购买天数/抽样时间长度,总点击量/总购买,总收藏/总购买,总购物车/总购买,发生购买天数/用户活跃天数,用户活跃天数,发生购买天数初步没有限定统计窗口,选取全部30天的数据Sql代码如下:create table user_All

2015-05-25 16:57:34 593

原创 Jersey+EclipseJavaEE+Apache-Tomcat8 开发Rest服务

一、前期准备:1.了解Rest2.相关工具下载Jersey https://jersey.java.net/由于版本问题,我使用的是1.19二、搭建1.创建动态Web工程jerseyTest2.编辑编译环境,将jersey的lib文件夹下的包全部倒入,同时放到工程下WebContent/WebINF/lib文件夹下3.编写HelloServiece类packag

2015-05-25 16:48:21 945

原创 D2P:Distance-Based Differential Privacy in Recommenders

推荐系统中基于距离的差分隐私保护。这篇文章来自VLDB2015点击打开链接差分隐私是Dwork在2006年针对统计数据库的隐私泄露问题提出的一种新的隐私定义 . 在此定义下,对数据集的计算处理结果对于具体某个记录的变化是不敏感的,单个记录在数据集中或者不在数据集中,对计算结果的影响微乎其微.所以,一个记录因其加入到数据集中所产生的隐私泄露风险被控制在极小的、可接受的范围内,攻击者无法通

2015-04-22 11:15:08 1040

原创 WebMagic Java 爬虫的简单应用

前段时间做旅游本体的知识库,我和老师反应说景点之间关系太少了,导致整个图很稀疏。。“你去wiki上抓一批数据吧”,就这样被自己坑了。由于一直在用java做项目,ZWQ师兄推荐的是selenium,这个我想说真的很强大,还支持JS渲染,不过当我看到这篇的时候,我决定学一下WebMagic。项目中文文档地址:http://webmagic.io/docs/zh/这个项目很容易上手,只要

2015-04-14 16:34:25 2055

原创 天池大数据竞赛——UI特征统计

明明是移动推荐算法,非要搞成二分类问题。。机器学习什么的不太懂,什么训练集测试集验证集,什么交叉验证,什么LR SVM,什么weka之类的,不管了。。大神学姐说主要还是在找特征,模型什么的不是很重要。我这边着的主要是U-I关系的一些比率特征1.购买该品牌次数/总购买次数2.用户对A的行为次数/用户总的行为次数3.在对A访问的那些天里,用户对A的访问次数/那写天里的从浏览次数

2015-04-09 22:26:51 1508

原创 jena SPARQL查询的简单应用

一个个简单的三元组,繁杂的世界,二进制的忧伤谁能懂接上篇应用OWL API旅游数据本体的建立,接下来就是从这个本体数据库里查询需要的内容SPARQL的全部基础就是这个简单的概念:尝试去找到能够匹配一个给定图模式的那些三元组集合。他和SQL有许多相似之处,学习起来也比较简单。

2015-04-02 11:06:05 1657

原创 OWL API 简单应用 构建领域本体 —— 以旅游数据为例

OWL API 应用构建领域知识库

2015-03-26 16:35:37 5766 5

原创 复杂度计算

在1~n中,能被2整除的有n/2个,能被3整除的有n/3个,……则该算法的复杂度可这样计算:O(n)=n/2×1+n/3×2+n/5×3+n/7×4+……//即O(n)~n×φ(n)考虑到6这个数,它既是2的倍数,也是3倍数,因此还要用到容斥原理。//设能被第i个素数整除的正整数的集合为Ai。对于特定的一个整数k,该算法一定是在取得其最小的素因数,或者其本身是个素数时bre

2014-01-29 15:22:19 928

原创 EOJ 1086 Max discrepancy

Max discrepancy Time Limit:1000MSMemory Limit:30000KBTotal Submit:138Accepted:57DescriptionSolofanfy is busy with his farm,at this time,his little dog ask him to do some algorithm with h

2013-11-26 14:25:28 981

原创 EOJ 1019 着弹点

着弹点 Time Limit:1000MSMemory Limit:30000KBTotal Submit:482Accepted:62Description炮兵某部进行实弹射击,对一个平面区域里连续开炮,得到了很多的弹坑.当射击完成后,作为技术人员的你,想要得到一个重要的参数,就是相隔距离最大的炮弹着弹点的距离. Input 多组数据,每组第一

2013-02-21 09:12:22 637 1

原创 EOJ 1120 Peg Game

Peg Game Time Limit:1000MSMemory Limit:30000KBTotal Submit:224Accepted:86Special JudgeDescriptionYou are given a 7-by-7 board of holes. Some holes are filled with pegs, and some are not. Y

2013-02-19 19:11:12 811

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除