自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Talk Is Cheap

If You Get Tired, Learn To Rest, Not To Quit.

  • 博客(21)
  • 资源 (385)
  • 问答 (103)
  • 收藏
  • 关注

原创 Pager类

import java.util.List;import java.util.Map;@SuppressWarnings("unchecked")public class Pager {        // 排序方式    public enum OrderType{        asc, desc    }        public stati

2012-10-30 16:10:48 1324

转载 MyEclipse Freemarker 插件安装

(一)打开http://sourceforge.net/projects/freemarker-ide/files/ 下载最新版本(二)将其解压,将hudson.freemarker_ide_0.9.14文件夹放入MyEclipse安装目录dropins下(例:D:\Program Files\MyEclipse10.0\MyEclipse 10\dropins 目录下)(三) 然后重新启

2012-10-29 16:05:56 711

原创 一些略微复杂的sql语句

SELECT Count(DISTINCT imei) FROM data where PE_versionname = '5.0.0.88';  insert into device_versionselect distinct imei, PE_versionname from data ;   select * from (select imei, c

2012-10-29 11:16:33 884

原创 从n中选k的组合数

public class ZuHe {  public static void main(String args[]){      System.out.print(comm(5,2));   }  static int comm(int n,int k){    if (n==k||k==0)   return 1;  else return

2012-10-28 21:48:54 1629

原创 java 线程池应用小例子

import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import java.io.OutputStream;

2012-10-26 17:37:42 1008

原创 StringBuffer和String使用注意 String.replace方法的使用

public class Test { public static void stringReplace(String input) {  input = input.replace('j', 'c'); } public static void stringBufferReplace(StringBuffer input) {  input = input.append("c

2012-10-24 11:57:43 7183

原创 jboss 查看浏览器访问server的那个目录

2012-10-23 18:26:25 1409

原创 jboss 配置注意

Server name要是default

2012-10-23 15:22:08 584

原创 笔试题 面试题

序列16 14 10 8 7 9 3 2 4 1的说法下面哪一个正确(A)A、大顶堆   B、小顶堆  C、不是堆   D、二叉排序树   二叉树是一种树形结构,每个节点至多有两颗子树,下列一定是二叉树的是(AC)A、红黑树     B、B树      C、AVL树      D、B+树   输入若已经是排好序的,下列排序算法最快的是(A)A、插入排

2012-10-22 18:40:33 814

转载 链表的相交与环存在问题

如果两个链表相交于某一节点,那么在这个相交节点之后的所有节点都是两个链表所共有的。也就是说,如果两个链表相交,那么最后一个节点肯定是共有的。先遍历第一个链表,记住最后一个节点,然后遍历第二个链表,到最后一个节点时和第一个链表的最后一个节点做比较,如果相同,则相交,否则不相交。时间复杂度为O( len1 + len2),因为只需要一个额外指针保存最后一个节点地址,空间复杂度为O(1)

2012-10-22 15:44:39 508

原创 设有两个有序(升序)序列存储在同一数组中相邻的位置上,不妨设为A[l..m],A[m+1..h],将它们归并为一个有序数列,并存储在A[l..h]。

//设有两个有序(升序)序列存储在同一数组中相邻的位置上,不妨设为A[l..m],A[m+1..h],将它们归并为一个有序数列,并存储在A[l..h]。 public class BingGui { public static void main(String args[]) {  int[] A = { 1, 3, 5, 7, 9, 11 };  int[] B = { 2,

2012-10-22 15:18:40 1971

原创 小白鼠喝药检测题

2012-10-22 14:14:58 945

原创 串T中是否含有串P

//串T中是否含有串Ppublic class Pattern { public static void main(String args[]){      char [] T={'D','T','U','O','P'};  char [] P={'U','O'};  int k=0,j=0;  while(k   if(T[k]==P[j])   {k++

2012-10-22 10:39:55 863

转载 笔试题 面试题

如果需要对磁盘上的1000W条记录构建索引,你认为下面哪种数据结构来存储索引最合适?()A、Hash Table                      B、AVL-Tree                      C、B-Tree                 D、List   数据库里建索引常用的数据结构是()A、链表

2012-10-20 21:25:41 1956

转载 输出全排列问题

public class QuanPaiLie { static void permute(String s) { permute("",s); } public static void main(String args[]) { permute("","abcd"); } stat

2012-10-19 15:51:18 920

转载 设rand(s,t)返回[s,t]之间的随机小数,利用该函数在一个半径为R的圆内找随机n个点,并给出时间复杂度分析。

设rand(s,t)返回[s,t]之间的随机小数,利用该函数在一个半径为R的圆内找随机n个点,并给出时间复杂度分析。思路:这个使用数学中的极坐标来解决,先调用[s1,t1]随机产生一个数r,归一化后乘以半径,得到R*(r-s1)/(t1-s1),然后在调用[s2,t2]随机产生一个数a,归一化后得到角度:360*(a-s2)/(t2-s2)

2012-10-19 14:39:15 3556 1

转载 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?用位图/Bitmap的方法,申请512M的内存,一个bit位代表一个unsigned int值。读入40亿个数,设置相应的bit位,读入要查询的数,查看相应bit位是否为1,为1表示存在,为0表示不存在。

2012-10-19 11:32:37 3868 3

原创 A="ABCDF",在A中查找子串B=“CD”

public class ZiChuan { public static void main(String arg[]){      char[] srcstr={'A','B','C','D','F'};  char[] substr={'C','D'};    int temp = 0;  for(int i=0;i  {   for(int j=0;j

2012-10-19 10:44:59 1434

转载 寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。

寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。    假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门),请你统计最热门的10个查询串,要求使用的内存不能超过1G。    虽然有一千万个Query,但是由于重复

2012-10-18 21:51:54 3359

原创 java 传送文件

tomcat注意要把这个配置 client端核心代码: public static boolean post2(String url) {  File file = new File("D:/psu.jpg");  InputStream in = null;  String responseContent = null;  try {   in = new

2012-10-10 15:23:44 843

原创 eclipse svn 插件

http://www.polarion.org/projects/subversive/download/1.1/update-site

2012-10-08 14:52:59 638

stanford-corenlp-4.5.6.zip

https://nlp.stanford.edu/software/stanford-corenlp-4.5.6.zip

2024-03-12

huggingface的bert-base-chinese

https://huggingface.co/google-bert/bert-base-chinese pytorch和tensorflow都有

2024-03-05

huggingface的bert-base-uncased

https://huggingface.co/google-bert/bert-base-uncased pytorch和tensorflow都有

2024-03-03

TREC-6 文本分类数据集

https://www.tensorflow.org/datasets/catalog/trec

2024-02-22

chatglm3-6b的模型参数文件0/7

这个是除了7个大文件之外的所有小文件

2023-11-30

chatglm3-6b的模型参数文件6/7

chatglm3-6b的模型参数文件6/7

2023-11-29

chatglm3-6b的模型参数文件5/7

chatglm3-6b的模型参数文件5/7

2023-11-29

chatglm3-6b的模型参数文件4/7

chatglm3-6b的模型参数文件4/7

2023-11-29

chatglm3-6b的模型参数文件7/7

chatglm3-6b的模型参数文件7/7

2023-11-28

chatglm3-6b的模型参数文件3/7

chatglm3-6b的模型参数文件3/7

2023-11-28

chatglm3-6b的模型参数文件2/7

chatglm3-6b的模型参数文件2/7

2023-11-28

chatglm3-6b的模型参数文件1/7

chatglm3-6b的模型参数文件1/7

2023-11-28

Deep (Convolution) Networks from First Principles by马毅老师

Deep (Convolution) Networks from First Principles by马毅老师

2023-09-26

NLPIR新闻语料库(2400万字)

1.解压缩后数据量为48MB,大约2400万字的新闻; 2.采集的新闻时间跨度为2009年10月12日至2009年12月14日。 3.文件名为新闻的时间;每个文件包括多个新闻正文内容(已经去除了新闻的垃圾信息); 4.新闻本身内容的版权属于原作者或者新闻机构; 5.整理后的语料库版权属于www.NLPIR.org; 6.可供新闻分析、自然语言处理、搜索等应用提供测试数据场景; 如需更大规模的语料库,可以联系NLPIR.org管理员。

2023-08-30

CLUE AFQMC 语义相似度 数据集

蚂蚁金融语义相似度 Ant Financial Question Matching Corpus 数据量:训练集(34334)验证集(4316)测试集(3861)

2023-07-24

CLUE TNEWS 文本分类数据集

今日头条中文新闻(短文本)分类 Short Text Classificaiton for News 数据量:训练集(53,360),验证集(10,000),测试集(10,000)

2023-07-24

Linux-CentOS编译好的python3.8,解决了ssl相关问题

Linux-CentOS编译好的python3.8,解决了ssl相关问题

2023-02-17

MovieLens 20M Dataset

MovieLens 20M movie ratings. Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Includes tag genome data with 12 million relevance scores across 1,100 tags. Released 4/2015; updated 10/2016 to update links.csv and add tag genome data.

2022-05-31

MovieLens 25M Dataset

MovieLens 25M movie ratings. Stable benchmark dataset. 25 million ratings and one million tag applications applied to 62,000 movies by 162,000 users. Includes tag genome data with 15 million relevance scores across 1,129 tags. Released 12/2019

2022-05-17

tensorflow 1.14 Mac 系统本地跑需要的dylib

tensorflow 1.14 Mac 系统本地跑需要的dylib

2022-04-20

criteo dataset(CTR数据集)part3

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part2

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part1

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

avazu dataset(CTR数据集)

Predict whether a mobile ad will be clicked

2022-03-27

英文BERT论文预训练数据part2

英文BERT论文原汁预训练数据之一

2021-03-29

英文BERT论文预训练数据part1

英文BERT论文原汁预训练数据之一

2021-03-29

学数学 最好的方法是 做数学

Introduction.pdf

2021-03-16

onnxruntime-1.5.2.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.3.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.2.jar

onnx的java包,pom引入后可以试验java调用onnx文件进行cpu模型推理。 具体见https://github.com/microsoft/onnxruntime/blob/master/java/src/test/java/sample/ScoreMNIST.java 和 https://github.com/microsoft/onnxruntime/blob/master/docs/Java_API.md#getting-started

2020-12-03

train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz t10k-images-idx3-ubyte.gz t10k-labels-idx1-ubyte.gz

2020-12-03

How to write a good CVPR submission

MIT计算机大牛Bill Freeman教授于2014年写的报告,虽然比较久远,但非常有参考意义。How to write a good CVPR submission

2020-11-27

aclImdb_v1.tar.gz

https://huggingface.co/transformers/custom_datasets.html#seq-imdb 用到的数据

2020-11-19

tensorflow_gpu-1.15.3-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.2-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.4-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow-1.14.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

tensorflow-2.3.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

annotated_wikisql_and_PyTorch_bert_param.zip

自然语言转SQL的SOTA项目https://github.com/guotong1988/NL2SQL-RULE 的完整数据

2020-10-22

自动驾驶,如何得到方向盘转动的ground truth?

2024-03-18

AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?

2024-01-16

其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?

2024-01-16

技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?

2024-01-11

数学 是且仅是 一种语言和一种工具,不是科学的全部?

2023-12-14

哪些时候用CUDA编程更好?

2023-12-14

MetaLearning是LearnToLearn,那如何解决LearnToLearnToLearn?

2022-05-24

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”?

2022-05-09

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

2022-05-07

没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?

2022-04-28

2022年了,USB式GPU有哪些进展?

2022-04-28

2022年了,有哪些稳压deepfm的CTR模型?

2022-04-01

CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?

2022-03-24

算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?

2022-03-01

CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?

2022-02-25

有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?

2022-02-18

把user买过的item的名字embedding后作为特征,以及item本身的名字embedding作为特征,这两个特征加到CTR模型,会有效果吧?

2022-02-16

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?

2022-02-16

因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?

2022-02-08

XGB/GBDT/决策树,得出特征重要性的原理是什么?

2022-02-08

强化学习是不是无人驾驶的未来?

2022-02-01

GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?

2022-02-01

哪些互联网公司的管理职级和专业职级是分开的?

2022-01-22

CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?

2022-01-17

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?

2022-01-08

人工智能的因果学习(Causal Learning)到底想解决什么问题?

2021-12-17

BYOL里stop-gradient的作用是什么?

2021-12-01

马上2022年了,强化学习+NLP 有了哪些突破?

2021-11-26

马上2022年了,pointer-network现在看来的作用是什么?

2021-11-26

总被主管说文档写的不好怎么办?

2021-11-18

NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?

2021-11-08

为什么机器翻译文本生成,至今仍然在用transformer-auto-regressive的别扭架构?

2021-11-08

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是?

2021-11-08

学好数学对于编程的真实增益的性价比到底如何?

2021-11-03

学好数学对于编程的真实增益到底是多少?

2021-11-03

如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?

2021-10-26

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

2021-10-20

每个物理公式是否都是在【描述】一个事情?

2021-10-12

求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?

2021-09-14

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?

2021-08-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除