自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(196)
  • 收藏
  • 关注

原创 批量修改文件后缀名

ren *.doc *.docx

2021-08-10 10:12:08 169

转载 python 多个工具包进行地点 人名等识别。

https://blog.csdn.net/ZJRN1027/article/details/103513861

2021-08-09 08:47:51 961

转载 bert 做句向量

https://github.com/terrifyzhao/bert-utils

2021-07-19 17:39:01 299

转载 关键词提取 新词发现

https://blog.csdn.net/hangzuxi8764/article/details/86901822

2021-07-18 20:54:12 210

转载 时间特征构造

https://blog.csdn.net/zhaodedong/article/details/103004322 时间特征构造

2021-07-08 15:47:39 121

转载 PySpark+深度语义模型DSSM+获取embedding

PySpark+深度语义模型DSSM+获取embeddinghttps://blog.csdn.net/qq632683582/article/details/116091510DeepFM原理以及DeepCTR代码实现https://blog.csdn.net/qq_38574975/article/details/108294570利用GBDT模型构造新特征https://blog.csdn.net/levy_cui/article/details/77165596...

2021-07-08 14:36:50 195

转载 kg-bert github地址,bert用于知识图谱

https://github.com/autoliuweijie/K-BERThttps://github.com/yao8839836/kg-bert/tree/master/data/umls

2021-07-06 15:45:24 642

转载 python 文本摘要 关键词

https://blog.csdn.net/mouday/article/details/89469583

2021-07-06 11:17:15 153

转载 pytorch 使用bert 做新闻分类

https://zhuanlan.zhihu.com/p/130913995

2021-07-05 16:46:29 385

转载 python item2vec做召回

https://blog.csdn.net/qq_26645205/article/details/81000873https://github.com/lujiaying/MovieTaster-Open/blob/master/utils/process.py github地址

2021-06-28 14:50:43 405

转载 新闻深度推荐

https://blog.csdn.net/weixin_35154281/article/details/112848121

2021-06-25 14:29:14 111

原创 L0,L1,L2 无穷范数

L0范数:向量中非零元素的个数L1范数:向量中各个元素绝对值的和L2范数:向量中元素平方的和,再开方;即向量的模长无穷范数:向量中各个元素绝对值的最大值

2021-06-22 08:48:56 2419

转载 python 装饰器

https://www.zhihu.com/question/26930016知乎解析了装饰器的作用。def 炼丹炉(func): def 变身(*args, **kwargs): print('有火眼金睛了') return func(*args, **kwargs) return 变身def 龙宫走一趟(func): def 你好(*args, **kwargs): print('有金箍棒了') return func(*ar..

2021-06-21 16:21:37 80

转载 fasttext python版

https://www.pythonf.cn/read/151112fasttext python实现

2021-06-21 14:41:59 160

转载 python知识图谱构建

https://www.jianshu.com/p/1c85939d3a73

2021-06-15 21:54:26 492

转载 为什么需要归一化特征

机器学习-数据归一化及哪些算法需要归一化一、数据为什么需要归一化处理?归一化的目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模、特征、分布差异对模型的影响。方法:1. 极差变换法2. 0均值标准化(Z-score方法)1. Max-Min(线性归一化)Max-Min归一化是对原始数据进行线性变化,利用取值的最大值和最小值将原始数据转换为某一范围的数据缺点:归一化过程与最大值和最小值有关,容易受到极端值的影响。会一定程度破坏原有数据的结构应

2021-05-31 15:01:18 2699

转载 2021-05-13

https://blog.csdn.net/weixin_42357472/article/details/107217446 深度学习 召回+推荐的文章和代码 ,数据在个人网盘https://zhuanlan.zhihu.com/p/80461294 deepfm的实现https://zhuanlan.zhihu.com/p/152251002dssm模型

2021-05-13 16:50:04 68

转载 2021-05-01

https://zhuanlan.zhihu.com/p/80461294deepFM keras实现

2021-05-01 23:05:13 80

转载 2021-04-30

https://blog.csdn.net/qq_14845119/article/details/80787753 损失函数大综合

2021-04-30 17:48:23 90 1

翻译 2021-04-16

hive order by sort by distribute by和sort by一起使用 cluster by1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会到同一个reducer进行处理(不管有多少map,也不管文件有多少的block只会启动一个reducer)。但是对于大量数据这将会消耗很长的时间去执行。 这里跟传统的sql...

2021-04-16 11:38:46 58

原创 2021-04-16

fasttext和word2vec的区别不同的是,CBOW的输入是目标单词的上下文,fastText的输入是多个单词及其n-gram特征,这些特征用来表示单个文档;CBOW的输入单词被onehot编码过,fastText的输入特征是被embedding过;CBOW的输出是目标词汇,fastText的输出是文档对应的类标。 值得注意的是,fastText在输入时,将单词的字符级别的n-gram向量作为额外的特征;在输出时,fastText采用了分层Softmax,大大降低了模型训练时间。这两个知识点在前文

2021-04-16 10:46:25 157

翻译 python多进程实践

https://www.cnblogs.com/jiangfan95/p/11439207.html

2021-02-24 14:30:59 107

原创 seq2seq和自动摘要textrank的学习

https://github.com/DengYangyong/textrank_summarization/tree/master/textrank_%E6%98%93%E4%BC%9A%E6%BB%A1https://github.com/keras-team/keras/blob/master/examples/lstm_seq2seq.pyhttps://blog.csdn.net...

2019-10-09 21:40:00 354

原创 ubuntu设置不休眠

这里需要一个组合刍,Ctrl – Alt – T 组合键用来打开终端;然后运行下面的命令打开 logind.conf 文件,你的所有修改都在这个文件内。sudo gedit /etc/systemd/logind.conf打开文件后修改下面这行:#HandleLidSwitch=suspend改成这样:HandleLidSwitch=ignore保存文件,重启 Login Manag...

2019-02-28 17:32:21 24060 6

原创 linux毫秒

https://blog.csdn.net/BeautifulGrils/article/details/79711966  linux下的毫秒。

2019-02-26 22:30:05 878

原创 C++的字符串操作

sub(start,length) 字符串截取,开始位置,截取长度   c++ 字符串替换void string_replace(std::string &strBig, const std::string &strsrc, const std::string &strdst){    std::string::size_type pos = 0;...

2019-02-26 08:41:03 310

转载 mtcnn原理

https://img-blog.csdn.net/20161016182651828

2019-01-17 08:39:51 925

转载 yolov3结构

https://blog.csdn.net/qq_33500066/article/details/81175033https://blog.csdn.net/u014380165/article/details/80202337https://blog.csdn.net/lk123400/article/details/54343550  rcnn和fasterrcnn和rcnn的区别...

2019-01-02 22:06:18 709

转载 vgg结构说明

https://www.sohu.com/a/241338315_787107  vgg结构说明

2018-12-23 09:31:06 1304

转载 opencv3

https://blog.csdn.net/robothj/article/details/79806641   opencv3 对point,rect,line,mat的操作

2018-12-22 16:50:49 158

原创 远程调试jar包过程

1. 服务器上面jar地址下:java -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=7899 -jar dpai-service-2.0.0-SNAPSHOT.jar远程跑jar包 ,修改端口7899,然后jar名字 dpai-service-2.0.0-.jar2.在run的菜单下面找到 debug...

2018-09-20 10:29:59 2178

转载 词向量化的经典说法

https://www.zhihu.com/question/44832436/answer/266068967  词向量化

2018-05-25 08:52:40 1365

转载 lstm的理解到位篇

https://yq.aliyun.com/articles/69845

2018-05-17 16:09:16 614

转载 LSTM结构连接解析

转自:https://blog.csdn.net/shenxiaoming77/article/details/79390595

2018-05-15 17:39:52 4341

转载 EM算法

https://blog.csdn.net/google19890102/article/details/46431715

2018-05-13 15:36:18 216

转载 机器学习的正则化

https://www.sogou.com/link?url=hedJjaC291OfPyaFZYFLI4KQWvqt63NBiffMb89EH4mYyyh7iY7qhg..https://www.sogou.com/link?url=DOb0bgH2eKh1ibpaMGjuy4Kngte0GPuAaqMQKCgxe6uueKW9M67CaVLpMY1k7wxT3FtmjwvPUqet5pUc3z

2018-01-19 15:32:12 280

转载 羊毛党 毕设相关

http://blog.csdn.net/zgjdzwhy/article/details/72978488  羊毛党

2018-01-05 11:10:35 577

转载 es官网api

https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/java-search.html    es官网

2017-12-05 08:40:38 2250

转载 es

https://my.oschina.net/chiyong/blog/552622  es批量写入 导出

2017-11-30 16:18:44 419

转载 模型融合

http://blog.csdn.net/ZengHaihong/article/details/53247100http://blog.csdn.net/q383700092/article/details/53557410http://www.jianshu.com/p/035a442fea1e

2017-11-25 15:23:39 405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除