自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee的博客

咨询交流请加群:955817470,GitHub:https://github.com/Asia-Lee

  • 博客(5)
  • 资源 (15)
  • 论坛 (1)
  • 收藏
  • 关注

原创 NLP句子相似性方法总结及实现

目录1、基于Word2Vec的余弦相似度2、TextRank算法中的句子相似性3、莱文斯坦距离(编辑距离)4、莱文斯坦比5、汉明距离6、Jaro距离(Jaro Distance)7、Jaro-Winkler距离(Jaro-WinklerDistance)8、基于Doc2Vec的句子相似度计算1、基于Word2Vec的余弦相似度首先对句子分词,使用Gensi...

2019-07-31 22:57:37 3150

原创 NLP关键词提取方法总结及实现

目录一、关键词提取概述二、TF-IDF关键词提取算法及实现三、TextRank关键词提取算法实现四、LDA主题模型关键词提取算法及实现五、Word2Vec词聚类的关键词提取算法及实现六、信息增益关键词提取算法及实现七、互信息关键词提取算法及实现八、卡方检验关键词提取算法及实现九、基于树模型的关键词提取算法及实现十、总结一、关键词提取概述关键词是能够表...

2019-07-23 21:09:41 19032

原创 TextRank算法介绍及实现

目录1、PageRank算法2、TextRank算法(1)关键词抽取(keyword extraction)(2)关键短语抽取(keyphrase extration)(3)关键句抽取(sentence extraction)3、TextRank算法实现(1)基于Textrank4zh的TextRank算法实现(2)基于jieba的TextRank算法实现(3)...

2019-07-22 21:57:51 6000

原创 NLP数据增强方法总结及实现

目录1、数据增强2、简单数据增强(Easy Data Augmentation,EDA)(1)EDA方法(2)EDA工具使用方法(3)EDA相关工具3、回译4、基于上下文的数据增强方法5、数据增强的作用1、数据增强数据增强是扩充数据样本规模的一种有效地方法,数据的规模越大、质量越高越好,模型才能够有着更好的泛化能力。2、简单数据增强(Easy Data ...

2019-07-16 21:19:00 5778 1

原创 XGBoost与LightGBM文本分类

目录用户评论情感极性判别一、数据准备二、数据预处理三、文本特征提取四、将数据转换为DMatrix类型五、构建XGBoost模型1、XGBoost模型主要参数(1)通用参数(2)Booster参数(3)学习目标参数2、XGBoost模型(1)基于XGBoost原生接口的分类(2)基于Scikit-learn接口的分类六、使用XGBoost做预测...

2019-07-06 13:00:56 3592 2

截止到2020全国飞机场名字和火车站名字汇总.7z

截止到2020全国飞机场名字和火车站名字汇总

2020-01-10

gdb调试技巧总结.7z

GDB是一个由GNU开源组织发布的、UNIX/LINUX操作系统下的、基于命令行的、功能强大的程序调试工具。可以用来调试C,C++程序。GDB调试技巧总结

2019-12-16

linux-cmd.zh.zip

linux基础命令;

2019-12-02

pyltp_wheel安装包.7z

哈工大自然语言处理ltp在windows10下的安装使用,两个文件针对不同的python版本下载一个即可pyltp-0.2.1-cp35-cp35m-win_amd64.whl和pyltp-0.2.1-cp36-cp36m-win_amd64.whl

2019-11-27

libtensorflow_so.7z

Linux环境下编译TensorFlow C++ API生成的动态链接库:libtensorflow_cc.so,libtensorflow_framework.so。

2019-09-24

Linux环境下编译的TensorFlow C++ API动态库文件

Linux环境下编译TensorFlow C++ API生成的 libtensorflow_cc.so 和 libtensorflow_framework.so 动态库文件

2019-09-19

社交网络影响力最大化数据集.zip

该数据集是社交网络影响力最大化数据集,使用该数据集能更好地做相关实验!

2019-07-25

IEEE Access 论文模板下载

IEEE Access 论文模板下载 IEEE Access 论文模板包括word模板和Latex模板下载

2019-01-09

UNSW_NB15入侵检测数据集

UNSW_NB15入侵检测数据集,相比于KDD99和NSL KDD数据集更适合相关研究人员用于入侵检测系统的研究

2018-11-20

CNNVD中国信息完全漏洞数据库(2002-2017年漏洞数据集)

1.CNNVD是中国国家信息安全漏洞数据库 2.软件漏洞数据包括2002年-2017年的漏洞数据 3.漏洞数据存储格式为xml,供软件安全研究人员使用

2018-10-12

漏洞数据库NVD(National Vulnerability Database)2000-2017年漏洞数据

1.NVD是美国国家通用漏洞数据库 2.漏洞数据包括2000年-2017年的漏洞数据(总共5万多条漏洞,23个漏洞类型) 3漏洞数据存储格式为xml,供软件安全研究人员使用。

2018-10-12

NASA MDP 软件缺陷预测数据集

1、NASA MDP 数据集是软件缺陷预测使用的数据集; 2、该数据集是向官方索取的,包含13个数据集文件,用于实验研究; 3、数据集文件格式是arff格式。

2018-08-30

NSL-KDD数据集

NSL-KDD数据集是KDD99数据集的改进,可以作为有效地基准数据集,各机器学习算法可以在NSL-KDD数据集上进行入侵检测实验。

2018-07-06

CNN卷积神经网络实现Mnist手写数字识别数据集

1、Mnist_cnn.py 该脚本文件 用TensorFlow框架 实现CNN卷积神经网络处理Mnist手写数字识别数据集,准确率达到99.21%; 2、Mnist_cnn_tensorboard.py 该脚本文件在Mnist_cnn.py的基础上实现可视化。

2018-05-26

Python 实现 Linear_Threshold 线性阈值模型算法

1、Python 实现社交网络影响力最大化 Linear_Threshold(线性阈值模型)算法。 2、对线性阈值模型算法进行优化改进,实现贪心算法。 3、代码中有详细注释说明,测试代码,测试节点数据集,并对数据集进行处理,输出测试结果。 4、代码实现环境:Python2.7, Anoconda2,Pycharm2017。

2018-05-21

Asia-Lee的留言板

发表于 2020-01-02 最后回复 2020-06-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除