自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 主题模型

进入本世纪以来,人类社会的科技发展进入了前所未有的告诉时期。快速更新换代的技术带动了相应专利文献的产生与积累,在这种大背景下,专利文本挖掘已经不再仅仅是一个相对孤立的辅助模块,二十一跃成为技术发展决策活动中必不可少的一环,在技术研发的起始与收尾过程中扮演着发掘重要知识、支持战略制定以及总结发展情况的重要角色。因此,如何准确高效进行海量专利文献的文本挖掘,同时识别并且i获取其中所隐藏的关键技术内容及...

2019-01-25 16:20:41 255 1

原创 基于主题模型的专利文本挖掘

54-60Watts 和Porter提出以追踪关键词变化的方式来探索技术主题的变化Yoon和Park实现了一种基于关键词形态学Morphology的方法来识别有潜力的技术细节张疑介绍了一种基于主成分分析的词凝结term Clumping方法来探索科技文献摘要中的关键词及关键短语Fattori等人以文本挖掘来辅助绘制专利路线图,并在实际的商务案例章以德温特专利数据对方法进行了实现Mager...

2019-01-25 12:05:22 1244

原创 2123

文本分词、停用词过滤和对意义宽泛的高频术语词剔除后,依据词性和TF-IDF算法对文本词汇进行过滤,提取对表征文本内容作用较大的名词动词和形容词,并将文本集词权重小于0.1的词进行剔除,实现对专利文本近一卒的特征词选择...

2019-01-24 21:23:23 448

原创 基于主题模型的专利文本主题挖掘与应用研究- 专利文本主题挖掘方法

基于分类需要认为提前设定好一定的分类标准,并需要规定好各个主题类别信息,它是一种有监督或者半监督的方法,对于一个新文本的归类过程也是对其文本主题信息解读的过程。基于聚类无监督通过对聚类各个类簇进行解读,从而发现文本的主题信息。三种流程基于分类号从分类角度识别专利技术主题信息专利文本通常都有IPC分类号,该分类号对解读文本技术主题信息具有重要作用。一个专利通常都有一个以上IP...

2019-01-24 20:02:46 1837

原创 CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System

2018-12-28 16:54:03 597

原创 front-end

html5多平台2010年开始标记语言canvas标签 绘画video audio 媒介回放IDEA

2018-12-14 22:07:57 308

原创 设计模式

https://www.bilibili.com/video/av24176315?from=search&seid=8341103636999878756不断重复 解决方案《设计模式-可复用面向对象软件基础》向下:深入理解三大面向对象机制封装,隐藏内部实现继承,复用现有代码多态,改写对象行为向上:冲击摧毁软件结构解决复杂性分解抽象...

2018-12-12 15:54:14 124

原创 Mesuring Crowd Truth for Medical Relation Extraction

creating a human annotated ground truthscalable and cost-effective approachdisagreement is not noise but signal

2018-12-10 15:05:50 136

原创 effective crowd annotation for 【relation extraction】

crowdsource众包identify instances of relationssupervised machine learningdistant supervisioncrowdsourced data is as good as or better than that annotated by expertsgated instruction GIBackground ...

2018-12-10 14:52:34 262 1

原创 剑指offer

2 基础知识面向对象的特性,构造函数,析构函数,动态绑定设计模式,UML图对内存的使用管理在C++中,有哪4个与类型转换相关的关键字这些关键字各有什么特点,应该在什么场合下使用sizeof调用构造函数和析构函数只需要知道函数的地址即可,而这些函数的地址只与类型相关,而与类型的实例无关,编译器也不会因为这两个函数而在实例内添加任何额外的信息。虚拟函数,虚函数表,指向虚函数表的指针。6...

2018-12-07 22:20:57 75

原创 How predictable is technological progress

4 Estimation procedures4.1 Statistical validationhindcasing4.2 Paramater estimation

2018-12-06 21:30:09 107

原创 python自然语言处理实战 核心技术与算法

涂铭3 中文分词技术3.2 规则分词3.2.1 正向最大匹配方法 maximum match method MM法3.2.2 逆向最大匹配方法 reverse maximum match method RMM法中文偏正结构很多3.2.1 双向最大匹配方法 bi-direction matching method3.3 统计分词建立语言模型对句子进行单词划分,然后对划分结果进行概率...

2018-12-03 14:33:11 4763

原创 数据结构

大O推导法如果一个算法的执行次数是 T(n),那么只保留最高次项,同时忽略最高项的系数后得到函数 f(n),此时算法的时间复杂度就是 O(f(n))。循环由内向外计算时间复杂度顺序执行的语句或者算法总的时间复杂度等于其中最大的时间复杂度条件判断语句总的时间复杂度等于其中时间复杂度最大的路径的时间复杂度hash table哈希函数需要易于计算并且能够均匀分布所有键Hash ...

2018-11-27 11:19:06 76

原创 Latent Semantic Analysis

IntroductionLSA overviewapplications of LSA

2018-11-22 18:31:51 317

原创 LDA数学八卦[DRAFT]

2 Gamma函数2.1 Gamma函数诞生G(x)=∫0infty3y2z(3+7x+51+y2) G(x) =\int_0^infty 3y^2z \left( 3+\frac{7x+5}{1+y^2} \right) G(x)=∫0i​nfty3y2z(3+1+y27x+5​)2.2 Gamma函数欣赏2.3 从二项分布到Gamma分布3 Beta/Dirichlet分布3.1...

2018-11-19 18:40:04 842

原创 Latent Dirichlet Allocation

abstractWe describe latent Dirichlet allocation (LDA), a generative probabilistic model for collections of discrete data such as text corpora.LDA is a three-level hierarchical Bayesian model, in whi...

2018-11-19 16:21:33 1428

原创 python3 cookbook笔记

译者的roadmap从2014年8月开始到16年初,刚好也是我开始看python的时间,不过当时只是想快点学会语法,却并没有想到要做翻译整理诸如此类伟大的事情。CH1: data structures and algorithms1.1 unpacking a sequence into separate variablesunpacking works with any object th...

2018-11-14 13:02:04 140

原创 markdown语法备忘!!!

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdo...

2018-11-12 16:29:36 151

原创 linux基础操作

linux文件和目录touchmkdirls -a 隐藏文件以.开头的文件是隐藏文件ls -l 列表方式显示ls -h 更加人性化需要配合 ‘-h’ 一起使用ls 通配符使用快速定位到需要的文件符号含义*任意字符?一个字符扩展rm删除后不能恢复扩展符号含义-r递归删除多级目录文件夹-f强制删除...

2018-11-12 15:15:51 78

基于WEKA的聚类分析算法

基于WEKA软件实现金融领域数据挖掘分析案例,分别使用随机森林,支持向量机等算法对大数据进行聚类分析,得出结论

2018-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除