自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 【综合评价方法 熵权法】指标权重确定方法之熵权法

参考链接:http://blog.sina.com.cn/s/blog_710e9b550101aqnv.html实战例子: 某医院为了提高自身的护理水平,对拥有的11个科室进行了考核,考核标准包括9项整体护理,并对护理水平较好的科室进行奖励。下表是对各个科室指标考核后的评分结果。数据源科室 X1 X2 X3 X4 X5 X6 X7 X8 X9A 100...

2018-07-26 15:50:00 38144 2

原创 【综合评价方法 独立性权系数法】指标权重确定方法之独立性权系数法

参考链接:http://blog.sina.com.cn/s/blog_710e9b550101ansp.html三、综合评价模型建立步骤 1、综合评价模式是一种对一个或多个系统进行评价的模型。一般分为如下几个步骤: 2、选取评价指标,指标的选取应该具有独立性和全面性。 3、得到m×n测量矩阵,每一行表示一个带评价系统(共m行),没一列表示一个评价指标(共n列)。 4、对测量矩阵每个指...

2018-07-26 14:13:04 13909 1

原创 【综合评价方法 变异系数权重法】指标权重确定方法之变异系数权重法

变异系数法是直接利用各项指标所包含的信息,通过计算得到指标的权重。是一种客观赋权的方法。此方法的基本做法是:在评价指标体系中,指标取值差异越大的指标,也就是越难以实现的指标,这样的指标更难反映被评价单位的差距。 由于评价指标体系中的各项指标的量纲不同,不宜直接比较其差别程度。为了消除各项评价指标的量纲不同的影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。各项指标的变异系数公式如下:...

2018-07-23 17:23:27 52236 3

原创 【python 操作redis】python 连接redis

# encoding: utf-8import timetime1=time.time()import redispool = redis.ConnectionPool(host='localhost', port=6379, decode_responses=True)r = redis.Redis(connection_pool=pool)#######插入数据r.s...

2018-07-19 15:17:30 550

原创 【文本处理 词频统计】python 实现词频统计

自定义词频统计函数:wordcount# -*- encoding=utf-8 -*-import stringimport pandas as pdword_list=[]freq_list=[]def wordcount(path): with open(path,'r',encoding='utf-8') as text: words = [raw_...

2018-07-13 11:07:12 4304

原创 【搜索技术 倒排索引】倒排索引例子介绍

为什么搜索引擎的查询速度这么快? 说明白了很简单,核心技术就是 “倒排索引”。“倒排索引”这个名词很唬人,其实原理很简单。假设有3篇文章,file1,file2,file3,文件内容如下: file1 (单词1,单词2,单词3,单词4….)file2 (单词a,单词b,单词c,单词d….)file3 (单词1,单词a,单词3,单词d….)建立的倒排索引就是这个样子:单词...

2018-07-10 21:30:12 1480

原创 【搜索技术 倒排索引】搜索引擎概述之倒排索

说到提高检索效率,就必然提到索引。今天就来为大家讲述搜索引擎中最常见的索引方式——倒排索引。索引之所以快的原因,是因为有序(从计算机的角度讲,有序就可以使用二分查找,这是十分高效的)。词汇文档矩阵 我们发现我们最终要做的其实是对词做索引。那么我们要怎么做呢?首先我们可以做一个“词汇-文档矩阵”,横坐标为文档id,纵坐标为具体词汇。我们可以让纵坐标的词汇有序排列(比如按照字母/拼音...

2018-07-10 21:04:02 555

原创 【自然语言处理 AC自动机】标签匹配算法

Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法。 要学会AC自动机,我们必须知道什么是Trie,也就是字典树。Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章...

2018-07-05 17:49:05 2489

gbdt和xgboost算法详解

该文档详细介绍了机器学习算法中的GBDT和XGboost 两大神器

2018-01-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除