- 博客(24)
- 资源 (25)
- 收藏
- 关注
原创 【使用注意】linkedHashSet使用后面插入值不会覆盖掉前面值
LinkedHashSet<Keyword> linkedHashSet = new LinkedHashSet<>(); Keyword keyword2 = new Keyword("han", null, 20, false, false); linkedHashSet.add(keyword2); Keyword keyword = new Key...
2019-03-21 11:25:06 1248 4
转载 【链接保存】十分钟上手sklearn:安装,获取数据,数据预处理
简书地址:https://www.jianshu.com/p/a9168803edc6博主地址:http://blackblog.tech/2018/02/05/%E5%8D%81%E5%88%86%E9%92%9F%E4%B8%8A%E6%89%8Bsklearn-1/
2019-03-20 19:33:35 166
转载 【链接保存】十分钟上手sklearn:特征提取,常用模型,交叉验证
原博客地址:http://blackblog.tech/2018/02/05/%E5%8D%81%E5%88%86%E9%92%9F%E4%B8%8A%E6%89%8Bsklearn-1/简书地址:https://www.jianshu.com/p/731610dca805
2019-03-20 19:31:38 195
转载 python dir()函数使用
您可以使用内置的dir()函数列出一个定义对象的标识符。例如,对于一个模块,包括在模块中定义的函数,类和变量。当你给dir()提供一个模块名字时,它返回在那个模块中定义的名字的列表。当没有为其提供参数时, 它返回当前模块中定义的名字的列表。dir() 函数举例:>>> import sys # 获得属性列表,在这里是sys模块的属性列表>>> dir(...
2019-03-19 17:20:26 3094 1
转载 常见分数值归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:一、min-max标准化(Min-Max Normalization)也称为离差标准...
2019-03-18 15:14:15 5814
原创 重写equals和hashcode达到HashSet对象集去重的实现
public class Contract { private String contractId; private String contractName; private Date begin; private Date end; @Override public boolean equals(Object o) { if...
2019-03-18 00:12:34 278
原创 【转】Python实现使用NLTK的快速自动关键字提取算法
Using pippip install rake-nltkDirectly from the repositorygit clone https://github.com/csurfer/rake-nltk.gitpython rake-nltk/setup.py installQuick startfrom rake_nltk import Rake# Uses...
2019-03-16 20:05:13 3324
原创 python利用jieba(textRank、TFIDF)提取关键字
from jieba import analyseprint("tfidf: ")tfidf = analyse.extract_tagstext = "线程是程序执行时的最小单位,它是进程的一个执行流,\是CPU调度和分派的基本单位,一个进程可以由很多个线程组成,\线程间共享进程的所有资源,每个线程有自己的堆栈和局部变量。\线程由CPU独立调度执行,在多CP...
2019-03-16 19:47:16 2960
原创 【kaggle入门题一】Titanic: Machine Learning from Disaster
原题:Start here if...You're new to data science and machine learning, or looking for a simple intro to the Kaggle prediction competitions.Competition DescriptionThe sinking of the RMS Titanic is...
2019-03-14 18:40:49 405
原创 python文件操作以及相对路径和绝对路径问题
绝对路径: PROJECT_ROOT = os.path.dirname(os.path.realpath(__file__))#获取项目根目录 path = os.path.join(PROJECT_ROOT,"data\\edge\\0_fuse.txt") #文件路径 edgeMap = np.loadtxt(path)相对路径:path = ...
2019-03-14 11:04:00 2687
原创 python机器学习常用包
总结了一些常用的工具:Numpy| 必用的科学计算基础包,底层由C实现,计算速度快。 Pandas| 提供了高性能、易用的数据结构及数据分析工具。 seaborn| 数据可视化 NLTK| 自然语言工具包,集成了很多自然语言相关的算法和资源。 Stanford CoreNLP| Stanford的自然语言工具包,可以通过NLTK调用。 Gensim| 主题模型工具...
2019-03-14 10:40:09 13319
原创 python机器学习常用包下载安装以及使用案例汇总
python安装教程(Windows系统,python3.7为例) https://blog.csdn.net/weixin_40844416/article/details/80889165 在pycharm中切换python版本的方法 https://blog.csdn.net/sgfmby1994/article/details/77876873 Window...
2019-03-14 10:28:10 2060
原创 python练习代码保存
#coding=utf-8print('中国人')"""Python 保留字:and, exec, not, assert, finally, or, break, for, pass, class, from, print, continue, global, raise, def, if, return, del, import, try, elif, in, while, else...
2019-03-13 20:25:28 1289
原创 python运算符重载
重载符模板代码:class Vector: def __init__(self, a, b): self.a = a self.b = b def __str__(self): return 'Vector (%d, %d)' % (self.a, self.b) def __add__(self, other):...
2019-03-13 20:23:23 115
原创 python对象使用
模板代码:class People: '所有员工的基类' #构造函数 def __init__(self, user_id, user_name): self.user_id = user_id self.user_name = user_name #析构函数 def __del__(self): c...
2019-03-13 19:25:56 126
原创 python正则表达式使用
模板代码:import re #python 自1.5版本增加了re模块,它提供了Perl风格的正则表达式模式print(re.match('www', 'www.baidu.com').span()) #在起初位置匹配line = "Cats are smarter than dogs"matchObj = re.match( r'(.*) are (.*?) .*', line, ...
2019-03-13 19:24:07 121
原创 python类似于java的重写toString方法
python类中的特殊方法: __str__(self)用来重写people类:class People: '所有员工的基类' #构造函数 def __init__(self, user_id, user_name): self.user_id = user_id self.user_name = user_name #...
2019-03-11 21:14:23 11492
原创 学习之道
对待人生的任何事情都要:抓大放小,要事为先对于一个以前从来没有接触过java的人,java无疑是庞大的,似乎每个领域都可以拓展开来都是一片开阔地,每一个领域要想深入接触到每一个细节所耗费的精力都是巨大的。这个时候大家都胸怀壮志,两眼发光的盯着每一个崭新的知识点,遇见了任何一个知识点都恨不得抠的清清楚楚,明明白白。难道这有什么不对吗?我的意见是,没什么大毛病,但是学习效率太低了!我们推荐的学...
2019-03-08 17:30:25 126
原创 聚类算法篇章总结
主要的距离计算方法包括:最短距离法(通过样本数值之间的距离计算,然后将距离值最小的样本进行合并的过程) 最长距离法 中间距离法 重心法(重心聚类法:将两个聚类中心点的距离定义为两个类的重心距离,而类的重心为属于该类的样本的平均值) 离差平方和法 类平均距离法(动态聚类法:利用类平均值法对数据进行聚类的方法属于动态聚类的方法,也称逐步聚类法)常见的聚类算法:K-Means算法:初...
2019-03-07 18:20:44 3636
原创 几种分类器小结
朴素贝叶斯分类器是假设数据样本特征完全独立,以贝叶斯定理为基础的简单概率分类器。 AdaBoost算法的自适应在于前一个分类器产生的错误分类样本会被用来训练下一个分类器,从而提升分类准确率,但是AdaBoost算法对于噪声样本和异常样本比较敏感。 支持向量机是用过构建一个或者多个高维的超平面来将样本数据进行划分,超平面即为样本之间的分类边界。 基于k近邻的K个样本作为分析从而简化计算提升效率...
2019-03-07 17:29:58 18898
原创 中文分词测试语句
研究生命科学 研究生命令本科生 我从马上下来 我马上下来 北京大学生喝进口红酒 在北京大学生活区喝进口红酒 从小学电脑 从小学毕业 美军中将竟公然说 新建地铁中将禁止商业摊点 这块地面积还真不小 地面积了厚厚的雪 让我们以爱心和平等来对待动物 阿美首脑会议将讨论巴以和平等问题 锌合金把手的相关求购信息 别把手伸进别人的口袋里 将信息技术应用于教学实践 信息技术应用...
2019-03-04 12:05:46 2553
原创 k-shingles和MinHash优秀文章保存
minhash原理解释:https://www.cnblogs.com/sddai/p/6110704.htmlk-shingles和minhash使用原理:https://blog.csdn.net/aspirinvagrant/article/details/41281101代码java实现:https://blog.csdn.net/remoa_dengqinyi/article/d...
2019-03-03 20:07:57 526
原创 基于维特比算法的概率路径
简介:维特比算法(Vieterbi algorithm)是一种动态规划算法,探索出很多预测天气的方法,这种基于经验的预测方式,是一种基于历史数据的概率模型。思想维特比算法的思想是假设某一个数据的当前状态是依赖于它的前一个状态,它们在多个状态之间可以相互影响,而维特比算法正是从这些转态中推断出最大可能概率的状态序列(也可作最短路径)。因此,维特比算法解决问题的理论可归纳为如下:在通过...
2019-03-03 17:52:44 628
文本乱码识别工具包下载
2020-12-03
全国省市直辖市文档
2018-10-18
java需要用到的redis包
2018-10-15
json所需要的包
2018-10-15
jetty9分拆的各个包下载
2018-10-15
java用到的所有常用jar包(mysql、json、ssm、websocket...)
2018-10-12
web中常用api
2018-02-19
线性表定义与实现
2018-02-19
欧拉函数公式以及证明
2018-02-19
图论的课件
2018-02-19
动态规划ppt详解
2018-02-19
网络流初步
2018-02-19
Polya定理以及知识点详解
2018-02-19
treap代码实现
2018-02-19
ACM培训演讲稿
2018-02-19
Polya定理Polya定理Polya定理
2017-11-09
动态规划动态规划概念 最长上升子序列 最长公共子序列 矩阵连乘问题 背包问题 树形DP 状态压缩DP
2017-11-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人