自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Wang laiqi's blog

悠长岁月平静，无事亦是蹉跎

10月 09月 08月 07月 06月

转载斯坦福大学命名实体识别

一、分词介绍 http://nlp.stanford.edu/software/segmenter.shtml 斯坦福大学的分词器，该系统需要JDK 1.8+，从上面链接中下载stanford-segmenter-2014-10-26，解压之后，如下图所示，进入data目录，其中有两个gz压缩文件，分别是ctb.gz和pku.gz，其中CTB：宾州大学的中国树库训练资料，PKU：中国北京大

2017-06-29 11:18:28 1557 5

原创命名实体识别方法

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-06-29 10:58:57 2084

原创 Imbalanced Data

1:什么是Imbalanced Data类不平衡（class-imbalance）是指在训练分类器中所使用的训练集的类别分布不均。比如说一个二分类问题，1000个训练样本，比较理想的情况是正类、负类样本的数量相差不多；而如果正类样本有995个、负类样本仅5个，就意味着存在类不平衡。 have a binary classification problem and one class i

2017-06-23 15:50:29 2171

原创 CrossValidation

1.1 概念交叉验证(Cross-validation)主要用于模型训练或建模应用中，如分类预测、PCR、PLS回归建模等。在给定的样本空间中，拿出大部分样本作为训练集来训练模型，剩余的小部分样本使用刚建立的模型进行预测，并求这小部分样本的预测误差或者预测精度，同时记录它们的加和平均值。这个过程迭代K次，即K折交叉。其中，把每个样本的预测误差平方加和，称为PRESS(predicted E

2017-06-23 14:42:58 339

原创 Scikit-Learn Knowledge

random_state与random seed的作用是相同的，可以用来确保每次划分训练集和测试集的时候都完全一样。通过设置好random_state当别人重新运行你的代码的时候能够得到完全一样的结果，复现和你一样的过程。如果你设置为None，则会随机选择一个种子。

2017-06-23 10:14:11 323

原创 One-Hot Encoding

独热编码即 One-Hot 编码，又称一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候，其中只有一位有效。

2017-06-21 11:46:08 405

B0016+周志华_如何做研究与写论文？.zip

研究不等于研发研究的目的是发现新知识、发明新技术研发：基于已有的知识和技术进行研制、开发科学研究扩展人类的知识

2020-10-16

Pytorch 中文官方教程

PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。它主要由 Facebookd的人工智能小组开发，不仅能够实现强大的GPU加速，同时还支持动态神经网络，这一点是现在很多主流框架如TensorFlow都不支持的。

2020-10-14

MachineLearning

介绍machineLearning在数据处理过程中的实际用法

2016-09-29

Statistic Concept Summary

介绍描述数据的统计概念

2016-09-29

模式识别和机器学习

模式识别和机器学习的中文版，里面详细介绍了，机器学习的一些算法

2016-04-16

googleMapreduce文章

google发表的mapreduce文章，主要用来介绍mapreduce的工作原理。

2016-04-16

java程序打包成jar文件和exe文件的详细步骤

java桌面应用程序如何打包成jar文件和可执行的exe文件的详细步骤和过程介绍，以及解决其中的问题方法。

2016-04-16

Android编程入门教程andbook中文版

Android编程入门教程andbook中文版,适合初学者进行学习，

2014-09-03

GoogleAndroidSDK开发范例大全

GoogleAndroidSDK开发范例大全，本书含有很多的实例供开发者进行练习。每个案例都讲解的很详细，适合android开发者使用。

2014-09-03

Android应用开发详解pdf和源代码

Android应用开发详解pdf和源代码,本书内容讲的很详细，而且实例很丰富，适合初学者和具有一定开发经验的android学习者进行学习。

2014-09-03

Android中listView的讲解

详细的android中listView控件的案例实现，有利于android学习者对listView控件的学习。

2014-08-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除