自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (16)
  • 问答 (4)
  • 收藏
  • 关注

原创 IForest简介

异常值分析是检验数据是否有录入错误以及含有不合常理的数据的过程,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响,重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。之前介绍过利用高斯分布进行异常值检测,今天我们来学习另外一种非常有用的IForest算法。1. IForest思想简介       IFore

2018-01-29 20:06:22 5680

原创 Bagging与随机森林算法简介

在集成学习中,大致分为两大类:一种是Boosting系列的算法,另一种是Bagging系列的算法。对于Boosting算法而言,它的特点是各个弱学习器之间有依赖关系。对于bagging算法,它的特点是各个弱学习器之间没有依赖关系,可以并行学习。之前的提升(Boosting)方法简介已经详细介绍了Boosting算法原理,今天我们主要来谈谈Bagging算法的相关内容。1. Baggin

2018-01-29 19:58:02 1160

原创 GBDT算法简介及原理

GBDT算法简介及原理

2018-01-28 10:03:28 1632 2

原创 AdaBoost算法简介与原理

为了更好理解AdaBoost算法的核心思想,我们首先给出基于二分类的AdaBoost算法的基本步骤,然后再介绍其原理。最后给出AdaBoost的回归算法。1. AdaBoost算法步骤2. 对AdaBoost二分类算法的直观认识3. AdaBoost二分类算法原理

2018-01-28 10:00:29 1856

原创 提升(Boosting)方法简介

提升(boosting)方法是一种常用的机器学习方法,应用十分广泛。提升方法的基本思想是:对于一个复杂的学习任务,我们首先构造多个简单的学习模型,然后再把这些简单模型组合成一个高效的学习模型。实际上,就是“三个臭皮匠顶个诸葛亮”的道理。1. 基本概念1.1 “强可学习”和“弱可学习”       “强可学习”是指:在概率近似正确(probably approxi

2018-01-28 09:55:06 2713

原创 如何在Java项目中执行python代码

最近在做一个项目,需要在java里调用python代码,网上找了一些资料,想简单总结一下。可是我对java运行机制并不是很了解,所以只能说说怎么做。1. 安装Jython (什么是Jython)下载安装jython_installer-2.5.0.jar, 安装完毕后需要把其中的jython.jar复制到项目中的lib中(引入jar包);

2018-01-23 16:41:50 5717

原创 协同过滤算法的基本原理与实现

协同过滤算法的基本原理与实现

2018-01-09 16:38:33 15206 10

转载 windows下快速使用LightGBM安装教程

Windows下快速使用LightGBM安装教程(已编译)Windows下如何安装LightGBM(自编译)

2018-01-07 20:50:24 2659

原创 异常值检测

高斯分布与异常值检测

2018-01-04 18:42:57 4108

fastText增量训练版本代码

本版代码支持fastText进行增量训练,目前仅支持fasttext命令行格式。

2024-03-29

json转excel的demo示例

json转excel的demo示例,支持json多层级拉平变成Excel中的列名。 采用python中的json、pandas实现。 可在此基础上进一步开发。

2023-08-08

NLP各类任务pytorch代码

NLP各类任务pytorch代码

2022-01-18

time_series_covid19_deaths_global.csv

time_series_covid19_deaths_global.csv

2021-01-22

geoip2.database包 GeoLite2-City.mmdb

geoip2 可解析出ip的位置和所在城市等信息,GeoLite2-City.mmdb数据库,仅供学习使用。

2020-10-23

bilstm_crf_code.tar.gz

该代码完整实现了基于bilstm+crf的tensorflow实现,可训练、预测。 ├── Batch.py # 实现batch功能 ├── bilstm_crf.py # 模型定义 ├── data # 数据文件夹 │   ├── Bosondata.pkl # 训练数据的输入(加工后) │   ├── generate_dataset.py # 数据加工脚本,将原数据处理成模型需要的格式 │   └── wordtagsplit.txt # 原数据 ├── train.py # 训练相关的代码 └── utils.py # 功能函数

2020-07-24

采用fasttext对文本公告进行分类

该代码文件包括以下几个部分: (1)nlp_utils.py 数据功能处理函数 (2)fast_text_train.py 训练代码 (3)fast_text_predict.py 利用meta模型预测代码 (4)frozen_graph.py 模型固化及预测代码 (5)saves 训练得到的模型文件 (6)word2id_dict.txt、label2id_dict.txt 训练时得到的字典文件

2020-07-08

数据分析之统计分析操作.xlsx

excel分析方法:描述统计、Z检验、F检验、t检验、方差分析。https://blog.csdn.net/jingyi130705008/article/details/106599260

2020-06-12

数据分析之数据处理操作.xlsx

Excel 数据中的数据分析功能提供了常用的一些数据处理技巧:随机数发生器、抽样、排位与百分比排位、指数平滑、移动平均、直方图。

2020-06-07

additionalCode.tar.gz

博客代码 https://blog.csdn.net/jingyi130705008/article/details/103027824

2019-11-12

MySQL安装文件及安装教程

mysql版本:mysql-5.5.36-win32;有详细的安装说明及卸载说明。

2018-04-07

xgboost源代码

本人通过亲自实践,教大家一步步在win下安装xgboost(http://blog.csdn.net/jingyi130705008/article/details/71435562),这个是之前的xgboost的C++版本,是在python使用xgboost之前必须的包。

2017-05-08

python_dateutil-2.6.0-py2.py3-none-any.whl

dateutil模块

2017-04-23

pandas-0.16.0rc1.win32-py2.7.exe

下载pandas-0.16.0rc1.win32-py2.7.exe,双击运行即可安装

2017-04-23

asp.net考试系统可参考源码含数据库

asp.net考试系统可参考源码含数据库

2015-12-28

C语言实现五子棋

用C写一个简单的五子棋游戏,还有人机对战呢!

2015-06-20

表达式后置代码实现

数据结构关于栈的应用:对于复杂的表达式后置C语言的实现,

2015-06-20

births_transformed.csv.gz

博客https://blog.csdn.net/jingyi130705008/article/details/102941161 所需数据集

2004-04-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除