自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (16)
  • 问答 (4)
  • 收藏
  • 关注

转载 python并发编程之多线程

python并发编程之多线程

2019-08-09 16:32:46 140

原创 python函数的可变参数*args和关键字参数**kw

1. 定义解释 在函数定义def func(*args, **kw) 时, 参数args前有‘*’符号,表示该参数是可变参数,即参数的数量可以为任意个; 参数kw 前有‘**’符号,表示该参数是关键字参数,即参数带有key,且数量可以为任意个; 在函数调用 func(*args, **kw) 时, 参数args前有‘*’符号,表示会把args展开,把其中的每个...

2019-08-05 15:59:04 899

原创 短文本聚类

1. 数据预处理 1.1 下载搜狗实验室提供的新闻预料(提取码krbd) 1.2 xml文本解析 extract_text.py : 读取SogouCS_reduced文件夹下的文件,进行xml解析,得到每个新闻的content,并将其放在对应的分类文件夹下; split_text.py : 读取分类好的新闻预料(SogouCS_reduced_after文件夹下),采用jieba库进行分...

2019-08-01 17:58:55 875

原创 基于短文本的推荐

很多时候系统只会推送那些大V发布的微博,而对于新人发布的优质内容就会忽略。那么如何避免这一问题呢?首先要做的就是发现优质内容的微博。 1. Baseline 1.1 用户特征 (1)基本属性 一般指用户侧的基本属性,如年龄、性别等。由于数据中无相关信息,于是无需进行分析。 (2)用户-博文交叉特征(统计特征) 1)过去一个月: -发布博文总数 -最大评论数、点赞数、转发数 ...

2019-08-01 17:58:21 243

fastText增量训练版本代码

本版代码支持fastText进行增量训练,目前仅支持fasttext命令行格式。

2024-03-29

json转excel的demo示例

json转excel的demo示例,支持json多层级拉平变成Excel中的列名。 采用python中的json、pandas实现。 可在此基础上进一步开发。

2023-08-08

NLP各类任务pytorch代码

NLP各类任务pytorch代码

2022-01-18

time_series_covid19_deaths_global.csv

time_series_covid19_deaths_global.csv

2021-01-22

geoip2.database包 GeoLite2-City.mmdb

geoip2 可解析出ip的位置和所在城市等信息,GeoLite2-City.mmdb数据库,仅供学习使用。

2020-10-23

bilstm_crf_code.tar.gz

该代码完整实现了基于bilstm+crf的tensorflow实现,可训练、预测。 ├── Batch.py # 实现batch功能 ├── bilstm_crf.py # 模型定义 ├── data # 数据文件夹 │   ├── Bosondata.pkl # 训练数据的输入(加工后) │   ├── generate_dataset.py # 数据加工脚本,将原数据处理成模型需要的格式 │   └── wordtagsplit.txt # 原数据 ├── train.py # 训练相关的代码 └── utils.py # 功能函数

2020-07-24

采用fasttext对文本公告进行分类

该代码文件包括以下几个部分: (1)nlp_utils.py 数据功能处理函数 (2)fast_text_train.py 训练代码 (3)fast_text_predict.py 利用meta模型预测代码 (4)frozen_graph.py 模型固化及预测代码 (5)saves 训练得到的模型文件 (6)word2id_dict.txt、label2id_dict.txt 训练时得到的字典文件

2020-07-08

数据分析之统计分析操作.xlsx

excel分析方法:描述统计、Z检验、F检验、t检验、方差分析。https://blog.csdn.net/jingyi130705008/article/details/106599260

2020-06-12

数据分析之数据处理操作.xlsx

Excel 数据中的数据分析功能提供了常用的一些数据处理技巧:随机数发生器、抽样、排位与百分比排位、指数平滑、移动平均、直方图。

2020-06-07

additionalCode.tar.gz

博客代码 https://blog.csdn.net/jingyi130705008/article/details/103027824

2019-11-12

MySQL安装文件及安装教程

mysql版本:mysql-5.5.36-win32;有详细的安装说明及卸载说明。

2018-04-07

xgboost源代码

本人通过亲自实践,教大家一步步在win下安装xgboost(http://blog.csdn.net/jingyi130705008/article/details/71435562),这个是之前的xgboost的C++版本,是在python使用xgboost之前必须的包。

2017-05-08

python_dateutil-2.6.0-py2.py3-none-any.whl

dateutil模块

2017-04-23

pandas-0.16.0rc1.win32-py2.7.exe

下载pandas-0.16.0rc1.win32-py2.7.exe,双击运行即可安装

2017-04-23

asp.net考试系统可参考源码含数据库

asp.net考试系统可参考源码含数据库

2015-12-28

C语言实现五子棋

用C写一个简单的五子棋游戏,还有人机对战呢!

2015-06-20

表达式后置代码实现

数据结构关于栈的应用:对于复杂的表达式后置C语言的实现,

2015-06-20

births_transformed.csv.gz

博客https://blog.csdn.net/jingyi130705008/article/details/102941161 所需数据集

2004-04-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除