- 博客(4)
- 资源 (16)
- 问答 (4)
- 收藏
- 关注
原创 python函数的可变参数*args和关键字参数**kw
1. 定义解释 在函数定义def func(*args, **kw) 时, 参数args前有‘*’符号,表示该参数是可变参数,即参数的数量可以为任意个; 参数kw 前有‘**’符号,表示该参数是关键字参数,即参数带有key,且数量可以为任意个; 在函数调用 func(*args, **kw) 时, 参数args前有‘*’符号,表示会把args展开,把其中的每个...
2019-08-05 15:59:04 899
原创 短文本聚类
1. 数据预处理 1.1 下载搜狗实验室提供的新闻预料(提取码krbd) 1.2 xml文本解析 extract_text.py : 读取SogouCS_reduced文件夹下的文件,进行xml解析,得到每个新闻的content,并将其放在对应的分类文件夹下; split_text.py : 读取分类好的新闻预料(SogouCS_reduced_after文件夹下),采用jieba库进行分...
2019-08-01 17:58:55 875
原创 基于短文本的推荐
很多时候系统只会推送那些大V发布的微博,而对于新人发布的优质内容就会忽略。那么如何避免这一问题呢?首先要做的就是发现优质内容的微博。 1. Baseline 1.1 用户特征 (1)基本属性 一般指用户侧的基本属性,如年龄、性别等。由于数据中无相关信息,于是无需进行分析。 (2)用户-博文交叉特征(统计特征) 1)过去一个月: -发布博文总数 -最大评论数、点赞数、转发数 ...
2019-08-01 17:58:21 243
json转excel的demo示例
2023-08-08
geoip2.database包 GeoLite2-City.mmdb
2020-10-23
bilstm_crf_code.tar.gz
2020-07-24
采用fasttext对文本公告进行分类
2020-07-08
数据分析之统计分析操作.xlsx
2020-06-12
additionalCode.tar.gz
2019-11-12
xgboost源代码
2017-05-08
births_transformed.csv.gz
2004-04-03
将dataframe中的两列数据转换成字典dic,结果竟然成这样?
2019-09-10
asp.net写得网页第一次打开为何会跳动一下
2015-11-24
Asp.net中GridView中button的用法
2015-10-15
用命令行调用编译程序前必须要调用call prefix\vcvars32.bat吗?
2015-07-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人