- 博客(9)
- 收藏
- 关注
原创 全网最新!最简单版本python爬取淘宝商品信息代码(需手动登陆)
本人最近写课程设计报告,主题是关于爬虫数据分析的,看了一圈网上关于爬虫爬取淘宝商品信息的代码,发现很多都已经过时了,无法适用于现在最近的淘宝网页,于是自己重写了一份代码分享给大家。
2024-07-28 16:52:45 464
原创 【python读取pdf】批量读取pdf中的文字内容并输出为txt文件
参考网上的代码改的,同样增加了批量读取的功能,直接读取目标文件夹内的pdf内容,输出txt的文件名和所读取的pdf名相同。导出的文本是没有分割的,需要后续自行做分词处理。
2024-03-13 20:49:11 622
原创 【已解决】TypeError: __init__() got an unexpected keyword argument ‘min_impurity_split‘
类型错误:__init__()获得了意外的关键字参数“min_impurity_split”随机森林是若干决策树组成的集成模型,训练速度较快,性能也较好。直接删除了 min_impurity_split。
2023-10-26 16:53:15 2089 2
原创 【已解决】NameError: name ‘tfidfvectorizer‘ is not defined
未定义名称“tfidf_vectorzer”tfidf_vectorzer有误。参考了网上的代码,相关文章。转换时间:4.50秒。返回去看有没有引用库。
2023-10-26 15:52:09 748
原创 【已解决】python报错The default value of regex will change from True to False in a future version.
geo_mappings['province'] = geo_mappings['province'].str.replace("市|省|自治区|壮族|维吾尔|回族", "",regex=True)geo_mappings['province'] = geo_mappings['province'].str.replace("市|省|自治区|壮族|维吾尔|回族", "")未来警告 :在未来版本中,正则表达式的默认值将从True更改为False。此外,当regex=True时,单字符正则表达式将。
2023-10-25 16:34:52 295
原创 【求助】kaggle上的score是什么?
最近在做关于kaggle团队的数据分析,发现score从零点几到三点几不等,请问这是单次比赛的还是参与比赛累加的?以及评分依据是什么?与team_rank的关系大吗?
2023-05-14 21:25:03 597
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人