自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 [爬虫]爬取豆瓣任意电影的

最近好像上映了不少电影,而且我好久没看过豆瓣了,这里给大家分享一个爬取豆瓣评论的selenium脚本。3、用xpath语句定位想要爬取的数据,这里就爬了评论数据来做lda等后续的数据分析。这里大家注意,虽然全部写着有10万多条,其实豆瓣电影里只显示前600条。2、用edge浏览器打开相关电影评论网页。1、先将selenium的相关包导进来。

2024-04-20 17:08:26 131

原创 搜索引擎搭建

简易的搜索引擎搭建

2024-03-20 12:24:57 574

原创 基于机器学习的刑事案件分类技术

分享一下大二做的项目,用了NB、KNN、SVM、Xgboost、Sequential神经网络五种方法进行文本分类。其中xgboost效果最好,其他模型都有点过拟合。

2024-03-20 11:28:34 423

原创 用scrapy框架做京东评论爬取

用scrapy框架搭建的京东商品评论爬虫

2024-03-19 12:59:12 556

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除