- 博客(12)
- 收藏
- 关注
原创 随机森林笔记
不是一个单独的学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,来过的比单个模型更好的回归或分类表现。多个模型集成成为的模型叫做集成评估器,其中的每个模型都叫做基评估器。有三类集成算法:装袋法(Bagging),提升法(Boosting),Stacking袋装法:构建多个相互独立的评估器,然后对其预测进行平均或多数表决原则来决定集成评估器的结果。装袋法的代表模型就是随机森林。提升法:基评估器是相关的,按顺序一一构建。
2023-09-23 18:29:13 77 1
原创 requests库实现爬虫
requests库是Python第三方库,处理URL资源特别方便,并且更加精简代码量(相较于urllib库)。
2023-07-17 16:09:03 132 1
原创 selenium页面爬取
selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器 在爬虫中的应用主要是用来解决JS渲染的问题。用于Web应用程序测试的工具,直接运行在浏览器中,像真正的用户一样操作,支持通过各种Driver驱动真实浏览器完成测试。像是一个网页测试。通过元素定位可以获得相应的元素,类似于选择处理。每次测试花费时间较长,不方便处理,js渲染等待时间长例子:搜索火影忍者点击下一页。
2023-07-15 21:37:05 188 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人