- 博客(4)
- 收藏
- 关注
原创 【学习笔记】pyhton爬虫简单案例:利用requests破解百度翻译
【学习笔记】pyhton爬虫简单案例:利用requests破解百度翻译 需求:破解百度翻译的逻辑,实现任何单词的翻译。 step1:观察百度翻译网页 发现在输入单词进行翻译时,网页进行了局部更新。 因此,想要获得翻译结果,可以利用抓包工具,分析ajax数据包的请求类型与内容。 具体过程: 打开百度翻译页面 打开抓包工具(鼠标右键>检查) 点击network>XHR【XHR对应的是Ajax数据包】 在翻译框输入结果,观察抓包工具,新出现了很多数据包【图2】 点击查看各...
2020-12-30 19:31:12
191
原创 机器学习笔记 - 2 模型评估
机器学习笔记 - 2 模型评估 一、重难点概念 训练数据分层 将总数据集划分为: 训练集:用来训练模型,模型的迭代和优化 验证集:调整超参数,优化模型【用来调参】 测试集:不参与训练流程,监测模型效果 经验误差 VS 泛化误差 经验误差:在训练集上面的误差——对应训练集数据 泛化误差:在“未来”样本上的误差——对应测试集数据 问题:验证集是用来做什么的?——验证集用来调整超参数(模型本身是有参数的,但是训练过程中可能会训练不到,因此会产生超参数。模型的超参数就是用验证集来调整的。) ⭐混淆矩阵 在一个二分
2020-12-09 16:54:48
139
原创 机器学习笔记 - 1 什么是机器学习
机器学习笔记-1 什么是机器学习机器学习是什么?机器学习可以做什么?机器学习基本概念先修知识 机器学习是什么? 对于模型来说,基因决定上限,数据决定下限。 机器学习可以做什么? 图片识别 互联网推荐:根据关系网络和历史行为,通过用户数据 自动驾驶:5G解决数据延迟 修复古文献 帮川普赢得大选通过机器学习模型,预测用户的信息 机器学习基本概念 监督学习 VS 无监督学习 分类方法:结果是类别值,如情感的正负 回归方法:预测的标签是连续值,不是类别值,如年龄 聚类方法:… ———————————— 数据:训练数
2020-12-09 16:44:52
104
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人