- 博客(14)
- 收藏
- 关注
原创 【机器学习入门练习日记1】安装jupyter notebook与初级使用
本文主要针对Windows系统,Windows系统需要手动下载numpy+MKL的安装文件和Scipy的安装文件。下载地址在这个网址找到自己系统的Python版本相对应的numpy+MKL的安装文件和Scipy的安装文件。下载之后,以管理员身份运行Windows系统自带的命令提示符-----》windows键+Rpip install 安装文件全名注:如果是Windows 10系统,必须用管理员身份运行命令提示符,否则安装过程中可能会出现拒绝访问。先安装numpy+MKL,再安装Scipy才能成功。
2024-04-23 15:30:10 334
原创 【爬虫入门练习日记10】利用xpath解析出所有城市名称
爬取要求:利用 xpath解析出热门城市与全部城市。一起封装到一个列表当中或者是一个txt文件当中。
2024-02-03 11:27:22 813 1
原创 【爬虫入门练习日记9】xpath应用---解析下载图片数据
4K风景壁纸_高清4K风景图片大全_彼岸图网 (netbian.com)爬取要求:获取网页图片,并对图片进行命名,储存在文件夹当中。
2024-02-02 18:36:21 616
原创 【爬虫入门练习日记8】爬取贝壳二手房的房源信息
1、直接将响应数据编码设置成‘utf-8’.2.找到发生乱码所对应的数据,对这个数据进行单独的操作。
2024-02-01 21:33:20 1417 1
原创 【爬虫入门练习日记7】xpath解析
根据不同形式的xpath表达式去定位到不同的标签,并且还可以将定位到标签当中的相关文本数据捕获。2.调用etree对象中的xpath方法结合xpath表达式实现标签的定位和内容捕获。1.实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象当中。xpath解析是最常用且最便捷高效的一种解析方式,而且通用性也较高。1.将本地的html文档中的源码数据加载到etree对象中。2.可以将从互联网上获取的源码数据加载到该对象当中。xpath('xpath表达式')只根据标签的层级关系进行定位。
2024-01-31 11:30:00 589
原创 【爬虫练习错误1 】:在爬取的时候获取源代码是正常的(源代码正常,但是里面的汉字是乱码),但是在获取具体的文本内容出现乱码的现象——解决方法
爬取诗词名句网上三国演义的章节名称,并获取每章的详细内容。
2024-01-27 12:31:37 614
原创 【爬虫入门练习日记1】爬取搜狗指定词条的搜索结果页面
爬取要求:实现浏览器的基本功能,输入关键字就可以返回指定词条对应的搜索结果,也就是说制作一个简易的网页采集器。
2024-01-24 19:37:35 1352
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人