![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
文章平均质量分 59
数据采集,如python爬虫、正则表达式方面的一些语法、方法等
不懂六月飞雪
这个作者很懒,什么都没留下…
展开
-
爬取百度百科周星驰页面电影名称并生成词云图
文章目录前言代码总结前言数据是很重要的,爬虫是获取数据的一个很有用的方式代码最近时间精力有限,代码注释部分见gitee链接:爬取百度百科周星驰页面电影名称并生成词云图总结如果您发现我写的有错误,欢迎在评论区批评指正!...原创 2021-09-07 21:58:33 · 432 阅读 · 0 评论 -
爬取许嵩歌曲名称并生成词云图
文章目录前言代码总结前言数据是非常有用的,爬虫是获取数据的一种方式代码最近时间精力有限,步骤过程放在如下的链接中:爬取许嵩歌曲名称并生成词云图总结(如果您发现我写的有错误,欢迎在评论区批评指正)...原创 2021-09-07 21:11:36 · 185 阅读 · 0 评论 -
爬虫获取车质网的投诉信息
文章目录前言过程程序分步(先爬取一页)程序一步到位(爬取10页)总结前言什么是AI?The theory and development of computer systems able to perform tasks normally requiring human intelligence.(–Oxford Dictionary)Using data to solve problems.(–cy)过程下图是车质网投诉页面:http://www.12365auto.com/zlts/0-0-原创 2021-02-25 00:54:01 · 1351 阅读 · 9 评论 -
正则表达式常用操作
文章目录正则表达式的概念与作用示例普通字符匹配点号中括号预定义的字符集数量词总结正则表达式的概念与作用概念:正则表达式是一种字符串匹配的模式作用:检查一个字符串是否含有某个子串;替换匹配的子串;提取某个字符串中的子串(爬虫中常用)示例#先导入模块import re普通字符匹配print(re.findall('abc','abc'))#有就返回print(re.findall('abc','adc'))#adc中没有abc所以就返回空print(re.findall('abc','da原创 2021-02-24 18:33:25 · 398 阅读 · 0 评论