爬虫
NewDay_
这个作者很懒,什么都没留下…
展开
-
python爬虫正则表达式flask
bs = BeatutifulSoup(解析内容, 解析格式)bs. 标签名 # 拿到标签bs.标签名.string # 只拿内容Tag :标签及其内容,拿到它所找到的第一个内容NavigableString : 标签里面的内容 , (字符串)Beautiful Soup: 整个文档Comment : 一个特殊的NavigableString,输出内容不包括注释正则表达式sqlite3的使用...原创 2022-04-21 09:44:32 · 199 阅读 · 0 评论 -
python-豆瓣top250综合项目
项目运行图片原创 2022-02-19 20:45:21 · 117 阅读 · 0 评论 -
豆瓣top250-词云案例
运行效果:项目结构import jiebafrom matplotlib import pyplot as pltfrom wordcloud import WordCloudfrom PIL import Imageimport numpy as npimport sqlite3def get_text(): """ 获取简介文本 :return:获取的字符串 """ con = sqlite3.connect("E:\PYcharm\原创 2022-02-19 19:34:05 · 464 阅读 · 0 评论 -
网页状态码大全
HTTP状态码对照表 HTTP response codes当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。HTTP状态码的英文为HTTP Status Code。 下面是常见的HTTP状态码:200 - 请求成功301 - 资源(网页等)被永久转移到其它URL404 - 请求的资源(网页等)不存在500 - 内部服务器错误更加完整状转载 2022-02-10 08:23:52 · 415 阅读 · 0 评论