Web
zyc53
随遇随记。
展开
-
Lxml
lxml:1.加载路径中的数据默认会被当作XML处理操作:etree.parse()加载HTML:etree.parse(‘url’,parser=HTMLPaeser)2.一种直接加串加载html:tree.HTML加载xmletree.XML...原创 2019-12-31 14:53:52 · 180 阅读 · 0 评论 -
自己写一个文件,用xpth查出来
1.自己写文件,在HelloRequestMysel.py中:from lxml import etreecontent = '<html><body><div><span>周二,天气晴,心情值,美美哒。</span></div></body></html>'etr = etree.HTML(c...原创 2019-12-31 12:38:24 · 186 阅读 · 0 评论 -
请求手机版内容-数据采集
1.HelloRequesPhone.py:import requestsurl = "https://www.xinpianchang.com/channel/index/sort-like?from=tabArticle"headers = { 'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleW...原创 2019-12-31 12:27:16 · 314 阅读 · 1 评论 -
请求网页内容-采集
1.HelloRequest.py:import requestsurl = "https://www.xinpianchang.com/channel/index/sort-like?from=tabArticle"response = requests.get(url)print(response.text)with open('1.html','w') as f: f.w...原创 2019-12-31 12:23:06 · 153 阅读 · 0 评论 -
同样网址,为什么网页版和手机版页面显示不一样?useragent不同
请求中氛围页面和手机版请求useragent不同网页版手机版原创 2019-12-31 11:21:17 · 1044 阅读 · 0 评论 -
html和xml的区别
HTML和XML的区别是:语法要求不同,标记不同,作用不同。具体区别为:1、语法要求不同:在html中不区分大小写,在xml中严格区分。在HTML中,有时不严格,如果上下文清楚地显示出段落或者列表键在何处结尾,那么你可以省略或者之类的结束标记。在XML中,是严格的树状结构,绝对不能省略掉结束标记。在XML中,拥有单个标记而没有匹配的结束标记的元素必须用一个/ 字符作为结尾。这...原创 2019-12-31 09:51:05 · 846 阅读 · 0 评论