原因是这样的,近期因想在网上下载些文章来积累
百度一番,觉得Python爬虫备受热捧,遂开始亲自尝试了一番
看了几个教程,尝试起来,嗯。万万没想到
bs4是搞定了,
没想到在JAVA提示BeautifulSoup没找到,下了一个beautifulsoup4-4.3.2
又开始折腾,好像是可以了哦。
但是urllib2竟然TM没有,又百度,才发现urllib2改成了urllib.request
接着又下载了Pycharm,反反复复,最后又到了编码问题,气的我直跺脚。
各种狗血的想法都有
最后网上download些大神的源码吧。各种报错满天飞。
终于找到一个简单点的源码了吧。来看下:
#encoding:UTF-8 import urllib.request url = "http://www.baidu.com" data = urllib.request.urlopen(url).read() data = data.decode('UTF-8') print(data)
真的很庆幸,千辛万苦的看到了仅有的【
<link rel="dns-prefetch" href="//b1.bdstatic.com"/>
<title>百度一下,你就知道</title>
<style id="css_index" index="index" type="text/css">html,body{height:100%}
】
以位可以大展拳脚,好记性不如狂打码嘛,改下网址,呵还是想多了。
这电脑怎么了,我怎么了,这世界怎么了。
最后只能自检下
貌似没问题吧。
还有这是什么鬼编码。。
此时,我已经进入无知无我无物的境界。。。泪崩!~@#¥%…&*() &……&…%¥#%¥#@¥#@
其实也是想发泄下罢了,从来没试过这等屈辱,竟然让我在寒风中苦苦等待数小时,请把门打开!!
TO BE CONTINUE