目前python已成为主流编程语言之一,在我们这个年纪多学一点知识总是好的,感觉自己经常碌碌无为平庸而过,研究生生活虽然不精彩,但是自己不能放弃自己。以后我会每天自己学一些新的内容,然后发学习笔记作为勉励自己的见证,欢迎大家一起努力。
python之前学过一点基础,看的是《Python编程:从入门到实践》,百度云链接:https://pan.baidu.com/s/1CL7qy7fSmcjaUQfz3DhDjQ 提取码: nkkk
现在学习关于python的爬虫,学习书目为《python网络数据采集》,百度云链接:https://pan.baidu.com/s/1SMxVqjM7aU7BBmGIn3CYtQ 提取码: ekuj
1、网络连接
先来看下面代码1:
from urllib.request import urlopen
html = urlopen("http://pythonscraping.com/pages/page1.html")
print(html.read())
输出结果为:
b'<html>\n<head>\n<title>A Useful Page</title>\n</head>\n<body>\n<h1>An Interesting Title</h1>\n<div>\nLorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.\n</div>\n</body>\n</html>\n'