2019.3.23 Python学习总结

一、关于库的导入以及读取
1.urlllib.request.urlopen中urllib是一个库,request是其中的一个模块,urlopen是其中的一个方法,需要一层层导入才能使用。具体方法(利用urllib爬取百度首页):

import urllib
from urllib.request import urlopen
a=urllib.request.urlopen(“http://www.baidu.com”).read()
print(a)

因为已经导入过request模块,下次使用时可直接使用urlopen(len()表示输出长度):

b=urlopen(“https://www.hao123.com/”).read()
print(len(b))

2.可直接使用from urllib import request导入request模块,然后再对request中的urlopen方法进行调用,即使用request.urlopen(“http://www.baidu.com”).read().该方法比1更简单明了
3.还可使用from urllib.request import urlopen直接一步导入,该方法优于1.2
二、文件的创建、写入和读取
1.open(“F:/file1.txt”,“w”) #在F盘下创建文件,如果文件存在则打开文件。“w”"r"分别代表写入或读取文件。
2.创建文件后使用read()语句对文件进行读取。write()语句可在文件中添加具体的内容。对文件进行操作后要使用close()语句进行关闭。
3.使用readline()语句读取文件的一行
4.readlines()每次按行读取整个文件内容,将读取到的内容放到一个列表中

fh=open(“F:/file2.txt”,“w”)
fh1=open(“F:/file3.txt”,“w”)
content1=“我是文件的内容”
fh.write(“hello world”)
11

fh.close()
fh1=open(“F:/file3.txt”,“w”)
fh1.write(content1)
7

fh1.close()
c=open(“F:/file3.txt”,“r”)
c.read()
d=a.readline()
b=a.readlines()

三、异常处理
使用try…except语句,需要执行的语句放在try中,异常语句放入except中进行处理。结果会输出异常并指出异常在哪里。ex是给异常取个名字,随意命名。例:
try:
print(“hello”)
pritless(“hi”)
except Exception as ex:
print(ex)
print(“see you”)
运行结果:
hello
name ‘pritless’ is not defined
see you
四、如何将爬取到的网页内容显示到文件中

from urllib.request import urlopen
html=urlopen(“https://i.csdn.net/#/uc/profile”).read()
a=open(“F:/file.txt”,“wb”) #"b"代表以二进制读取
a.write(html)
a.close()

最后可通过修改文件后缀名为html即可访问网页

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值