一、Python字符串练习
1.http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html
取得校园新闻的编号.
(这个方法就很多了,一般方法二和方法三用得比较多一点)
# 定义字符串
s = "http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html"
# 方法一 直接获取
print(s[-14:-5])
#方法二 利用rstrip
ss = s.rstrip(".html")[-9:]
print(ss)
#方法三 利用rstrip和split
sss = s.rstrip(".html").split("_")
print(sss[1])
2.https://docs.python.org/3/library/turtle.html
产生python文档的网址。
(这个数组可以通过加法进行结合)
# 数组一
add1 = "https://docs.python.org/3/library/turtle"
#数组二
add2 = ".html"
s = add1 + add2
print(s)
3.http://news.gzcc.cn/html/xiaoyuanxinwen/4.html
产生校园新闻的一系列新闻页网址。
(一系列的新闻信息,一般仅仅会变化数字,那么这就是我们可以通过for循环进行爬数据出来,format比较常用)
#定义一个变量i
i=1
#通过for循环,还有常用的format进行输出
for i in range(6):
print("http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html".format(i))
4.练习字符串内建函数:strip,lstrip,rstrip,split,count
" http://news.gzcc.cn/html/xiaoyuanxinwen/4.html"
(先定义一个字符串s)
s = " http://news.gzcc.cn/html/xiaoyuanxinwen/4.html"
A.删去前空格
ss = s.strip(" ")
B.删去http://前缀
ssl = ss.lstrip("http://")
C.删去后缀“.html”并且输出数字
ssr = ss.rstrip(".html")[-1:]
D.显示出这一段有多少个n
sscount = s.count("n")
E.将以“/”分隔成多个单词
ssp = s.split("/")
最后通过print输出就可以看到结果啦!
print(ss)
print(ssl)
print(ssr)
print(ssp)
print(sscount)
二、组合数据类型练习
1.分别定义字符串,列表,元组,字典,集合,并进行遍历。
A.定义字符串
s = "Hello World !"
print(s)
B.定义列表
s = ["aaa","bbb",[1,2,3]]
for i in s :
print(i)
C.定义元祖
#定义一个列表
s = ["aaa","bbb",[1,2,3]]
#定义元祖
tup = tuple(s)
#遍历元祖
for i in tup :
print(i)
#由下面可知,元祖里面的儿子如果是列表,则列表里面可以修改,否则元祖是无法修改的
tup[-1][1] = 0
for i in tup :
print(i)
tup[0][0] = "aaa"
for i in tup :
print(i)
D.定义字典
#生成字典
dird = {'Micheal':23,'Marry':22,'Jany':43}
#获取键“Micheal”值对,应该是23
print(dird["Micheal"])
E.定义集合
s1 = {1,3,5,7,9}
s2 = {1,2,3,5}
#获取s1、s2的相同部分
s = s1&s2
print(s)
2.总结列表,元组,字典,集合的联系与区别。
A.列表的特点是用方括号,列表内的值可以进行修改,可以用于一些需要经常改变的数值;
B.元祖的特点是用园括号内部的值是无法进行修改的,所以可以用于一些无法进行修改的数值,但是如果元祖内部有列表的子序列,那么列表内就可以 进行修改;
C.字典的特点是用大括号,但是对于列表和元祖的特点是键值对(key—value),但是不同于它们的是,key值是不能够修改的,所以对于一些用户名或者不可更改的值,可以用这个类型,密码可以随时修改,即value值。
D.集合也就是一组key的集合,但是不存储value,统同样和字典一样用大括号进行表示。
那么今天的字符串练习就到此结束了。