插入数据时指定的位置超过最大索引,会把数据放在最后


索引遍历 泛型遍历

删除列表中数据 
1.pop()
2del 指定索引
3 remove移除指定的元素,只会移除第一个匹配元素

**********用pop()删除,因为pop是从后往前删
用其他删索引下标从零开始,


尽量用一维不用二维


student_list=[ 1 , 2 , 3 ]
# student_list=[name,age,phone]  此句是创建新元素
student_list[ 0 ]=name
student_list[ 1 ]=age
student_list[ 2 ]=phone
相当于修改,所添加的是同一对象

-----字典------------------
name=dict_1.get( 'qwwe' , '1213' #qwwe 不存在,则取 1213
清空字典dict_1.clear()

dict.keys()返回所有关键字
dict.values()返回所有值
dict.item返回所有键和值
dict.has_key()判断是否拥有某关键字


--------------------------------------------------------


bootstrap  html模板



#python python 中发送请求
下载 requests 包,使用 requests 发请求
# 命令行工具中输入 pip install requests
#pip list 查看已经安装过的包


在线json格式化


下载图片错误:
start=string.find(start_str)
end=string.find(end_str)
print (string[start+ len (start_str):end+ len (end_str)])
while  start!=- 1 :
    start = string.find(start_str, end +  len (end_str))
    end = string.find(end_str, start,  len (string))
    href = string[start +  len (start_str):end +  len (end_str)]
     print (href)
     # 分割 url 地址,获取图片名称
     href_list=href.split( '/' )
    pic_name=href_list[- 1 ]
     # 下载图片
     urllib.urlretrieve(href,pic_name)

正确
start=string.find(start_str)
end=string.find(end_str)
print (string[start+ len (start_str):end+ len (end_str)])
while  start!=- 1 :
    
    end = string.find(end_str, start,  len (string))
    href = string[start +  len (start_str):end +  len (end_str)]
     print (href)
     # 分割 url 地址,获取图片名称
     href_list=href.split( '/' )
    pic_name=href_list[- 1 ]
     # 下载图片
     urllib.urlretrieve(href,pic_name)
    start = string.find(start_str, end +  len (end_str))

    

小爬虫总结
1.准备url
2.根据url地址发起请求,接受响应数据
3从html中提取该帖子共有多少页(总页数)
4准备用于查找图片位置的开始和结束标记字符串
5for循环总页数
    5.1把x的值作为页码,拼接完整的url地址
    5.2根据url发起请求,接受当前页响应数据(网站源代码)
    5.3搜索该页中共有多少张图片 使用string.count()函数
    5.4查找第一张图片位置
    5.5while循环,只有图片开始的位置不等于-1找到(),执行循环
        5.5.1找到图片结束位置,从上一次找到的图片开始位置之后查找
        5.5.2根据开始和结束的位置 截取字符串(图片链接)
        5.5.3通过分割字符串获取图片名称
        5.5.4使用urllib.urlretieve()函数下载图片

pattern = re.compile(r'<img class="BDE_I.*?src="(.*?)".*?size="(.*?)".*?width="(.*?)".*?height="(.*?)"')

( )中为要取数据


匹配中一定要加re.S
pattern = re.compile(r'<div class=".*?qiushi_tag.*?<h2>(.*?)</h2>.*?<div class="articleGender.*?>(.*?)</div>.*?<span>(.*?)</span>.*?<i class="n.*?>(.*?)</i>.*?<i.*?>(.*?)</i>',
 re.S)

rs = re.search(title_pat, html)
file_name = rs.group(1)+'.txt'
#需加1


使用xpath搜索时需要将路径中的标签都写清楚

extract(): 返回选择器(列表)对应的节点的字符串(列表)
-------------------------------------------------
选择器的 extract()方法默认会返回一个列表,哪怕数据只有一个也是这样。所以如果数据是单个的,使用 extract_first()方法。
作者: 你们都是技术宅
链接:https://www.imooc.com/article/21840
来源:慕课网
本文原创发布于慕课网 ,转载请注明出处,谢谢合作!
contents = file_handle.readlines() for msg in contents:  # 去除\n  msg = msg.strip('\n') # 使用 空格分隔字符串,得到列表  phone_detail = msg.split(' ')  # 将小列表添加到大列表中   phone_list.append(phone_detail)
readlines也可迭代



---------------------

 
print("who is the murder? %s or %s?") % (a, b)

后来才发现,python3.x与python2.x有一点区别,
原来%(变量名,...)应该是加在print括号里的
如:print("who is the murder? %s or %s" % (a, b))
---------------------------------------------





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值