杂

最新推荐文章于 2024-06-13 07:29:42 发布
wokwn
最新推荐文章于 2024-06-13 07:29:42 发布
阅读量143
点赞数
分类专栏： python
本文链接：https://blog.csdn.net/wokwn/article/details/79160917
版权
python 专栏收录该内容
17 篇文章 0 订阅
订阅专栏
 
  插入数据时指定的位置超过最大索引，会把数据放在最后 
 
  索引遍历 泛型遍历 
 
  删除列表中数据  
 
  1.pop() 
 
  2del 指定索引 
 
  3 remove移除指定的元素，只会移除第一个匹配元素 
 
  **********用pop（）删除，因为pop是从后往前删 
 
  用其他删索引下标从零开始， 
 
  尽量用一维不用二维 
 
  student_list=[ 
  1 
  , 
  2 
  , 
  3 
  ] 
 
  # student_list=[name,age,phone]  此句是创建新元素 
 
  student_list[ 
  0 
  ]=name 
 
  student_list[ 
  1 
  ]=age 
 
  student_list[ 
  2 
  ]=phone 
 
  相当于修改，所添加的是同一对象 
 
  -----字典------------------ 
 
  name=dict_1.get( 
  'qwwe' 
  , 
  '1213' 
  )  
  #qwwe 
  不存在，则取 
  1213 
 
  清空字典dict_1.clear() 
 
  dict.keys()返回所有关键字 
 
  dict.values()返回所有值 
 
  dict.item返回所有键和值 
 
  dict.has_key（）判断是否拥有某关键字 
 
   -------------------------------------------------------- 
 
   bootstrap  html模板 
 
  #python 
  在 
  python 
  中发送请求 
 
  #  
  下载 
  requests 
  包，使用 
  requests 
  发请求 
 
  # 
  命令行工具中输入 
  pip install requests 
 
  #pip list 
  查看已经安装过的包 
 
   在线json格式化 
 
   下载图片错误： 
 
  start=string.find(start_str) 
 
  end=string.find(end_str) 
 
  print 
  (string[start+ 
  len 
  (start_str):end+ 
  len 
  (end_str)]) 
 
  while  
  start!=- 
  1 
  : 
 
      start = string.find(start_str, end +  
  len 
  (end_str)) 
 
      end = string.find(end_str, start,  
  len 
  (string)) 
 
      href = string[start +  
  len 
  (start_str):end +  
  len 
  (end_str)] 
 
  print 
  (href) 
 
  # 
  分割 
  url 
  地址，获取图片名称 
 
  href_list=href.split( 
  '/' 
  ) 
 
      pic_name=href_list[- 
  1 
  ] 
 
  # 
  下载图片 
 
  urllib.urlretrieve(href,pic_name) 
 
   正确 
 
  start=string.find(start_str) 
 
  end=string.find(end_str) 
 
  print 
  (string[start+ 
  len 
  (start_str):end+ 
  len 
  (end_str)]) 
 
  while  
  start!=- 
  1 
  : 
 
      end = string.find(end_str, start,  
  len 
  (string)) 
 
      href = string[start +  
  len 
  (start_str):end +  
  len 
  (end_str)] 
 
  print 
  (href) 
 
  # 
  分割 
  url 
  地址，获取图片名称 
 
  href_list=href.split( 
  '/' 
  ) 
 
      pic_name=href_list[- 
  1 
  ] 
 
  # 
  下载图片 
 
  urllib.urlretrieve(href,pic_name) 
 
      start = string.find(start_str, end +  
  len 
  (end_str)) 
 
   小爬虫总结 
 
   1.准备url 
 
   2.根据url地址发起请求，接受响应数据 
 
   3从html中提取该帖子共有多少页（总页数） 
 
   4准备用于查找图片位置的开始和结束标记字符串 
 
   5for循环总页数 
 
       5.1把x的值作为页码，拼接完整的url地址 
 
       5.2根据url发起请求，接受当前页响应数据（网站源代码） 
 
       5.3搜索该页中共有多少张图片 使用string.count()函数 
 
       5.4查找第一张图片位置 
 
       5.5while循环，只有图片开始的位置不等于-1找到（），执行循环 
 
           5.5.1找到图片结束位置，从上一次找到的图片开始位置之后查找 
 
           5.5.2根据开始和结束的位置 截取字符串（图片链接） 
 
           5.5.3通过分割字符串获取图片名称 
 
           5.5.4使用urllib.urlretieve()函数下载图片 
 
  pattern = re.compile(r'<img class="BDE_I.*?src="(.*?)".*?size="(.*?)".*?width="(.*?)".*?height="(.*?)"') 
  
    ( )中为要取数据 
  
   匹配中一定要加re.S 
   
   pattern = re.compile(r'<div class=".*?qiushi_tag.*?<h2>(.*?)</h2>.*?<div class="articleGender.*?>(.*?)</div>.*?<span>(.*?)</span>.*?<i class="n.*?>(.*?)</i>.*?<i.*?>(.*?)</i>',
 re.S) 
   
   rs = re.search(title_pat, html) 
  
  file_name = rs.group(1)+'.txt' #需加1 
 
      使用xpath搜索时需要将路径中的标签都写清楚 
     
        extract(): 返回选择器（列表）对应的节点的字符串（列表） 
       
 ------------------------------------------------- 
       
         选择器的 
        extract()方法默认会返回一个列表，哪怕数据只有一个也是这样。所以如果数据是单个的，使用 
        extract_first()方法。 
        
 作者： 你们都是技术宅 
        
 链接：https://www.imooc.com/article/21840 
        
 来源：慕课网 
        
 本文原创发布于慕课网 ，转载请注明出处，谢谢合作！ 
       
contents = file_handle.readlines() for msg in contents:  # 去除\n  msg = msg.strip('\n') # 使用 空格分隔字符串，得到列表  phone_detail = msg.split(' ')  # 将小列表添加到大列表中   phone_list.append(phone_detail) 
   readlines也可迭代 
   
    --------------------- 
   
print("who is the murder? %s or %s?") % (a, b)

后来才发现，python3.x与python2.x有一点区别，
原来%(变量名,...)应该是加在print括号里的
如：print("who is the murder? %s or %s" % (a, b))
     ---------------------------------------------