当前搜索:

python获取服务器响应cookie

总结 先贴一个代码 事情经过 更好的解决方案 总结调试网站获取cookies时请查看,r.header和r.request.header这两个属性,因为cookie说不准出现在他们俩谁里面。先贴一个代码import re import requests from bs4 import Beauti...
阅读(692) 评论(0)

python yield(生成器)的简单使用

生成器有什么用? 简单来说,他能有效的帮我们提高程序运算速度和节约内存空间。 生成器是怎么工作的? 每一次调用生成器,生成器都会从上一次出现yeild的地方继续运行代码。如果是第一次运行生成器,那么生成器就会从函数的一开始开始运行(从接收参数的地方开始)。def gen(num): ...
阅读(120) 评论(0)

python-爬取淘宝商品

import requests import re import tracebackdef getHTMLText(url): r = requests.get(url,timeout=30) if(r.status_code != 200): return &qu...
阅读(222) 评论(0)

python之正则表达式

前述: 阿,又是正则表达式,这已经是第三次学正则表达式,但是也是学的最好的一次,这次看到北京理工大学嵩天老师的视频,讲的很好。以下是视频ppt的一些截图和同时。 提示: 1.正则表达式除了可以用了字符串(string)来表示还可以用正则表达式自己的字符串表示(raw string) 2.如...
阅读(116) 评论(0)

使用Python爬取中国大学排名,并格式化对其输出内容

首先,我们需要注意几点 1.可以使用isinstance语句配合bs4库中的bs4.element.Tag判断获取到的对象是不是标签对象. 2.输出内容并且要求他用空白补齐时,系统默认用的是英文空白符,英文空白符和中文空白符(chr(12288)获取)宽度不一样。import requests...
阅读(255) 评论(0)

python beautifulsoup简用

find_all方法的使用 例1查找所有的标签 例2查找所有属性性值包含mnav的a标签 例3获取所有标签的名称 例4获取所有idhead的标签 例5结合正则表达式搜索包含百度的字符串 例6结合正则表达式搜索id开头是f的标签 例7仅搜索同一层的节点不搜索子节点 百度源码 参考文档 提示:本文...
阅读(203) 评论(0)

amaze ui包中缺少jquery文件解决办法

方法一: 到官网中下载他的离线帮助文档,内含amaze ui所需的jquery 下载地址:http://amazeui.org/getting-started 方法二: 下载博主的jquery(版本2.7.2) 链接:http://pan.baidu.com/s/1skRbSAT 密码:...
阅读(116) 评论(0)

visual studio2017 python3安装beautifulsoup4

第一步 先去beautifulsoup官网下载beautifulsoup的文件: https://www.crummy.com/software/BeautifulSoup/bs4/download/第二步 把下载文件解压到python的根目录 第三步 打开power shell(cmd...
阅读(669) 评论(0)

js取消提交表单

<script language="javascript" type="text/javascript"> function check(){ var begin_address = document.getElemen...
阅读(224) 评论(0)

html-css表单的margin-right/padding-right属性设置无效解决办法

博主原来一开始是想实现form标签中的input元素离浏览器的右边界有一定距离的效果,但是无论我在input的css中调margin-right还是在form中调padding-right都不能实现前面说的效果,后来博主改变思路用div来包裹input在调padding还是不行,我擦。于是我在改变...
阅读(948) 评论(0)

java-父类和子类的构造函数

说明:如果一个类继承了另外一个类,那么当进入该类的构造方法时,程序会默认先执行该类的父类的无参构造方法。 为什么:因为当该类继承别的类时,该类的所有构造方法的第一句必须是super();也即是调用父类的无参构造函数,就算我们不写编译器也会自动帮我们加上。package Test;public c...
阅读(145) 评论(0)

python-序列解包(对可迭代元素的快速取值)

一般情况下 x,y,z = 1,2,3 print("x:",x) print("y:",y) print("z:",z)#运行结果 x: 1 y: 2 z: 3 对元祖序列解包 name = ("qiaobushi&quo...
阅读(510) 评论(0)

python爬虫-下载图片到本地目录

import requests import os url = "https://ss0.bdstatic.com/5aV1bjqh_Q23odCf/static/superman/img/logo/bd_logo1_31bdc765.png" root = "F:/...
阅读(569) 评论(0)

python爬虫-网站是如何防止爬虫的

第一种方法:通过检测请求头的user-agent字段来检测你是一个爬虫还是一个浏览器(人类),这时如果想让爬虫正常访问该网站,可以把自己的请求头user-agent字段修改为浏览器的(通过抓包可以获取)。第二张方法:在根目录下放置Robots.txt文件,告知爬虫自觉遵守。 例如CSDN的Rob...
阅读(371) 评论(0)

动态规划——求最大公共子序列(一种可以求数据相似度匹配算法)

算法说明 这是一种利用动态规划思想实现的算法,也即是在运算过程中每一次计算都求出一个值,然后将这个值和前面计算的值比较,如果这个值比前面的值更加接近我们需要的结果则存储这个值,否则存储前面计算的值,这样在算法最后我就能得到最优结果。 算法优点 运算效率高 据说科学家DNA相似度的检测...
阅读(409) 评论(0)

python爬虫-Requests库

Requests库官方中文参考手册 点我跳转 Requests库安装 只要在控制台上输入 Windows系统:pip install requests Linux系统:sudo pip install requests 我用的是VS,所以用的这个控制台 如果你也出...
阅读(189) 评论(0)

使用turtle库画蛇

代码import turtle def drawSnake(rad,angle,len,nackrad): for i in range(len): turtle.circle(rad,angle) #画圆,参数分别是半径和角度 turtle.circle(...
阅读(412) 评论(0)

NP问题

什么是NP问题? 这是一种尚且没有更好解决方案的问题,这类的问题往往无法完成,例如旅行商问题,但是可以依靠贪婪算法计算出近似解。 如何识别NP问题 1.当元素较少时效率很快,但是当元素一旦增加,速度会变得非常慢。 2.涉及要找出“所有组合”中的一个“特别的组合”的问题通常是NP问题。...
阅读(107) 评论(0)

python-集合操作

colletion1 = set([1,2,3,4]) #必须是set,才能进行集合运算 colletion2 = set([3,4,5]) one = colletion1 & colletion2 #求交集 print("one:%s" % one) two = c...
阅读(75) 评论(0)

Python-三种括号的区别

python中的小括号( )代表tuple元组数据类型,元组是一种不可变序列。 python中的中括号[ ]代表list列表数据类型,列表是一种可变的序列。 python大括号{ }花括号代表dict字典数据类型,字典是由键对值组组成。
阅读(193) 评论(0)
    个人资料
    持之以恒
    等级:
    访问量: 2万+
    积分: 1166
    排名: 4万+
    最新评论