自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 吴恩达机器学习cs229一二节总结

主要是讲了最小二乘法(以及证明最小二乘法的随机误差法)、局部线性加权、逻辑回归三部分。最小二乘法最简单的算法,一种线性回归方法,核心思想是在样本数据中当预估值与实际值方差最小的时候,说明算法此时达到了最优解。具体可以通过迭代来实现,有两种迭代方法:批量梯度下降和随机梯度下降。批量梯度下降:每次迭代的时候都会引入全部样本的值进行计算,当样本数据比较大的时候,计算成本会很大。随机梯度下...

2020-02-25 12:01:38 215

原创 廖雪峰day-10-day13逻辑总结即问题回顾

day-10主要有一下几个函数:/register:转到这个处理函数,加载对应的html模板,然后用户开始填写他的注册信息/api/user:如果上面的注册信息都符合要求,那么将会保存用户信息,同时给浏览器发送cookie,cookie中包含一个列表,列表有userid和登录状态所能保持的最后时间以及一个hashlib加密的信息(userid,password,最后时间等)user2cook...

2020-02-19 20:59:29 218

原创 廖雪峰Python教程day1-day9总结

源码见廖雪峰github-day9,目前也只能是对源码进行理解,如果要自己写出来这些代码,还是很困难的。一、基本结构首先,是一个webapp最基本的结构async def init(): await orm.create_pool(host='127.0.0.1', port=3306, user='root', password='', db='awesome') app ...

2020-02-18 22:11:16 492

原创 关于廖雪峰教程元类在ORM的应用

首先是对定义了一个Field类,这个Field类有两个属性,一个name,一个column_type,同时还可以打印字符串class Field(object): def __init__(self, name, column_type): self.name = name self.column_type = column_type def ...

2020-02-14 17:55:02 125

原创 关于廖雪峰老师教程中Web这一章的总结

http:http是一种协议,浏览器将请求头部和请求数据发送给服务器,服务器返回响应头部和body,body为响应内容html:body中返回的内容,也是我们重点学习的对象wsgi接口:使得我们不用去管底层的http协议,我们只需要从请求中获得信息,并将响应的信息返回给浏览器web框架:可以处理不同的url,逻辑更加清楚,易于维护使用模板:有利于简便的编辑要返回的html内容...

2020-02-12 16:08:40 133

原创 利用Python发送内容显示图片,且附带图片附件的邮件

from email.mime.text import MIMETextfrom email.header import Headerfrom email import encodersfrom email.utils import parseaddr,formataddrfrom email.mime.multipart import MIMEMultipartfrom email.m...

2020-02-10 20:54:13 1292

原创 多进程下载一个论坛下多个页面的所有视频

思路:创建进程池,每个进程下载一页的所有视频。首先是解析论坛的页面,从页面中找到每个视频的url,得到url列表。然后循环请求url,并解析请求结果,从中找到视频源真实url(也就是.ts文件),将ts文件写入对应文件夹,在全部完成后,利用系统命令将零散的ts文件合成为一个完整的mp4文件,并删除原有ts文件。import requestsfrom bs4 import BeautifulSo...

2020-02-08 21:06:57 840

原创 下载一个在线视频

import requestsfrom bs4 import BeautifulSoupfrom multiprocessing import Poolimport osimport redef write(d): name=d[-9:] d=str(d) print(name) with open(f'video/{title}/{name}','wb'...

2020-02-06 11:13:45 877

原创 爬取某论坛一个主题下面的所有图片

前天刚刚爬取了知乎一个回答下面的所有图片,虽然大饱眼福,但是总觉的缺了点什么,于是尝试着爬取某论坛下面一个主题下的所有图片,下面是代码:#总体思路是这样的,发现该主题下面帖子会按页进行排列,每一页的url仅仅只有数字不同,因此可以先写一个函数,其传入的参数是数字,对该主题一页的帖子里的图片进行下载,然后在主函数里通过循环改变传入的数字,从而改变页码,循环下载import requestsim...

2020-02-05 13:14:25 1273

原创 爬取知乎一个问题下面所有答案的图片

import requestsfrom bs4 import BeautifulSoupimport jsonimport timeimport uuidimport datetimeimport os#找到网站的答案的真实地址,并下载其data,然后从data中找到图片的下载地址,并将其下载到本地。其中offset表示从第几条回答开始请求,后面会用来循环。sort表示回答的排列顺序...

2020-02-03 23:03:26 648 3

原创 爬取豆瓣TOP50

import requestsfrom bs4 import BeautifulSoupimport timeimport json#定义执行函数def result():#定义起始url的page参数和终了的page参数,并在参数符合条件的情况下进行循环 page=0 pages=250 while page<=pages: #豆瓣的url是可...

2020-02-02 10:27:10 369

原创 爬虫

首先,打开的时候:urllib.request.urlopen('url')当使用data的时候就变成了post请求,会要求服务器处理一部分的数据:data=bytes(parse.urlencode('{dict}'),encoding='utf-8')response=urllib.request.urlopen('url',data=data,timeout=1当需要 设置头部he...

2020-01-30 16:33:54 80

原创 关于pyquery的应用

html = '''<div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2.html">second item</a></li> &...

2020-01-30 16:32:30 117

原创 安装lxml

安装的时候老是出现error 2, file not exist最后发现.whl前面的空格没有去掉是主要原因操了

2020-01-29 21:48:37 137

原创 关于‘加盐’使得密码不被破解

-- coding: utf-8 --import hashlib, randomdef get_md5(s):#确定返回字符串的函数,简化代码return hashlib.md5(s.encode(‘utf-8’)).hexdigest()class User(object):#生成一个类,用来储存哈希后的密码def init(self, username, password):se...

2020-01-20 22:14:53 558

原创 关于base64

个人理解用二进制文件时,很多无法显示,所以需要把二进制转换一种形式,b64能够把二进制文件的对应的符号转化成二进制但是用字符串来表示的符号,python有专门的函数base64.b64encode(b’’)进行转化,同时也能利用base64.b64decode(b’)来进行回转。...

2020-01-20 11:53:30 142

原创 关于datetime模块

获取当前日期当前时间now=datetime.now()获得指定日期时间time=datetime(2020,1,20,9,20)转化为浮点数时间datetime.now().timestamp()浮点数时间转化为当地时间datetime.fromtimestamp(t)浮点数时间转化为UTC标准时间datetime.utcfromtimestamp(t)字符串转化为时间da...

2020-01-20 10:26:21 206

原创 挖个坑,以后填logging调试输出日志的方法

坑坑坑坑坑

2020-01-14 10:47:56 508

原创 大神关于__getattr__的方法

实现Chain().users(‘michael’).repos输出/users/michael/repos无图无真相,上代码:class Chain(object):def init(self, path=’’):self.__path = pathdef getattr(self, path):return Chain(’%s/%s’ % (self.__path, path))...

2020-01-13 20:09:06 268 1

原创 关于返回函数挖一个坑,明天填

坑坑坑坑坑

2020-01-09 21:58:23 96

原创 找出回数

找出回数def is_palindrome(n):b=str(n)c=len(b)a=0for i in b:if b[a]!=b[c-1-a]:return 0a=a+1return 1output = filter(is_palindrome, range(1, 1000))我的思想是转换成字符串之后一个一个的对比def is_palindrome(n):b=str(...

2020-01-09 18:57:27 100

原创 参数类型及用法

参数类型及用法一个代码搞定def f(a,b=0,*c,d,**kw):print(a,b,c,d,kw)f(1,2,3,4,d=5,f=None,h=7)运算结果:a是位置参数,b是默认参数,c是可变参数,d是命名关键字参数,kw是关键字参数其中可变参数和关键字参数可以存储许多未规定的东西,而a,b,d都只有一个值,但是其输入方式不同,a,b直接输入值就行,d需要用dict的形式...

2020-01-09 14:26:44 239

原创 删除字符串首尾空格的函数以及杨氏三角

删除字符串首尾空格的函数代码:def trim(s):while s==None:return NoneTypewhile s[:1]==' ': s==s[1:] while s[-1:]==‘ ': s=(s[:-1])return sprint(trim(’ hello ‘),len(trim(’ hello ')))测试:if trim...

2020-01-09 09:20:19 347

原创 2020.1.7-汉诺塔算法

汉诺塔算法汉诺塔是指,有三根棍子,在a棍子上串有从小到大依次排放的圆片,怎样移动能够使得将这些原片从a转移动c,且移动过程中始终是小圆片放在大圆片上方代码:def hnt(n,a,b,c):if n==1:print(‘a–c’)else:hnt(n-1,a,c,b)print(‘a-c’)hnt(n-1,b,a,c)思想是,如果有n个圆片,n>1,那个首先要做的是把这上...

2020-01-07 15:22:53 223

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除