![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
兰亭落雪
目的不能抵达怎么付出都是偏差。
展开
-
电影分析器(python项目)
import pymysqlimport datetimefrom tkinter import *import tkinterfrom tkinter import ttkimport requestsimport osfrom bs4 import BeautifulSoupimport openpyxlimport threadingimport matplot...原创 2019-03-17 16:02:29 · 1376 阅读 · 0 评论 -
python时间戳与时间的相互转换
一、时间装换成时间戳标准时间向时间戳转换:1、获取标准时间2、使用strptime()转换成时间数组3、使用mktime()转换成时间戳import time, datetimetime1='2019-04-19 11:06:38't = time.strptime(time1, "%Y-%m-%d %H:%M:%S") start = int(time.mkti...原创 2019-04-19 15:36:52 · 327 阅读 · 0 评论 -
python的错误处理机制
一、python的错误处理在程序运行的过程中,如果发生了错误,可以事先约定返回一个错误代码,这样,就可以知道是否有错以及出错的原因。在操作系统提供的调用中,返回错误码非常常见。比如打开文件的函数open(),成功时返回文件的描述符(就是一个整数),出错时返回-1二、内置异常类BaseException是所有内置异常的基类,但用户定义的类并不直接继承BaseException,所有的异常...原创 2019-04-26 14:48:48 · 3043 阅读 · 1 评论 -
python向上取整,向下取整,四舍五入
import mathf = 11.2print math.ceil(f) #向上取整print math.floor(f) #向下取整print round(f) #四舍五入#这三个函数的返回结果都是浮点型首先要说的是python中的除法运算,在python2.5版本中存在两种除法运算,即所谓的true除法和floor除法。当使用x/y形式进行除法运算时,如果x和y都是...原创 2019-04-13 21:40:57 · 5363 阅读 · 0 评论 -
Python基本语法操作
一、列表1、特点(1)一组有序项目的集合。可变的数据类型【可进行增删改查】(2)列表是以方括号“[]”包围的数据集合,不同成员以“,”分隔。(3)列表中可以包含任何数据类型,也可包含另一个列表(4)列表可通过序号访问其中成员2、常用操作list.append()追加成员,成员数据list.pop()删除成员,删除第i个成员list.count(x)计算列表中参数...原创 2019-04-08 17:19:06 · 195 阅读 · 0 评论 -
Python问题小结
1.Python是如何进行内存管理的?答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制Python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。引用计数增加的情况:1,一个对象分配一个新名称2,将其放入一个容器中(如列表、元组或字典)引用计数减少的情况:1,使用del语句对对象别名显示的销毁2,引用超...原创 2019-03-17 19:58:11 · 654 阅读 · 0 评论 -
生成器
什么是生成器? 通过列表生成式,我们可以直接创建一个列表,但是,受到内存限制,列表容量肯定是有限的,而且创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。 所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间,在...原创 2019-03-17 19:51:01 · 95 阅读 · 0 评论 -
爬虫和数据库
1.scrapy和scrapy-redis有什么区别?为什么选择redis数据库?1) scrapy是一个Python爬虫框架,爬取效率极高,具有高度定制性,但是不支持分布式。而scrapy-redis一套基于redis数据库、运行在scrapy框架之上的组件,可以让scrapy支持分布式策略,Slaver端共享Master端redis数据库里的item队列、请求队列和请求指纹集合。2) ...原创 2019-03-17 19:48:07 · 2578 阅读 · 0 评论 -
数据清洗
1.数据错误:错误类型– 脏数据或错误数据• 比如, Age = -2003– 数据不正确• ‘0’ 代表真实的0,还是代表缺失– 数据不一致• 比如收入单位是万元,利润单位是元,或者一个单位是美元,一个是人民币– 数据重复2.缺失值处理:处理原则–缺失值少于20%•连续变量使用均值或中位数填补•分类变量不需要填补,单算一类即可,或者用众数填补–缺失值在20%-...原创 2019-03-17 19:47:05 · 423 阅读 · 0 评论 -
网络爬虫判断页面是否更新
1、304页面http状态码当第二次请求页面访问的时候,该页面如果未更新,则会反馈一个304代码,而搜索引擎也会利用这个304http状态码来进行判断页面是否更新。首先第一次肯定是要爬取网页的,假设是A.html,这个网页存储在磁盘上,相应地有个修改时间(也即是更新这个文件的时间)。那么第二次爬取的时候,如果发现这个网页本地已经有了,例如A.html,这个...原创 2019-03-17 19:32:49 · 1714 阅读 · 0 评论 -
爬虫-知乎
思路:1.选定起始人:选定一个关注数量或粉丝数量多的大佬2.获取粉丝和关注列表3.获取列表用户信息4.获取每位用户粉丝和关注站点分析:以任意知乎主为起点,分析网页请求,找到一个带有followees的请求,在其Preview内有相关的data数据即关注人的信息创建一个项目打开cmd,运行scrapy startproject zhihuuser6。在p...原创 2019-03-17 19:26:36 · 316 阅读 · 0 评论 -
网络爬虫(python项目)
一.request+正则表达式爬取猫眼电影1.什么是requestRequests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的工作。(用了requests之后,你基本都不愿意用u...原创 2018-12-04 20:21:29 · 6475 阅读 · 0 评论 -
python多线程和多进程
1 概念梳理:1.1 线程1.1.1 什么是线程线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。一个线程是一个execution context(执行上下文),即一个cpu执行时所需要的一串指令。1.1.2 线程的工作方式假设你正在读一本书,没...原创 2019-03-17 18:25:59 · 111 阅读 · 0 评论 -
python collections模块详解
1.模块简介collections包含了一些特殊的容器,针对Python内置的容器,例如list、dict、set和tuple,提供了另一种选择;namedtuple,可以创建包含名称的tuple;deque,类似于list的容器,可以快速的在队列头部和尾部添加、删除元素;Counter,dict的子类,计算可hash的对象;OrderedDict,dict的子类,可以记住元...原创 2019-02-15 16:07:26 · 381 阅读 · 0 评论 -
python双下划线与单下划线
http://wiki.intra.xiaojukeji.com/pages/viewpage.action?pageId=205555865转载 2019-04-24 14:40:25 · 200 阅读 · 0 评论