Python
IT独白者
这个作者很懒,什么都没留下…
展开
-
Python函数的可变参数
刚学用Python的时候,特别是看一些库的源码时,经常会看到func(*args, **kwargs)这样的函数定义,这个*和**让人有点费解。其实只要把函数参数定义搞清楚了,就不难理解了。先说说函数定义,我们都知道,下面的代码定义了一个函数funcAdef funcA(): pass 显然,函数funcA没有参数(同时啥也不干:D)。下面这个函数fun转载 2015-03-10 09:37:33 · 509 阅读 · 0 评论 -
在python中使用zipfile压缩文件时层级很多,有很多层目录,但是需要去除这些层级目录
如下图本来只压缩一个文件结果这个文件所在的路径全都被压缩进去啦那么解决方法就是在做压缩的时候,重新做一个命名即可。如下所示:yadir='D:/databak/'zipfilepath='D:/zipfile.zip'filelists = os.listdir(yadi)if filelists == None or len(filelists) < 1:转载 2018-01-25 09:21:24 · 15476 阅读 · 1 评论 -
python生成csv中文乱码的问题
一、前言在Linux下面用python进行数据处理,然后输出为csv格式,如果没有中文一切正常,但是如果有中文,就会出现乱码的问题,本篇将讲述怎么处理这个问题二、处理过程原始代码#!/usr/bin/env python# -*- coding: UTF-8 -*-import csv#import codecswith open('test转载 2018-01-16 22:53:33 · 12302 阅读 · 3 评论 -
爬自己的微信朋友
微信里有一个非常好用的开源工具itchat,开发者可以用这个工具来实现获取自己微信朋友圈的所有朋友信息,并且对朋友信息进行分析,那么这里LZ通过网上一篇微博客,跟随着它的脚步,来学习这个itchat工具。首先,在终端安装一下itchat包。pip install itchat安装完成后导入包,再登陆自己的微信。过程中会生产一个登陆二维码,扫码之后即可登陆。登陆成功后,把转载 2018-01-13 11:31:08 · 942 阅读 · 0 评论 -
解决Mac系统下matplotlib中文显示方块问题
一.Mac需要先下载simhei.ttf字体并安装,之后按照下面步骤首先将simhei.ttf拷贝到~python安装路径/site-packages/matplotlib/mpl-data/fonts/ttf目录中;链接: https://pan.baidu.com/s/1hsGhxmG 密码: rste二.然后修改~python安装路径/site-packages/matplo转载 2018-01-13 11:15:05 · 4143 阅读 · 0 评论 -
数据库中不支持中文,将默认的gbk格式调整成utf-8格式
之前lz在用scrapy对链家进行爬取的时候,将数据保存到mysql数据库中,发现如果不修改字符集的格式,那么默认就是gbk,就会不支持中文,那么就需要将其更改为utf-8的格式。这就需要在mysql创建表的时候,将默认的字符格式指定为utf-8格式,有助于对中文的支持。具体的执行如下所示:create table music_review_douban ( id int auto_i原创 2017-10-31 15:53:55 · 1982 阅读 · 0 评论 -
Mac(OS X)安装、配置并使用MySQL数据库
1、MySQL安装包下载MySQL Community Server下载地址:http://dev.mysql.com/downloads/mysql/,下载完毕之后安装文件如下所示:2、MySQL安装双击安装文件进行安装,出现如下界面:双击窗体中的“mysql-5.7.10-osx10.9-x86_64.pk转载 2017-10-31 15:48:17 · 1867 阅读 · 2 评论 -
mac安装mysql及终端操作mysql与pycharm的数据库可视化
一.Mac安装mysql首先下载mysql,地址:https://dev.mysql.com/downloads/mysql/然后已知安装就好了,会出现让你记住密码的提示,然后就安装好了。。。。更改密码,可以参考:http://blog.csdn.net/soft2buy/article/details/50223373二.终端操作mysql首先在系统偏好里转载 2017-10-31 15:45:44 · 3369 阅读 · 1 评论 -
Python中获取异常(Exception)信息
异常信息的获取对于程序的调试非常重要,可以有助于快速定位有错误程序语句的位置。下面介绍几种python中获取异常信息的方法,这里获取异常(Exception)信息采用try...except...程序结构。如下所示try: ...except Exception, e: ... 1、str(e)返回字符串类型,只给出异常信息,不包括异常信转载 2017-10-13 09:42:44 · 40706 阅读 · 0 评论 -
java爬取百度百科词条
lz在之前的一篇博客中,用python实现了爬取百度百科的词条,就在如何用java来实现相同的功能,果不其然,java用一个jsoup的第三方库工具就可以很简单地实现爬取百度百科的词条。同样的,将这个爬取过程分成5个部分来实现。分别是connectnet连接url部分、parsehtml获取html相关内容部分、startspyder部分、store存储url部分、urlmanager的url管理原创 2017-10-12 22:07:10 · 1812 阅读 · 0 评论 -
python爬取百度百科词条内容
LZ最近在学习python的相关知识,尤其是爬虫这一块,所以就拿百度百科来练练手,正好网上也有一些资源供借鉴,体会了一把python爬虫的精髓。一、准备工作LZ用的是python2.7版本,相对于python 3.0版本,2.7版本目前还是主流。用到了BeautifulSoup、re和urlparse等第三方库。首先将爬虫过程分为五个部分,分别为spider_main.py爬虫调度程序、u原创 2017-10-12 09:20:44 · 2829 阅读 · 0 评论 -
在mac下用crontab来定时执行scrapy爬虫命令
Crontab这个命令是在linux下来执行定时执行任务的指令,但是在mac下同样用这一指令来实现定时执行任务。但是在用到scrapy爬虫的时候,会有两个比较常见的问题导致定时爬取不成功,接下来将详细介绍如何在mac下执行crontab指令来完成相关定时任务。一、启动crontab -e来编辑自己定义的任务例如我想在每天的17:30分来定时执行此任务,那么相关的配置符合条件的命令为:3原创 2017-10-19 19:48:36 · 1306 阅读 · 1 评论 -
Python类里的__init__方法函数,Python类的构造函数
如果某类里没有__init__方法函数,通过类名字创建的实例对象为空,切没有初始化;如果有此方法函数,通常作为类的第一个方法函数,有点像C++等语言里的构造函数。——————————————————————————————————————class Ca: def __init__(self, v): # 注意前后各两个下划线 sel原创 2015-03-18 23:11:49 · 11030 阅读 · 3 评论 -
从pandas写入csv中文乱码问题的解决
在使用pandas的to_csv来写入csv中,会出现中文乱码问题,可以通过在pandas中读取带有中文的csv文件时,读写中汉字为乱码,可加上encoding参数来避免,如:pd.read_csv("ee.csv",encoding="gb2312")当然,在导出时记得也加上encoding参数,否则导出后用excel打开也是乱码,editplus打开正常,如:df.to_csv("sel.cs...原创 2018-03-13 21:35:16 · 19240 阅读 · 1 评论