Python
suibianshen2012
这个作者很懒,什么都没留下…
展开
-
python通过pid杀死进程的方法
python通过pid如何杀掉正在执行的进程原创 2022-09-08 09:24:37 · 1206 阅读 · 0 评论 -
anaconda包文件安装
安装失败时,可以指定数据源原创 2022-08-18 21:50:44 · 161 阅读 · 0 评论 -
图像显示pygame
python图像显示,pygame原创 2022-08-16 15:58:11 · 670 阅读 · 0 评论 -
用python写MapReduce函数——以WordCount为例
阅读目录1. Python MapReduce 代码2. 在Hadoop上运行python代码3. 利用python的迭代器和生成器优化Mapper 和 Reducer代码4. 参考 尽管Hadoop框架是用java写的,但是Hadoop程序不限于java,可以用python、C++、ruby等。本例子中直接用python写一个MapReduce实例,而不是用Jython转载 2017-05-25 14:03:56 · 2056 阅读 · 0 评论 -
python开发中用到的知识点汇总---不断更新中
1、字典dictionary查找,找到key对应的value,则返回对应的value;若无对应的key,则返回默认值---函数dic.get()dic.get(key, defalut) 【注】若不需要默认值,也可以通过dic[key]方式获取value2、去除行尾的换行符---strip("\n")line.strip().strip("\n")【注】有时仅用st原创 2017-05-11 16:43:22 · 548 阅读 · 0 评论 -
python time()格式分析
1、可以试下下面的方式来取得当前时间的时间戳:import timeprint time.time()输出的结果是:1279578704.67252712、但是这样是一连串的数字不是我们想要的结果,我们可以利用time模块的格式化时间的方法来处理:time.localtime(time.time())用time.localtime()方法,作用是格式化时间戳为本地的转载 2017-04-06 20:39:23 · 807 阅读 · 0 评论 -
Python 字典中一键对应多个值
Python 字典中一键对应多个值#encoding=utf-8 print'中国' #字典的一键多值 print'方案一 list作为dict的值 值允许重复' d1={}key=1value=2d1.setdefault(key,[]).append(value)value=2d1.setdefault(key,转载 2017-05-01 23:07:56 · 17540 阅读 · 0 评论 -
jieba结巴分词--关键词抽取(核心词抽取)
转自:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢!1 简介关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来。这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。除了这些,关键词还可以在文本聚类、分类、自动摘要等领域中有着重转载 2017-03-31 16:57:25 · 39282 阅读 · 1 评论 -
beautifulsoup提取所有<a>标签内容 Python
# -*- coding:utf-8 -*-#python 2.7#XiaoDeng#http://tieba.baidu.com/p/2460150866#标签操作from bs4 import BeautifulSoupimport urllib.requestimport re#如果是网址,可以用这个办法来读取网页#html_doc = "http://tieba.原创 2017-03-13 11:37:16 · 25065 阅读 · 1 评论 -
python用BeautifulSoup用抓取a标签内所有数据
# -*- coding:utf-8 -*-#python 2.7#XiaoDeng#http://tieba.baidu.com/p/2460150866#标签操作from bs4 import BeautifulSoupimport urllib.requestimport re#如果是网址,可以用这个办法来读取网页#html_doc = "http://tieba.原创 2017-03-14 11:55:03 · 35998 阅读 · 1 评论 -
python datetime.datetime is not JSON serializable 报错问题解决
1、问题描述使用python自带的json,将数据转换为json数据时,datetime格式的数据报错:datetimeTypeError: datetime.datetime(2017, 3, 21, 2, 11, 21) is not JSON serializable。2、解决方法就是重写构造json类,遇到日期特殊处理,其余的用内置的就行。imp原创 2017-03-21 16:49:05 · 22697 阅读 · 4 评论 -
python中coding:utf-8和setdefaultencoding区别
这两个作用不一样,1. # coding:utf-8作用是定义源代码的编码. 如果没有定义, 此源码中是不可以包含中文字符串的.PEP 0263 -- Defining Python Source Code Encodingshttps://www.python.org/dev/peps/pep-0263/2. sys.getdefaultencoding()是设置原创 2017-03-20 18:24:22 · 4849 阅读 · 0 评论 -
Python脚本在crontab定时任务中无法运行,但是对应脚本手动执行成功
1、问题描述在用crontab设置定时任务时,发现py脚本在crontab中报错,显示import某些包找不到,但是手动直接运行py脚本,完全正常。01 05 * * * cd /data/felixping/toutiao/crontab_file;./get_topic_hourly.sh >> get_topic_hourly.log 2>&12、问题解析主要是c原创 2017-03-20 13:00:14 · 16361 阅读 · 4 评论 -
python字符串转日期,日期相加减
1、字符串转日期:通过 time.srtptime()实现import timestr_time = time.srtptime("20170620","%Y%m%d")print str_time#输出time.struct_time(tm_year=2017, tm_mon=6, tm_mday=20, tm_hour=0, tm_min=0, tm_sec=0, tm_w原创 2017-06-20 20:14:13 · 11734 阅读 · 1 评论 -
如何安装beatifulsoup
1. 什么是beatifulsoup?beatifulsoup官网http://www.crummy.com/software/BeautifulSoup/BeatifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时...原创 2019-10-11 15:48:05 · 364 阅读 · 0 评论 -
在Vim中查看、修改文件编码
:set fileencoding即可显示文件编码格式。 如果你只是想查看其它编码格式的文件或者想解决 用Vim查看文件乱码的问题,那么在 ~/.vimrc 文件中添加以下内容:set encoding=utf-8 fileencodings=utf-8这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或 者GBK编码的文件),其实就是依照fileencodings提供的...原创 2018-12-17 10:48:38 · 883 阅读 · 1 评论 -
Python 通过url获取图片尺寸、格式相关信息
假定给出一个URL,如何从服务器捕获该URL所对应的图片的相关信息呢?利用Python的urllib及PIL中的Image即可轻松实现。#coding:utf-8import osimport urllibimport urllib2import cStringIOfrom PIL import Imagepath = "http://h.hiphotos.baidu.c...原创 2018-11-26 17:22:33 · 3813 阅读 · 0 评论 -
python 删除文件夹、删除非空文件夹
一般删除文件时使用os库,然后利用os.remove(path)即可完成删除,如果删除空文件夹则可使用os.removedirs(path)即可, 但是如果需要删除整个文件夹,且文件夹非空时使用os.removedirs(path)就会报错了,此时可以使用shutil库,该库为python内置库,是一个对文件及文件夹高级操作的库,可以与os库互补完成一些操作,如文件夹的整体复制,移动文件夹,对文...原创 2018-11-20 15:34:58 · 85062 阅读 · 0 评论 -
hadoopstreaming job中参数解释 python
-D stream.map.output.field.separator :设置map输出中key和value的分隔符 -D stream.num.map.output.key.fields : 设置map程序分隔符的位置,该位置之前的部分作为key,之后的部分作为value -D map.output.key.field.separator : 设置map输...原创 2018-07-25 15:17:37 · 404 阅读 · 0 评论 -
数组(列表)全排列、组合实现方法 python
python语言简单、方便,其内部可以快速实现排列组合算法,下面做简单介绍:1、一个列表数据任意组合:【自带的库itertools.combinations】#_*_ coding:utf-8 _*_#__author__='dragon'import itertoolslist1 = [1,2,3]list2 = []for i in range(1,len(list1)+1): iter...原创 2018-06-22 14:16:47 · 18852 阅读 · 1 评论 -
python中lambda的用法
一、lambda函数也叫匿名函数,即,函数没有具体的名称。先来看一个最简单例子:def f(x):return x**2print f(4)Python中使用lambda的话,写成这样g = lambda x : x**2print g(4)二、lambda和普通的函数相比,就是省去了函数名称而已,同时这样的匿名函数,又不能共享在别的地方调用。其实说的没错,lambda在Python这种动态的语言...转载 2018-05-18 10:56:56 · 381 阅读 · 0 评论 -
python向上取整,向下取整
1、python向下取整方法:一般使用floor除法,一般除法/,round()四舍五入函数2、python向上取整方法: Python match.ceil函数 ceil(x)函数是向上取整,即取大于等于x的最接近整数。 import math math.ceil(float(1)/2)原创 2017-10-24 15:54:02 · 41444 阅读 · 0 评论 -
Python+Hadoop Streaming实现MapReduce(如何给map和reduce的脚本传递参数)
设置参数 #!/bin/bash hadoop fs -rmr trans_record/result hadoop jar ./hadoop-streaming-2.0.0-mr1-cdh4.7.0.jar \ -input $1 \ -output trans_record/result \转载 2017-09-10 11:25:06 · 1033 阅读 · 0 评论 -
pyhton列表合并、追加操作extend()、+
在实际应用中涉及到了列表合并的问题。在应用append()时,发现列表是以一个元素的形式追加到列表上的,最后查询后用的是extend()方法,下面是区别 1.append() 向列表尾部追加一个新元素,列表只占一个索引位,在原有列表上增加2.extend() 向列表尾部追加一个列表,将列表中的每个元素都追加进来,在原有列表上增加3.+ 直接用+号看上去与转载 2017-08-25 15:02:33 · 870 阅读 · 0 评论 -
python中counter()记数
一:定义一个list数组,求数组中每个元素出现的次数如果用Java来实现,是一个比较复杂的,需要遍历数组list。但是Python很简单:看代码[python] view plain copy a = [1,4,2,3,2,3,4,2] from collections import Counter print Counter(a) 打印结转载 2017-08-14 21:14:16 · 5088 阅读 · 0 评论 -
python 结巴分词(jieba)学习
转自:http://www.gowhich.com/blog/147源码下载的地址:https://github.com/fxsjy/jieba演示地址:http://jiebademo.ap01.aws.af.cm/特点1,支持三种分词模式: a,精确模式,试图将句子最精确地切开,适合文本分析; b,全模式,把句子中所有的可以成词的词语转载 2016-12-06 18:51:12 · 1175 阅读 · 0 评论 -
Python 文本挖掘:jieba中文分词和词性标注
转自:http://rzcoding.blog.163.com/blog/static/222281017201310155331241/jieba 分词:做最好的Python 中文分词组件。这是结巴分词的目标,我相信它也做到了。操作简单,速度快,精度不错。而且是Python 的库,这样就不用调用中科院分词ICTCLAS了。妈妈再也不用担心我不会分词啦。jieba转载 2016-12-06 15:18:15 · 6240 阅读 · 0 评论 -
jieba(结巴)分词种词性简介
jieba为自然语言语言中常用工具包,jieba具有对分词的词性进行标注的功能,词性类别如下:Ag形语素形容词性语素。形容词代码为 a,语素代码g前面置以A。a形容词取英语形容词 adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码 a和副词代原创 2016-12-06 15:13:32 · 35051 阅读 · 0 评论 -
python3.x 学习笔记 2
一、解析【备注】主要讲列表解析、字典解析和集合解析的概念。1、处理文件和目录a:python3自带一个os模块(代表操作系统operating system),os模块包含非常多的函数用于获取(和修改)本地目录、文件进程、环境变量等信息。b:os是python3自带的,可以在任何地方导入。import osc:获取当前工作目录:os.getcwd();d:改变当前工作目原创 2016-04-19 12:53:28 · 446 阅读 · 0 评论 -
python2.x和python3.x中raw_input( )和input( )区别
备注:1、在python2.x中raw_input( )和input( ),两个函数都存在,其中区别为raw_input( )---将所有输入作为字符串看待,返回字符串类型input( )-----只能接收“数字”的输入,在对待纯数字输入时具有自己的特性,它返回所输入的数字的类型( int, float )2、在python3.x中raw_input(原创 2016-05-11 22:39:16 · 38450 阅读 · 1 评论 -
Python中tile函数的用法
tile函数位于Python模块 numpy.lib.shape_base中,他的功能是重复某个数组。比如tile(A,n),功能是将数组A重复n次,构成一个新的数组,我们还是使用具体的例子来说明问题:先来引入numpy下的所有方法我们创建一个a,如图下图,使用tile来创建b,注意看b的数据结构假如我们输入一个元组(1,2),我们会得到一样的结果,与上面相转载 2016-05-11 22:20:04 · 1923 阅读 · 0 评论 -
python中read()、readline()和readlines()的区别
.read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容最直接的字符串表示,但对于连续的面向行的处理,它却是不必要的,并且如果文件大于可用内存,则不可能实现这种处理。.readline() 和 .原创 2014-11-24 21:29:25 · 1704 阅读 · 0 评论 -
python计算文件的行数的方法
def linecount1(): count = len(open("mysql命令.md", "rU").readlines()) print countdef linecount2():#加入enumerate计数器 count = -1 for count, line in enumerate(open("mysql命令.md", 'rU')原创 2014-11-24 21:16:10 · 6604 阅读 · 0 评论 -
Python3字典中items()和python2.x中iteritems()有什么区别
字典中items()和iteritems()有什么区别? 第一个答案大致的意思是这样的:“起初 items() 就是返回一个像上面那样的包含dict所有元素的list,但是由于这样太浪费内存,所以后来就加入了(注:在Python 2.2开始出现的)iteritems(), iterkeys(), itervalues()这一组函数,用于返回一个 iterator 来节省内存,但是在 3原创 2014-11-24 20:33:28 · 49899 阅读 · 1 评论 -
python中arange()和linspace()区别
arange()类似于内置函数range(),通过指定开始值、终值和步长创建表示等差数列的一维数组,注意得到的结果数组不包含终值。linspace()通过指定开始值、终值和元素个数创建表示等差数列的一维数组,可以通过endpoint参数指定是否包含终值,默认值为True,即包含终值。原创 2014-11-30 17:06:12 · 51783 阅读 · 3 评论 -
python中的strip()函数简介
函数原型声明:s为字符串,rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符原创 2014-11-24 21:51:12 · 1226 阅读 · 0 评论 -
Python中的sorted()函数以及operator.itemgetter()函数
operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值>>> b(a) 2 >>> b=operator.item转载 2014-11-24 17:33:35 · 1131 阅读 · 0 评论 -
Python的sorted()函数简介
>>> help(sorted)Help on built-in function sorted in module __builtin__:sorted(...) sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list---------------------------------原创 2014-11-24 17:15:43 · 771 阅读 · 0 评论 -
python matplotlib中文显示问题
python中的matplotlib仅支持Unicode编码,默认是不显示中文的,如果让其默认显示中文,可进行如下配置:1、在python的安装目录中找到配置文件: %Python_Home%\Lib\site-packages\matplotlib\mpl-data\matplotlibrc (如,我的是在C:\Python34\Lib\site-packages\matplotl原创 2014-11-30 14:44:47 · 11178 阅读 · 6 评论 -
关于Python中两个列表的比较
比较两个列表对应元素是否相同,关键看阴影部分,for不能直接对数迭代,我们这里可以生成一个list1长度的列表,进行迭代代码如下:原创 2014-11-26 18:01:00 · 31554 阅读 · 0 评论