python
文章平均质量分 82
小拳头
“女生,平时要好好护肤,保持身材,多看书,多旅行,有自己的想法,去做自己喜欢的事,培养自信。不要把精力全部用在一个男人身上,成天胡思乱想,像个怨妇,等你变得更好的时候,你会发现所有的事情都会变得很容易了,包括爱情”
展开
-
python challenge 13-16关 攻略
第13关http://www.pythonchallenge.com/pc/return/disproportional.html 点击图片上电话机的5会弹到另一个网页,通过谷歌发现这是一个XML-RPC(XML Remote Procedure Call,即XML远程方法调用),RPC是Remote Procedure Call的缩写,即远程方法调用,是一种在本地原创 2016-06-03 12:26:10 · 1179 阅读 · 1 评论 -
排序算法总结
一、插入排序原理:从第二个元素开始和之前的元素一个一个进行比较,如果比前面的元素小就与之交换,大于等于则继续下一个数的循环。稳定性:稳定时间代价:o(n*n)最好—正序—时间代价o(n)最差—倒序—时间代价o(n*n)平均—乱序—时间代价o(n*n)辅助存储空间:o(1)总结:插入排序的时间复杂度最好的情况是已经是正序的序列,只需比较(n-1)次,时间复杂度为o(n原创 2017-02-06 16:15:21 · 747 阅读 · 0 评论 -
python collections模块中的双端队列
deque是双端队列,是一种具有队列和栈的性质的数据结构,适合于在两端添加和删除。常用的方法:d =deque([]) # 创建一个空的双队列d.append(item) # 在d的右边(末尾)添加项目itemd.appendleft(item) # 从d的左边(开始)添加项目itemd.clear() # 清空队列,也就是删除d中的所有项目d.extend(it原创 2017-06-30 16:38:22 · 1333 阅读 · 0 评论 -
python的eval、exec函数使用总结
eval函数一、函数的作用将字符串str当成有效的表达式来求值并返回计算结果。它要执行的python代码只能是单个运算表达式(不支持任意形式的赋值操作),而不能是复杂的代码逻辑。 二、函数的定义eval(expression, globals=None, locals=None)参数说明:expression:必选参数,可以是字符串,也可以是一个任意的code对象实例(原创 2017-07-13 12:11:06 · 4511 阅读 · 0 评论 -
爬虫常用的三种通用模板小结
确实有一段时间没怎么写爬虫了,最近又安排了写爬虫的任务,其实很多东西写过一份,之后再做大部分是复制粘贴代码,然后修改一下。所以这里总结一下通用的地方,方便之后编写爬虫的时候,可以直接取用。一、使用urllib2库对于一些简单的网站,需要获取的信息又是以json格式返回时,我一般喜欢用urllib2库直接写爬虫获取。 代码模板:import urllib2impor原创 2017-07-18 15:17:10 · 4782 阅读 · 0 评论 -
python装饰器学习小结
一、应用场景装饰模式有很多经典的使用场景,例如插入日志、性能测试、事物处理等等,有了装饰器,就可以提取大量函数中与本身功能无关的类似代码,从而达到代码重用的目的。好好利用装饰器可以方便代码结构,让代码更清晰可观。 二、几个简单的入门例子现在我们需要通过代码来得到一个函数的大概执行时间,写法如下:import timedefget_time(func): startTi原创 2017-07-23 21:32:23 · 560 阅读 · 0 评论 -
python异常处理
一、try/except语句作用:用来检测try语句块中的错误,从而让except语句捕获异常信息并处理。如果你不想在异常发生时结束你的程序,只需在try里捕获它。 语法:一个简单的try...except...else的语法try: # 运行别的代码except # 如果在try部分引发了’name’异常except , : # 如果引发了’name’原创 2017-07-25 17:53:30 · 720 阅读 · 0 评论 -
python的yield使用
在python中,yield被称之为generator(生成器)。下面举个小例子来理解,yield在程序是怎么执行的代码:def func(): print "begin" yield 1 print "mid" yield 2 print "end" f = func()f.next() //1f.next() //2f.next原创 2017-08-05 15:42:22 · 503 阅读 · 0 评论 -
编程语言相关知识点梳理
c++语言常考点c语言常考点1 c中的空类 默认产生哪些类成员函数2 单例模式的特点是什么用c实现单例模式3 c中不同数据类型所占用的内存大小4 编写类String的构造函数 析构函数和赋值函数5 引用和指针有什么区别6 c如何连接数据库7 c模板8 c中new malloc的区别9 c中头文件h和源文件cpp的区别10 头文件中的ifndef define endif的作用1原创 2017-05-03 23:33:20 · 3578 阅读 · 2 评论 -
python读取excel文件
一、读excelimport xlrddef open_excel(filename): # 打开文件 xlrd.Book.encoding = "urf-8" try: data = xlrd.open_workbook(filename) return data except Exception, e: print str(e)def excel_tab原创 2016-06-28 11:24:05 · 904 阅读 · 0 评论 -
scrapyd部署总结
一、前言由于毕设要做一个集成爬虫、文本分析和可视化的网站。需要将爬虫部署到网站上去供不懂技术的人使用。因此开始了研究scrapy+django。找了多方面的资料终于找到了我想要的,那就是scrapyd。网站通过http就可以从scrapyd上管理后台的爬虫了。二、环境安装安装scprayd,网址:https://github.com/scrapy/scrapy安装scrap原创 2016-11-14 21:10:01 · 16410 阅读 · 2 评论 -
python challenge 7-12关 攻略
第7关http://www.pythonchallenge.com/pc/def/oxygen.html没有提示,源代码也是什么都没有。好吧。只有一张图片,而且这张图片也挺奇怪的,为什么中间有一横条,感觉有什么玄机。我们能处理的也只有这张图片了。谷歌学习Python的图像处理Python Imaging Library(PIL)代码:lxim = Ima原创 2016-05-29 23:27:51 · 756 阅读 · 0 评论 -
python challenge 0-6关 攻略
在逛北邮人论坛python版时看到暖神推荐的python challenge这个编程通关小游戏,挺有意思的,还能用来练python。一直觉的自己会的太少,但是又不知道该从哪补起,该看些什么。这个编程小游戏对我这种菜鸟用来查漏补缺简直太好用了。按原计划五月得完成所有python练习和教程,下个月正式开始刷leetcode。时间很紧张啊。加油!第0关http://www.p原创 2016-06-03 12:22:09 · 949 阅读 · 1 评论 -
使用新浪微博官方API抓取微博数据(Python版)
一、安装环境从网站:http://github.liaoxuefeng.com/sinaweibopy/ 下载安装SDK,然后就可以看一下网站:https://github.com/michaelliao/sinaweibopy/wiki/OAuth2-HOWTO 的说明二、一个简单的例子# coding=utf-8from weibo import APIClien原创 2016-10-31 15:27:29 · 17575 阅读 · 2 评论 -
numpy中一些常用函数的用法总结
先简单记录一下,后续补充详细的例子1. strip()函数s.strip(rm):s为字符串,rm为要删除的字符序列只能删除开头或是结尾的字符或者字符串。不能删除中间的字符或是字符串当rm为空时,默认删除空白符(包括'\n','\r','\t',' ')2.map()函数原型map(function, iterable,...)对可迭代函数'iterab原创 2016-12-02 11:22:19 · 8335 阅读 · 1 评论 -
python初步实现word2vec
一、前言一开始看到word2vec环境的安装还挺复杂的,安了半天Cygwin也没太搞懂。后来突然发现,我为什么要去安c语言版本的呢,我应该去用python版本的,然后就发现了gensim,安装个gensim的包就可以用word2vec了,不过gensim只实现了word2vec里面的skip-gram模型。若要用到其他模型,就需要去研究其他语言的word2vec了。 二、语料准备有原创 2016-12-12 16:08:38 · 48068 阅读 · 44 评论 -
文本聚类算法之K-means算法的python实现
一、算法简介算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得的一个“中心对象”来进行计算的。 基本思想:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。 算原创 2016-12-08 11:52:24 · 9239 阅读 · 2 评论 -
文本聚类算法之一趟聚类(One-pass Cluster)算法的python实现
一、算法简介一趟聚类算法是由蒋盛益教授提出的无监督聚类算法,该算法具有高效、简单的特点。数据集只需要遍历一遍即可完成聚类。算法对超球状分布的数据有良好的识别,对凸型数据分布识别较差。一趟聚类可以在大规模数据,或者二次聚类中,或者聚类与其他算法结合的情况下,发挥其高效、简单的特点; 算法流程:1. 初始时从数据集读入一个新的对象2. 以这个对象构建一个新的簇3. 若达到数原创 2016-12-08 11:57:14 · 12008 阅读 · 4 评论 -
文本聚类算法总结
文中的概念和定义部分摘自于百度百科和一些论文中,把我觉得写的不错的解释和语句放上来供大家参考。 一、文本聚类定义 文本聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重原创 2016-12-08 17:30:13 · 9428 阅读 · 0 评论 -
python踩过的一些坑
找完工作,又开始忙于做毕设,很久没更新博客了,不过博客新上线的这个新界面太不好用了,分类下只有两篇文章,每次点击进去都出现很多篇其他类的,每次找一篇博文都要翻很久。体验真是极差。废话不多说,先记几个做毕设过程中发现的小坑1、jieba分词生成迭代器,在第二次for循环会失效测试代码:用jieba分词生成的word_list是个迭代器,第二个for里面原创 2017-12-06 16:33:23 · 837 阅读 · 0 评论