python
文章平均质量分 69
aturbofly
小硕一枚,码农一个。酷爱编程。热爱互联网。目前主要从事自然语言处理,推荐方面的算法开发。
研究生期间的研究方向:推荐系统。
展开
-
Python中if __name__ == '__main__'的作用
#hello.pydef sayHello():str="hello"print(str);if__name__=="__main__":print ('This is main of module "hello.py"')sayHello()python作为一种脚本语言,我们用python写的各个module都可以包含以上那么一转载 2013-11-09 19:01:35 · 1178 阅读 · 0 评论 -
主题建模入门指南(python)
简介所谓分析,通常都是指从数据中获取“信息”。近来,随着数据迅猛增长——其中绝大多数数据是非结构的,要想获得相关想要的信息变成越来越困难。庆幸地是,与此同时出现了一些强大的方法来帮助我们从这些数据中抽取出我们想要的信息。文本挖掘领域中这样相关的一种技术是主题建模。正如其名,主题建模能够从一个文本对象中自动识别它的主题,并且发现隐藏的模式。这些能够帮助做出更好的决策。主题建模和那些基于规则的文本挖掘方翻译 2017-02-22 22:33:55 · 7291 阅读 · 0 评论 -
python字符串过滤性能比较
总共比较5种方法。直接看代码:import randomimport timeimport osimport stringbase = string.digits+string.punctuationtotal = 100000def loop(ss): """循环""" rt = '' for c in ss: if c in '0123456789原创 2017-02-11 09:21:37 · 2599 阅读 · 0 评论 -
深入理解python元类
类和对象在理解什么是元类之前,有必要先理解下,什么是类。什么是类?通俗的讲,类就是用来创建对象的代码片。在python中,类还有一个奇特的特性,就是类,本身也是一个对象。怎么理解?——在你定义一个类的时候,就会在内存中创建一个名字为类名的对象。能够创建对象(实体)的对象(类),就称之为类。(说起来很别扭,但大致就是这么个意思)。既然是一个对象,那就可以:将它分配给一个变量复制它给它添加属性原创 2017-01-09 20:57:18 · 5662 阅读 · 1 评论 -
Python文本操作相关模块
linecache——通过使用缓存在内部尝试优化以达到高效从任何文件中读出任何行。 主要方法: linecache.getline(filename, lineno[, module_globals]):获取指定行的内容 linecache.原创 2017-02-07 13:35:19 · 1064 阅读 · 0 评论 -
__slots__为什么能节省内存?
注:本文是对http://www.datadependence.com/2016/07/pythonic-code-video-series-slots/ 的翻译。说是翻译,但不会逐字逐句翻译。宗旨是回答标题的问题,所以也会增加自己的理解。 很多人都看过Oyster.com的这篇相当当的文章: SAVING 9 GB OF RAM WITH PYTHON’S _SLOTS_ 为了能够理解_翻译 2017-01-10 23:06:27 · 1730 阅读 · 0 评论 -
Python文本处理之按行处理大文件
以行的形式读出一个文件最简单的方式是使用文件对象的readline()、readlines()和xreadlines()方法。 Python2.2+为这种频繁的操作提供了一个简化的语法——让文件对象自身在行上高效迭代(这种迭代是严格的向前的)。 为了读取整个文件,可能要使用read()方法,且使用字符串的split()来将它拆分WEIGHT行或其他块。下面是一些例子: >>> for翻译 2017-02-06 11:28:54 · 9165 阅读 · 0 评论 -
python描述符详解
本文主要介绍描述符的定义,个人的一些理解;什么是数据描述符;什么是非数据描述符;描述符的检测等。希望看完这篇文章后,你对描述符有了更清晰的认识。知道怎么判断一个对象是不是描述符,知道如果定义一个描述符,知道什么是该用描述符。当然,最大的目的是,通过学习描述符,让你对python这门语言有更多深入的认识。原创 2017-01-06 15:14:06 · 5871 阅读 · 2 评论 -
python自定义模块构建、发布及安装
1、关于setup.pysetup.py脚步的用途之一是充当可执行文件,你可以运行它来打包软件并将其上传到发布服务器上。编写自己的自定义模块,并且希望能够开源的话,打包自己的项目是必须的。而打包的必要条件是在你的项目里面有可执行的setup.py。2、setup.py参数说明最常用的meta-data参数如下表: 其他重要的参数包括: 1)、packages 告诉Di原创 2016-10-06 16:17:21 · 5924 阅读 · 0 评论 -
(python)创建一个可以比较的自定义类
示例:对于论坛中的帖子,需要根据帖子的点赞数,浏览数和评论数进行排序。三个排序标准的优先级顺序为:点赞数>浏览数>评论数。也就是说,先按点赞数排序,如果点赞数相等,其次才按浏览数,最后才是评论数。实现:class Post: """""" def __init__(self,postname='',zan_num=0,view_num=0,reply_n原创 2016-06-24 09:19:44 · 3949 阅读 · 0 评论 -
超实用的python日期处理笔记
从一个字符串开始>>time_str='2008-08-08 08:08:08' 1.1.转换为struct_time形式的时间 >>struct = ime.strptime(time_str,'%Y-%m-%d %H:%M:%S') time.struct_time(tm_year=2008, tm_mon=8, tm_mday=8, tm_ho原创 2015-04-03 16:39:25 · 1131 阅读 · 0 评论 -
中文文本的字数统计(不包括标点符号且考虑英文/数字序列)
#-*-coding=utf-8 -*-"""统计一遍中文文章的字数(不包括标点符号,考虑英文/数字序列(不拆分成当个字母或数字)"""import reimport jiebac = "\\"text = """然而,在参加string聚会或者出席典礼时,很多人会抱怨自己挑不出一件拿得出手的裙子。望着摆满了鞋子的鞋架,发觉自己花了这么多钱,却选不出一双满意的鞋子。梳妆台上摆满了化妆品原创 2017-02-15 15:54:21 · 5876 阅读 · 0 评论