python_小小小北漂的博客-CSDN博客

python

关注

关注数：文章数：12 文章阅读量：13140 文章收藏量：13

作者: 小小小北漂

自学能力强, 对新技术敏感度高, 能够很快的将新技术运用到实际开发中性格开朗，参与过多个项目的开发，熟悉常见业务处理，具有较强的团队合作意识，能快速融入团队能够承受在一定压力下进行开发，能接受集体加班和非长期(一年及以内)出差，安分守己，踏实敲代码具有良好的英语阅读能力，能阅读英文资料、技术文档等

展开

Python多进程

multiprocessing python多进程模块, 于是, Processing也是多进程的宠儿. 但今天讨论的问题, 似乎也能引起我们一番重视直接上代码: from multiprocessing import Process, Lock err_file = 'error1.log' err_fd = open(err_file, 'w') def put(fd):

转载 2017-09-05 16:52:00 · 426 阅读 · 0 评论
Gensim源代码详解——utils（持续更新中）

#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块包含各种通用实用函数。 """ from __future__

原创 2017-09-20 14:10:43 · 4207 阅读 · 3 评论
python的字典树

#-*-coding:utf-8-*- ''' 字典树测试: python没有指针,但是可以用嵌套字典来实现树结构.对于非ascii的单词,统一用unicode编码来插入与搜索. ''' import time class TrieNode: #这是节点 def __init__(self): ''' 定义节点的数据结构，并初始化，设置标志

原创 2017-09-28 14:58:48 · 526 阅读 · 0 评论
Python中的logging模块就这么用

1、日志级别日志一共分成5个等级，从低到高分别是：DEBUG INFO WARNING ERROR CRITICAL。 DEBUG：详细的信息,通常只出现在诊断问题上 INFO：确认一切按预期运行 WARNING：一个迹象表明,一些意想不到的事情发生了,或表明一些问题在不久的将来(例如。磁盘空间低”)。这个软件还能按预期工作。 ERROR：更严重的问题,软件没能执行一些功能

转载 2017-09-19 20:21:51 · 405 阅读 · 0 评论
python性能优化plus

优化算法时间复杂度算法的时间复杂度对程序的执行效率影响最大，在Python中可以通过选择合适的数据结构来优化时间复杂度，如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式，总得来说，一般有分治，分支界限，贪心，动态规划等思想。减少冗余数据如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。

转载 2017-09-01 16:13:18 · 267 阅读 · 0 评论
Python性能优化的小细节

#-*-coding:utf-8-*- from time import time t = time() list = ['a','b','is','python','jason','hello','hill','with','phone','test', 'dfdf','apple','pddf','ind','basic','none','baecr','var','bana','dd','w

转载 2017-08-28 14:49:35 · 260 阅读 · 0 评论
Python性能优化

1、使用生成器和列表解析一个普遍被忽略的内存优化是生成器的使用。生成器让我们创建一个函数一次只返回一条记录，而不是一次返回所有的记录，如果你正在使用python2.x，这就是你为啥使用xrange替代range或者使用ifilter替代filter的原因。一个很好地例子就是创建一个很大的列表并将它们拼合在一起。 [python] view plain

转载 2017-09-01 15:43:52 · 264 阅读 · 0 评论
基于Python结巴分词（调用自定义词库已经去除停用词）

# -*- coding: utf-8 -*- import time import jieba import jieba.posseg as pseg#用于词性标注 #分词 #停用词过滤 def stop_word(fid1,fid2,fid3): stopword=[] for j in fid2.readlines(): stopword.append(j.

原创 2017-08-08 15:45:13 · 2580 阅读 · 0 评论
python 小结

1、key在使用时必须提供一个排序过程总调用的函数： x = ['mmm', 'mm', 'mm', 'm' ] x.sort(key = len) print x # ['m', 'mm', 'mm', 'mmm'] 2、reverse实现降序排序，需要提供一个布尔值： y = [3, 2, 8 ,0 , 1] y.sort(reverse = True) prin

原创 2017-08-25 14:00:39 · 173 阅读 · 0 评论
Python实现链表

链表的定义：　　链表(linked list)是由一组被称为结点的数据元素组成的数据结构，每个结点都包含结点本身的信息和指向下一个结点的地址。由于每个结点都包含了可以链接起来的地址信息，所以用一个变量就能够访问整个结点序列。也就是说，结点包含两部分信息：一部分用于存储数据元素的值，称为信息域；另一部分用于存储下一个数据元素地址的指针，称为指针域。链表中的第一个结点的地址存储在一个单独的结点

转载 2017-08-25 14:07:51 · 237 阅读 · 0 评论
使用python+机器学习方法进行情感分析(详细步骤)

不是有词典匹配的方法了吗？怎么还搞多个机器学习方法。因为词典方法和机器学习方法各有千秋。机器学习的方法精确度更高，因为词典匹配会由于语义表达的丰富性而出现很大误差，而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类，机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。回复此公众号“web”获取源

转载 2017-09-15 10:58:51 · 1697 阅读 · 1 评论
Gensim源代码详解——dictionary（持续更新中）

#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块实现了字典的概念—单词之间的映射他们的整数id。字典可以

原创 2017-09-19 20:45:03 · 2098 阅读 · 0 评论

python

作者: 小小小北漂

Python多进程

Gensim源代码详解——utils（持续更新中）

python的字典树

Python中的logging模块就这么用

python性能优化plus

Python性能优化的小细节

Python性能优化

基于Python结巴分词（调用自定义词库已经去除停用词）

python 小结

Python实现链表

使用python+机器学习方法进行情感分析(详细步骤)

Gensim源代码详解——dictionary（持续更新中）