![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
小小小北漂
自学能力强, 对新技术敏感度高, 能够很快的将新技术运用到实际开发中
性格开朗,参与过多个项目的开发,熟悉常见业务处理,具有较强的团队合作意识,能快速融入团队
能够承受在一定压力下进行开发,能接受集体加班和非长期(一年及以内)出差,安分守己,踏实敲代码
具有良好的英语阅读能力,能阅读英文资料、技术文档等
展开
-
Python多进程
multiprocessing python多进程模块, 于是, Processing也是多进程的宠儿. 但今天讨论的问题, 似乎也能引起我们一番重视 直接上代码: from multiprocessing import Process, Lock err_file = 'error1.log' err_fd = open(err_file, 'w') def put(fd):转载 2017-09-05 16:52:00 · 426 阅读 · 0 评论 -
Gensim源代码详解——utils(持续更新中)
#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块包含各种通用实用函数。 """ from __future__原创 2017-09-20 14:10:43 · 4207 阅读 · 3 评论 -
python的字典树
#-*-coding:utf-8-*- ''' 字典树测试: python没有指针,但是可以用嵌套字典来实现树结构.对于非ascii的单词,统一用unicode编码来插入与搜索. ''' import time class TrieNode: #这是节点 def __init__(self): ''' 定义节点的数据结构,并初始化,设置标志原创 2017-09-28 14:58:48 · 526 阅读 · 0 评论 -
Python中的logging模块就这么用
1、日志级别 日志一共分成5个等级,从低到高分别是:DEBUG INFO WARNING ERROR CRITICAL。 DEBUG:详细的信息,通常只出现在诊断问题上 INFO:确认一切按预期运行 WARNING:一个迹象表明,一些意想不到的事情发生了,或表明一些问题在不久的将来(例如。磁盘空间低”)。这个软件还能按预期工作。 ERROR:更严重的问题,软件没能执行一些功能转载 2017-09-19 20:21:51 · 405 阅读 · 0 评论 -
python性能优化plus
优化算法时间复杂度 算法的时间复杂度对程序的执行效率影响最大,在Python中可以通过选择合适的数据结构来优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式,总得来说,一般有分治,分支界限,贪心,动态规划等思想。 减少冗余数据 如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。转载 2017-09-01 16:13:18 · 267 阅读 · 0 评论 -
Python性能优化的小细节
#-*-coding:utf-8-*- from time import time t = time() list = ['a','b','is','python','jason','hello','hill','with','phone','test', 'dfdf','apple','pddf','ind','basic','none','baecr','var','bana','dd','w转载 2017-08-28 14:49:35 · 260 阅读 · 0 评论 -
Python性能优化
1、使用生成器和列表解析 一个普遍被忽略的内存优化是生成器的使用。生成器让我们创建一个函数一次只返回一条记录,而不是一次返回所有的记录,如果你正在使用python2.x,这就是你为啥使用xrange替代range或者使用ifilter替代filter的原因。一个很好地例子就是创建一个很大的列表并将它们拼合在一起。 [python] view plain转载 2017-09-01 15:43:52 · 264 阅读 · 0 评论 -
基于Python结巴分词(调用自定义词库已经去除停用词)
# -*- coding: utf-8 -*- import time import jieba import jieba.posseg as pseg#用于词性标注 #分词 #停用词过滤 def stop_word(fid1,fid2,fid3): stopword=[] for j in fid2.readlines(): stopword.append(j.原创 2017-08-08 15:45:13 · 2580 阅读 · 0 评论 -
python 小结
1、key在使用时必须提供一个排序过程总调用的函数: x = ['mmm', 'mm', 'mm', 'm' ] x.sort(key = len) print x # ['m', 'mm', 'mm', 'mmm'] 2、reverse实现降序排序,需要提供一个布尔值: y = [3, 2, 8 ,0 , 1] y.sort(reverse = True) prin原创 2017-08-25 14:00:39 · 173 阅读 · 0 评论 -
Python实现链表
链表的定义: 链表(linked list)是由一组被称为结点的数据元素组成的数据结构,每个结点都包含结点本身的信息和指向下一个结点的地址。由于每个结点都包含了可以链接起来的地址信息,所以用一个变量就能够访问整个结点序列。也就是说,结点包含两部分信息:一部分用于存储数据元素的值,称为信息域;另一部分用于存储下一个数据元素地址的指针,称为指针域。链表中的第一个结点的地址存储在一个单独的结点转载 2017-08-25 14:07:51 · 237 阅读 · 0 评论 -
使用python+机器学习方法进行情感分析(详细步骤)
不是有词典匹配的方法了吗?怎么还搞多个机器学习方法。 因为词典方法和机器学习方法各有千秋。 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类,机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。 回复此公众号“web”获取源转载 2017-09-15 10:58:51 · 1697 阅读 · 1 评论 -
Gensim源代码详解——dictionary(持续更新中)
#!/usr/bin/env python # -*- coding: utf-8 -*- # # Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html """ 这个模块实现了字典的概念—单词之间的映射 他们的整数id。 字典可以原创 2017-09-19 20:45:03 · 2098 阅读 · 0 评论