![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 54
mantoureganmian
中年,不想上班,想远程办公。熟悉自然语言处理,推荐系统,机器学习。
展开
-
python KMeans聚类加速计算一些简单技巧和坑总结
sklearn kmeans 聚类加速,踩坑原创 2022-10-13 14:43:10 · 3302 阅读 · 0 评论 -
Stanford CoreNLP无法生成实例对象
在服务器上运行Stanford,今日无法启动"StanfordCoreNLP"了,就是运行下面代码一直在运行,不结束,不报错。from stanfordcorenlp import StanfordCoreNLPstd_nlp = StanfordCoreNLP('/data/stanford-corenlp-4.2.0')最后找到原因:后台启动的相关java服务太多了。原因解释StandordCoreNLP底层是Java编写的,在Python生成StanfordCoreNLP实例对象时,这个包原创 2021-04-02 16:59:22 · 178 阅读 · 0 评论 -
python--内建函数、魔法属性--详解
文章目录1.filter,map,reduce2. collections库的函数Counter3. 魔法属性3.1 `__dict__` -- 对象属性3.1.1 dict 与 类对象的相互转化3.2 `__repr__`--实例可视化3.3 `__eq__`---判等,`__hash__`---计算hash值1.filter,map,reducemap是一个将一个或多个序列映射成一个序列的函数。第一个参数为function,function可以是单或多参数。接着是一个或多个序列。例如:注意:如果是原创 2021-02-22 20:06:01 · 173 阅读 · 0 评论 -
mongoDB使用
文章目录前言1. insert_many---mongodb出现E11000 duplicate key error collection(id重复的解决办法)2. update document前言mongoDB使用的点点滴滴,梳理知识框架,集点成面,汇面于体,才有本知识领域的全局观。好比,进山再出山。编程语言:Python3.x、pymongo。1. insert_many—mongodb出现E11000 duplicate key error collection(id重复的解决办法)原因分原创 2021-02-21 23:35:03 · 273 阅读 · 0 评论 -
Python标准-模块版本号命名-PEP-396&PEP-386
文章目录what--这两条讲了什么?why--为什么这么定规则?翻译自PEP 396 – Module Version Numbers和PEP 386 – Changing the version comparison module in Distutilswhat–这两条讲了什么?Python modules, both in the standard library and available from third parties, have long included version numbe翻译 2021-02-21 23:31:56 · 515 阅读 · 0 评论 -
省内存OneHotEncoder
OneHotEncoder 在进行编码时,会将输入的数据先转为numpy.array对象,以此优化速度。这可能会造成文中子类型内存不足,比如:某列中某值是3000000个字符的文本,那么就会造成内存不足。对此,做这这一版超级省内存的。OneHotEncoder还有get_feature_names可以用,所以改写了一个非常节省内存的版本。from sklearn.base import TransformerMixinclass LittleOntHotEncoder(TransformerMix原创 2020-07-05 22:28:32 · 493 阅读 · 0 评论 -
pickle简介及保存defaultdict
pickle是常用的保存对象和数据的工具,总结使用以来碰到的问题对应的解决方法。尤其是,在保存defaultdict的时候遇到了问题,在stackoverflow上得到解答,感觉补充了以前的很多不足,所以在此小结巩固一下。文章目录1. cPickle和pickle2. pickle保存原理粗解2.1 保存defaultdict对象3. pickle2 和 pickle3的区别1. cPickl...原创 2019-09-30 01:16:58 · 1238 阅读 · 0 评论 -
python sqlalchemy--数据炼金术--使用简介
总结和梳理,可能比学习更加重要。记录整理每天所学的一点点sqlalchemy的使用方法。文章目录1. Sqlalchemy做什么2. SQL查询操作3. 批量插入操作1. Sqlalchemy做什么sqlalchemy由SQL和Alchemy组成,直译就是数据炼金术,属于一种ORM工具,与其类似的由Hibernate和MyBatis等。我的感觉是:与普通SQL操作相比,它将数据封装为对象,这...翻译 2019-09-29 22:23:04 · 480 阅读 · 0 评论 -
python 带有默认值的dict 自定义默认值的dict defaultdictbyKey
工作需要,想写一个类似于collections.defaultdict的字典类型,但是每个value需要使用key进行初始化。参看了defaultdict的实现代码,改造了一个新的类型defaultdictByKey。下面先介绍defaultdict的原理再介绍defaultdictByKey.defaultdict的原理defaultdict的直接父类是dict。与dict最大的不同是,当k...原创 2019-07-31 15:50:44 · 4069 阅读 · 1 评论 -
Python2.3-2.7 super 机制 详解
特别声明,运行环境:系统:ubuntu-16.04python版本:2.7.12目录前言用python很长时间了,也看过super的用法,但是想不到前两天写出了一个super的bug,实在惭愧。在网上扒了一通资料,终于彻底解决了bug。也让我感觉自己以前的学习方式实在有问题:学习知识没有深入到原理机制层,只是学了一个表象(不过想想,那时初学基础不深,估计深挖会非常吃力,也要量力而行吧...原创 2019-07-15 10:26:36 · 709 阅读 · 0 评论 -
Python编程-写作的艺术
编程-命名-小技巧-杂记序编程中有各种各样的命名问题,好的命名可以无歧义地准确表达出代码含义,可以提高可读性,简单而且优雅。有很多重要因素,个人梳理如下:英语 词汇量要够,语法要熟悉程序架构 分层清晰,各层抽象明了统一性 同一个实体、概念等用同一个变量要想提高命名能力个人认为:多拜读佳作源码多读多写领域相关英语文章临时编程靠词典样例或者百度下面是我个人编程中...原创 2019-05-20 17:08:03 · 199 阅读 · 0 评论 -
Numpy提取子矩阵
结论想要从numpy的矩阵或者ndarray中提取子矩阵还是使用np.ix_函数最快。另外想不到ndarray速度比matrix要快一下。水平有限,多多斧正。import numpy as np# ndarraymtx = np.random.random((300, 300))a = [1,3,5,7,8,9,12,16,23,45,64,72,89]b = [1,3,5,7,8,...原创 2018-12-28 14:34:36 · 7181 阅读 · 1 评论 -
scipy.sparse稀疏矩阵内积点乘--效率优化!
在使用scipy做程序时,感觉程序的整体速度较慢,或者不是一般的慢,接近于0.5s。所以做了一下优化,其实还是自己对于Scipy和Numpy熟悉度不够!我使用的Scipy版本为“0.19.1”,主要是遇到两个优化点! 在说我的优化之前,先啰嗦下:scipy.sparse的矩阵包中,牵扯到矩阵运算,矩阵的格式优选csr_matrix和csc_matrix。不然速度肯定慢的你怀疑人生。大小矩...原创 2018-06-07 17:07:31 · 12488 阅读 · 6 评论 -
scipy.sparse中的csr删除行
工作需要删除稀疏矩阵的某几行或者列,Google了一下,关于此的信息比较少,官方文档中没有找到相关函数,猜测应该是这个功能不常使用,所以官方没有加入。import scipy.sparse as spimport numpy as npdef del_rows_from_csr_mtx(csr_mtx, row_indices): """ 从csr稀疏矩阵中,删除某几行 ...原创 2018-05-24 18:04:51 · 2092 阅读 · 0 评论 -
全角转半角及其性能优化
新旧两版代码比较旧版代码PY2_FLAG = Truedef full2half_1(str): """ 将字符串的全角符号转半角符号 :param str: 待处理的字符串 :return: 处理后的仅含半角符号字符串 Examples -------- >>> a = u"Hello wo原创 2018-05-11 11:51:47 · 570 阅读 · 0 评论 -
jupyter远程访问linux服务器
Ipython notebook很好用,但是本地机器不能够满足机器学习的硬件要求,怎么使用它访问服务器呢??0.怎么安装ipython,这问题网上很多教程,就不做讲解了,度娘会告诉你。1.我使用的服务器需要使用ssh登陆, 没有学会通过这关。2.远程方法: 首先,在本地Terminal中使用ssh登陆到服务器。 其次,在服务器的Terminal中输入原创 2016-06-17 11:05:50 · 1117 阅读 · 0 评论 -
python len isalpha 中文小坑
python 中len和isalpha使用的小坑原创 2015-12-20 11:53:12 · 3320 阅读 · 0 评论