python
artemisrj
这个作者很懒,什么都没留下…
展开
-
python进行词性分析
表示python的nltk包真的很好用,本来想着原创 2014-11-18 15:13:53 · 10341 阅读 · 0 评论 -
python的性能优化
看到有人在用Python实现了Word2vec之后,然后发现性能太差,然后进行优化的尝试。 不过对于Word2vec,优化的主要在于计算吧。 一个方面是关键的部分交给C来实现,另外一个优化策略是并行。 http://rare-technologies.com/word2vec-in-python-part-two-optimizing/原创 2016-03-07 20:48:14 · 507 阅读 · 0 评论 -
matplotlib examples 散点图
找matplotlib来画散点图,发现官网的例子其实给得最简明清晰啦。 二维散点图: http://matplotlib.org/examples/shapes_and_collections/scatter_demo.html 三维散点图: http://matplotlib.org/examples/mplot3d/scatter3d_demo.html 更多例子: http://m原创 2016-03-08 16:13:53 · 1249 阅读 · 0 评论 -
python的各种问题
今天某人突然问我,python怎么调试,我愣住了http://www.ibm.com/developerworks/cn/linux/l-cn-pythondebugger/index.html原创 2015-01-27 20:37:45 · 402 阅读 · 0 评论 -
python安装
我真是没用定性的孩子,啃了N多天论文后终于开始sha'sha'sha原创 2014-08-22 11:02:28 · 581 阅读 · 0 评论 -
用pattern进行自然语言处理
http://www.clips.ua.ac.be/patternpattern是一个网络数据挖掘的一个工具,分为几个模块pattern.web 是用来在网络抓取数据的,pattern.en 是用来处理英文文本的pattern.search是用来检索特定规律的词汇的 pattern.vector是用来分类的原创 2014-11-27 22:23:31 · 5789 阅读 · 0 评论 -
python库
虽然说想找什么库搜一下比较方便,但是觉得还是应该记录一下自己用过的库们。这个网址收藏了常用的科学开源库吧 http://www.lfd.uci.edu/~gohlke/pythonlibs标准库优化toolz iterators, functions, and dictionaries的使用函数 https://pypi.python.org/pypi/toolz http://tool原创 2016-03-06 15:43:56 · 617 阅读 · 0 评论 -
sense2vec
https://spacy.io/blog/sense2vec-with-spacy这篇论文讲了sense2vec.这个作者也做了 https://spacy.io/ 这个库还是参与了这个库。然后再加上gensim。其实也没错。原创 2016-02-29 14:29:55 · 1129 阅读 · 0 评论 -
[编程题]地域划分
现在有一块长条形的土地,这个土地我们可以看成是由n块小方格连接而成的(这些小方格我们可以将之编号为1到n)。而我们需要将其划分成两个部分,分别种上不同的作物(即作物A和B),划分必须在某两个小方格之间进行,或者在土地的最左端或最右端,若划分在第i块到第i+1块间进行,则划分后,第1至第i块地种A,剩下的地种B。现在有一些专家对土地进行了检测,他们每个人评估了每块土地适合种的作物。请你找到一个合适的划原创 2016-04-25 20:26:56 · 423 阅读 · 0 评论 -
numpy
import numpy as nplist 转 arraylist=[]a = np.array(list)array 转listb = a.tolist()原创 2016-01-05 22:23:00 · 594 阅读 · 0 评论 -
[编程题]树上最长单色路径
[编程题]树上最长单色路径对于一棵由黑白点组成的二叉树,我们需要找到其中最长的单色简单路径,其中简单路径的定义是从树上的某点开始沿树边走不重复的点到树上的另一点结束而形成的路径,而路径的长度就是经过的点的数量(包括起点和终点)。而这里我们所说的单色路径自然就是只经过一种颜色的点的路径。你需要找到这棵树上最长的单色路径。 给定一棵二叉树的根节点(树的点数小于等于300,请做到O(n)的复杂度),请返原创 2016-04-27 11:07:39 · 448 阅读 · 0 评论 -
字符翻转
对于一个给定的字符串,我们需要在线性(也就是O(n))的时间里对它做一些变形。首先这个字符串中包含着一些空格,就像”Hello World”一样,然后我们要做的是把着个字符串中由空格隔开的单词反序,同时反转每个字符的大小写。比如”Hello World”变形后就变成了”wORLD hELLO”。输入描述: 给定一个字符串s以及它的长度n(1≤n≤500)输出描述: 请返回变形后的字符串。题目保证原创 2016-04-22 21:58:21 · 788 阅读 · 0 评论 -
python数据库SQLite
python和SQLlite ,SQLite是内嵌数据库import sqlite3cx=sqlite3.connect("D:/database.db")cur=cx.cursor()#cur.execute('create table users(login varchar(8),uid integer)')cur.execute('insert into users values原创 2015-02-01 13:42:20 · 946 阅读 · 0 评论 -
Python的基础函数
python 开发文档镇楼。 https://docs.python.org/2/index.html关于代码python的合理布局(1)起始行 (2) 模块文档 (3)模块导入 (4)变量定义 (5)类定义 (6)函数定义 (7)主程序文档编码#encoding: utf-8 # 设置系统编码 import codecs codecs.open("loc,txt","w","ut原创 2016-03-06 15:55:36 · 705 阅读 · 0 评论 -
python的一些问题以及处理思路
直接用f=open(),f.write()的时候,有时候会碰到,UnicodeEncodeError: 'ascii' codec can't encode character u'这个错误,这个错误是在把 unicode 的编码转化为 ascii的时候映射不了时候出现的,也就是说,write()这个函数,会自动把字符串编码为ascii再存?所以为了解决这个问题,引入 codecs 模块原创 2015-10-31 19:15:30 · 537 阅读 · 0 评论 -
EMD算法
http://download.csdn.net/detail/artemisrj/9442797原创 2016-02-25 09:56:10 · 6907 阅读 · 0 评论 -
自然语言处理的一些工具
斯坦福的corenlp,可以用来entities的提取。 http://nlp.stanford.edu/software/corenlp.shtml关于情感分析情感分析的词库,sentiment Word wordnet 是近义词词典 sentiwordnet 基于wordnet的,现在已经 3.0了 http://sentiwordnet.isti.cnr.it/ sentiwor原创 2016-03-06 13:43:57 · 7935 阅读 · 0 评论 -
python对于已知文件名进行pdf批量下载
因为某些原因要收集一系列pdf,于是就想用搜索引擎自动搜索文件名,然后根据返回页面pdf文件的检查,如果有相应的pdf,那么就下载第一个pdf链接,并在同时用readme文件来记录相应的下载情况,因为只是临时用用,本着性价比的原则程序写得不是很完善。import osimport urllibimport re def cbk(a,b,c): per = 100原创 2015-01-27 13:30:32 · 1116 阅读 · 0 评论 -
python爬虫图片下载
这次因为要帮人找素材,http://ieeexplore.ieee.org 要帮找某个期刊的图片,这个期刊比较好的一点就是它把所有的论文图片都放在了网上,一个个链接打开太麻烦,所以就把东西全下下来了。爬虫代码主要参考下面这位博主。http://www.cnblogs.com/chenkun24/archive/2012/10/06/2713348.html1.首先我要获原创 2015-01-05 22:36:35 · 787 阅读 · 0 评论 -
python断点
http://blog.chinaunix.net/uid-26058276-id-1741956.html在开头引入pdbimport pdb在语句中插入断点pdb.set_trace()以上的是代码中的,下面是在弹出对话框中的 继续 c查看变量vpp v原创 2015-03-04 10:05:57 · 852 阅读 · 0 评论 -
python 模块导入问题
因为安装jython的原因,就去探究了一下模块路径的问题,这里指代python第一个是路径列表sys.path这个语句可以看路径的情况如果想要添加路径,那么sys.path.append('')import 可以导入相对路径下的模块,可以导入执行文件,如果想要重复导入的话,用reload,import mymodule#在相对目录下有个叫做mymodule.py的文件r原创 2015-04-08 21:21:35 · 460 阅读 · 0 评论 -
jython
http://www.jython.org/ 下载安装包,然后安装python和java的扩展包然后添加路径C:/jython2.5.2/jython.jar; 加到classpath中C:/jython2.5.2;C:/jython2.5.2/Lib; 加到path中然后打开jython的包,demo里面的例子运行成功便原创 2015-04-08 12:50:16 · 527 阅读 · 0 评论 -
python编码的问题
我的是windows系统,u'\xe9 是拉丁字母cafe的e吧一个是ascii 'ascii' codec can't encode character u'\xe9' in position 7: 这是在文件写的时候发送的 f.write()的时候http://stackoverflow.com/questions/19833440/unicodeencodeerror原创 2015-04-01 15:54:54 · 530 阅读 · 0 评论 -
BeautifulSoup处理html
官网http://www.crummy.com/software/BeautifulSoup/#Download 这个是中文文档http://zm6.sm-img2.com/?src=http%3A%2F%2Fwww.crummy.com%2Fsoftware%2FBeautifulSoup%2Fbs3%2Fdocumentation.zh.html&uid=51558658fb2原创 2015-09-15 15:58:49 · 995 阅读 · 0 评论 -
英语断句
一种方式是利用nltk的断句功能 http://www.nltk.org/api/nltk.tokenize.html nltk.tokenize.punkt 模块断句的问题:简单的断句虽然可以利用一些标点符号断句,但是这里面有个问题是比如姓氏 Mr. Smith这样的句子,断句就会有问题。这个模块需要大的预料库进行训练 。 用法也很简单>>> import nltk.data>>> te原创 2016-01-07 22:09:40 · 2931 阅读 · 0 评论 -
python转C的内存泄露问题
python的内存管理是引用机制,然后如果变量的引用数不减的话,那么即使使用内存回收也是然并卵的效果。 python转C的扩展的时候,C是可以对python的引用机制进行人为增减的,所以就导致可能的内存泄露。 使用swig等工具模板,可能能够避免手工忘记的一些问题,但是,如果你原来的代码仍然是存在内存泄露的话,那么还是会产生最终的内存泄露。 记得一定要在加了引用计数之后减引用计数!!! 这里原创 2015-12-01 10:46:26 · 1343 阅读 · 1 评论 -
Python Flask
flask 的网址 http://flask.pocoo.org/docs/0.10/installation/flask基于两个外部库,Werkzeug http://werkzeug.pocoo.org/ 以及jinjahttp://jinja.pocoo.org/ 。Werkzeug是一个WSGI规范的实用函数库。服务器和应用程序的接口,jinja是渲染模板的。python要求原创 2015-03-05 20:58:52 · 764 阅读 · 0 评论 -
[编程题] 偶数大翻转
今天的计算机课上,老师给同学们出了一道题: 输入n个数,请将其中的偶数的二进制反转。 eg:输入1 6 5 其中6是偶数,二进制表示为110,反转后为011,代表3,所以最终输出1 3 5. 小贱君最近脑子不怎么好使,想了半天也没想出来如何做,最后他向你寻求帮助了,帮帮可怜的小贱君吧!输入描述:输入包含多组测试数据。对于每组测试数据:N — 输入的数字个数N个数:a0,a1,…,an-1保证原创 2016-08-06 12:38:43 · 1199 阅读 · 0 评论