- 博客(683)
- 资源 (104)
- 收藏
- 关注
原创 马尔科夫模型 Markov Model
http://blog.csdn.net/pipisorry/article/details/46618991生成模式(Generating Patterns)1、确定性模式(Deterministic Patterns):确定性系统 考虑一套交通信号灯,灯的颜色变化序列依次是红色-红色/黄色-绿色-黄色-红色。这个序列可以作为一个状态机器,交通信号灯的不同状态都紧跟着上一个状态。...
2015-06-24 10:34:20 117703 3
原创 pyQT实现自动找茬游戏
找茬游戏地址[美女大家来找茬]游戏窗口探查下载PyWin32库(对windows接口的Python封装)http://sourceforge.net/projects/pywin32/,但不能直接点Download图标,不然下下来是一个Readme.txt,点“Browse All Files”寻找需要的版本。使用spy++找到窗口句柄(或者找到窗口类名lpClassN
2015-06-19 21:18:53 4778
原创 pyQT指定窗口截图
问题:如果要搜索的外部程序的窗口标题比较容易得到[],问题是比较简单的。如果窗口的标题不固定或者根本就没有标题,怎么得到窗口的类呢?IntroductionSpy++是微软出品的用来获取Window窗口信息的一个小工具。Spy++中,最常用的一个功能,就是识别窗口。获取当前鼠标位置; 获取位于指定位置的窗口句柄; 获取窗口类别; 获取窗口内容或标题。Spy++ (SPYXX
2015-06-19 10:55:42 15912
原创 microsoft excel使用技巧和问题解决
一种方法是先将所有分割符替换成n长的空格,取右边n长数据,再去除空格,最后取其值comb_pred_life_***_catl1_Y_120***1就变成了120***1。
2015-06-15 17:51:36 5405 1
原创 Practical Machine Learning实用机器学习 章1
http://blog.csdn.net/pipisorry/article/details/46490177实用机器学习Practical Machine Learning courses学习笔记Practical Machine Learning实用机器学习1.1 Prediction motivation预测的动机课程概览About this courseTh
2015-06-14 11:33:01 4678
原创 主题模型TopicModel:通过gensim实现LDA
http://blog.csdn.net/pipisorry/article/details/46447561使用python gensim轻松实现lda模型。gensim简介Gensim是一个相当专业的主题模型Python工具包。在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感情
2015-06-10 22:27:18 25274 5
原创 编辑距离Edit distance
http://blog.csdn.net/pipisorry/article/details/46383947编辑距离Edit distance-序列之间的距离我们知道,汉明距离可以度量两个长度相同的字符串之间的相似度,如果要比较两个不同长度的字符串,不仅要进行替换,而且要进行插入与删除的运算,在这种场合下,通常使用更加复杂的编辑距离(Edit distance, Levenshtein dist
2015-06-06 00:53:44 5796
原创 python类:面向对象、继承、slot、多重继承
http://blog.csdn.net/pipisorry/article/details/46381341python面向对象基础知识面向对象的三大特性:封装、继承和多态。[Python 面向对象(初级篇)]皮皮Blog继承在Python中,同时支持单继承与多继承,一般语法如下:class SubClassName(ParentClass1 [, Pare...
2015-06-05 20:38:07 5228
原创 计算机领域国际会议分类及排名
http://blog.csdn.net/pipisorry/article/details/46302623core 会议及期刊排名[CORE Computer Science Conference Rankings]官网[CORE Rankings Portal]core conference pdf下载[CORE Ranking of Conferences and Jornals in C
2015-06-01 11:36:49 5512
原创 windows cmd命令行命令
合并文件C:\Users\Administrator\Desktopdircopy *.txt all.txt#pausefrom:
2015-05-28 16:28:47 5645
原创 python注解
注解是 Python 3 中的一个新元素。下面类型检查机制将会以一个装饰器的形式实现。[装饰器]类型检查器的一个例子def gcd(a, b): '''Return the greatest common divisor of a and b.''' a = abs(a) b = abs(b) if a < b: a, b = b
2015-05-26 16:14:43 6791 1
原创 数学计算相关算法
http://blog.csdn.net/pipisorry/article/details/46008603欧几里德算法欧几里德算法又称辗转相除法,用于计算两个整数a,b的最大公约数。计算原理定理:gcd(a,b) = gcd(b,a mod b) 证明:a可以表示成a = kb + r ,则r = a mod b假设d是a,b的一个公约数,则有 d|a, d|b,而r = a - kb,因此d
2015-05-26 15:33:12 1934
原创 PyQt5教程 - QtDesigner窗口设计工具的使用
http://blog.csdn.net/pipisorry/article/details/45999965pyqt提供了Qt designer来设计窗口界面,用起来也非常方便,虽然做出来的界面不那么华丽。pycharm菜单栏 > tools > external tools > Qt Designer > 打开PyQt5的Qt Designer,会自动弹出新建窗体new form对
2015-05-26 01:08:27 139753 11
原创 python模块 - copy模块
http://blog.csdn.net/pipisorry/article/details/45830941copy模块之浅拷贝与深拷贝copy模块用于对象的拷贝操作。该模块只提供了两个主要的方法:copy.copy与copy.deepcopy,分别表示浅复制与深复制。直接赋值,深拷贝和浅拷贝的区别直接赋值:简单地拷贝对象的引用,两个对象的id相同。就是对象的引用(别名),就是给...
2015-05-18 23:16:05 23200 4
原创 主题模型TopicModel:LDA编程实现
http://blog.csdn.net/pipisorry/article/details/45771045LDA的python实现LDA的c/c++实现
2015-05-16 20:53:35 15073 1
原创 django数据库错误相关问题
http://blog.csdn.net/pipisorry/article/details/45727309django数据库错误相关问题问题:字段修改属性发生错误>python manage.py makemigrationsYou are trying to add a non-nullable field 'price_monthly' to product wi
2015-05-14 22:20:25 79008 2
原创 Django项目实践3 - Django模型(字段、数据库操作及模型继承)
http://blog.csdn.net/pipisorry/article/details/45725953Django数据库字段类型(Field types)AutoFieldclass AutoField(**options)它是一个根据 ID 自增长的 IntegerField 字段。通常,你不必直接使用该字段。如果你没在别的字段上指定主键,Django 就
2015-05-14 20:51:32 13787 1
原创 todotodo
http://blog.csdn.net/pipisorry/article/details/45721521todotodofrom:
2015-05-14 15:35:39 3419
原创 主题模型TopicModel:主题模型LDA的应用
http://blog.csdn.net/pipisorry/article/details/45665779应用于推荐系统在使用LDA(Latent Dirichlet Allocation)计算物品的内容相似度时,我们可以先计算出物品在话题上的分布,然后利用两个物品的话题分布计算物品的相似度。比如,如果两个物品的话题分布相似,则认为两个物品具有较高的相似度,反之则认为两个物品的相似
2015-05-12 10:10:16 20357
原创 linux通配符和正则表达式
http://blog.csdn.net/pipisorry/article/details/24143801通配符(bash 操作)在 bash 操作环境中还有一个非常有用癿功能,那就是通配符 (wildcard) ! 用 bash 处理数据就更方便了!常用通配符[::] 见下表POSIX字符组 除了通配符外,bash 环境中的特殊符号Note:...
2015-05-08 09:26:13 2782
原创 numpy线性代数基础 - Python和MATLAB矩阵处理的不同
http://blog.csdn.net/pipisorry/article/details/39087583在介绍工具之前先对理论基础进行必要的回顾是很必要的。没有理论的基础,讲再多的应用都是空中楼阁。本文主要设涉及线性代数和矩阵论的基本内容。先回顾这部分理论基础,然后给出MATLAB,继而给出Python的处理。个人感觉,因为Python是面向对象的,操纵起来会更接近人的正常思维;
2015-05-07 17:12:28 6581
原创 Git版本控制:Github的使用之 多人协作及参与项目
http://blog.csdn.net/pipisorry/article/details/45532883本文是关于如何创建一个github项目,让多人团队共同开发一个项目。Git多人协作首先在github上创建一个repository项目,当然根据[Git版本控制教程 - Git远程仓库]自己可以随便将本地修改push到github上。对于其它合作者,只要将其加入到项目合
2015-05-06 10:46:14 30199 3
原创 主题模型TopicModel:主题模型可视化
http://blog.csdn.net/pipisorryBrowse LDA Topic ModelsThis package allows you to create a set of HTML files to browse a topic model.It creates a word cloud and time-graph per topic, and annotat
2015-04-29 19:20:33 8745
原创 python模块 - 序列化模块pickle
http://blog.csdn.net/pipisorrypython的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。基本接口: pickle.dump(obj, file, [,protocol]) 注解
2015-04-27 20:50:22 15785
原创 python中文分词工具:结巴分词jieba
http://blog.csdn.net/pipisorry/article/details/45311229结巴分词jieba特点 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分...
2015-04-27 15:39:36 9490
原创 主题模型TopicModel:LDA的缺陷和改进
http://blog.csdn.net/pipisorry/article/details/45307369LDA的缺陷和改进1. 短文本与LDAICML论文有理论分析,文档太短确实不利于训练LDA,但平均长度是10这个数量级应该是可以的,如peacock基于query 训练模型。有一些经验技巧加工数据,譬如把同一session 的查询拼接,同一个人的twitter
2015-04-27 10:57:16 30463 5
原创 python多线程
http://blog.csdn.net/pipisorry/article/details/45306973CPU-bound(计算密集型) 和I/O bound(I/O密集型) I/O bound 指的是系统的CPU效能相对硬盘/内存的效能要好很多,此时,系统运作,大部分的状况是 CPU 在等 I/O (硬盘/内存) 的读/写,此时 CPU Loading 不高。...
2015-04-27 10:41:33 2152
原创 操作系统服务:time时间模块+datetime模块
datetime.date:表示日期的类。常用的属性有year, month, day;datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond;datetime.datetime:表示日期时间的类。datetime.timedelta:表示时间间隔,即两个时间点之间的长度。datetime.tzinfo:与时区有关的相关信息。(这里不详细充分讨论该类,感兴趣的童鞋可以参考python手册)
2015-04-25 16:36:09 4290
原创 python爬虫 - scrapy的安装和使用
http://blog.csdn.net/pipisorry/article/details/45190851Crawler Framework爬虫框架scrapy简介Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy = Scrach+Python。Scrapy用途广泛,可以用于数据挖掘、监测和自
2015-04-22 09:59:08 20433 2
翻译 Python常见编程错误和陷阱
http://blog.csdn.net/pipisorry/article/details/45175457Introduction本文介绍python编程中常见的错误的陷阱潜在的Python陷阱沉迷于一行程序许多人热衷于一行程序带来的兴奋感。即使他们的一行解决方案比一个多行解决方案低效,他们也会吹嘘。Python中的一行程序在本质上意味着具有多个表达式的复杂
2015-04-21 20:28:26 16666 1
原创 Python模块 - itertools循环器模块
http://blog.csdn.net/pipisorry/article/details/45171451迭代工具库itertools 和collections库一样,还有一个库叫itertools,对某些问题真能高效地解决。itertools模块包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如...
2015-04-21 15:54:58 8077
原创 操作系统服务:logging日志记录模块
http://blog.csdn.net/pipisorry/article/details/45151825许多应用程序中都会有日志模块,用于记录系统在运行过程中的一些关键信息,以便于对系统的运行状况进行跟踪。在.NET平台中,有非常著名的第三方开源日志组件log4net,c++中,有人们熟悉的log4cpp。而在python中,我们不需要第三方的日志组件,因为它已经为我们提供了
2015-04-20 16:21:39 3102
原创 Django项目实践3 - Django模型(view-数据库)
http://blog.csdn.net/pipisorry/article/details/45061579Django 模型{数据和逻辑能够彻底地分开}视图负责处理一些主观逻辑,然后返回响应结果。在当代 Web 应用中,主观逻辑经常牵涉到与数据库的交互。 数据库驱动网站 在后台连接数据库服务器,从中取出一些数据,然后在 Web 页面用漂亮的格式展示这些数据。 这个网站也可能会向
2015-04-16 19:34:07 9467
原创 Django项目实践2 - Django模板(网页多语种支持/国际化)
http://blog.csdn.net/pipisorry/article/details/45061579如果你要实现多种语言版本的django网站,如英语和中文的两个网站,lz将介绍一个最快捷的方法。安装配置gettextDjango框架具有很好的I18N和L10N的支持,其实现是基于GNU的gettext,所以要想在Django中使用I18N还需要先安装配置gettex
2015-04-16 10:54:28 16568
原创 Django项目实践2 - Django模板语言(常用语法规则)
http://blog.csdn.net/pipisorry/article/details/45727309Django模板语言 The Django template language模板中常用的语法规则{最新版本的Django语法可能有改变,不支持的操作可能支持了。[HTML教程 - 基本元素/标签及属性]}Django变量VariablesA variable outp
2015-04-15 16:45:41 12659
原创 Django项目实践2 - Django模板(view-html)
Django模板{视图和模板对逻辑和显示进行了分隔}上面是使用 django.http.HttpResponse() 来输出"Hello World!"。该方式将数据与视图混合在一起,不符合Django的MVC思想。或者HTML被直接硬编码在 Python 代码之中。html = "It is now %s." % now return HttpResponse(htm
2015-04-15 16:42:39 9160
原创 Machine Learning lectures- 机器学习课程
http://blog.csdn.net/pipisorry/article/details/45010849机器学习Machine Learning - Andrew NG courses学习笔记Machine Learning lectures - 机器学习课程Machine Learning - I. Introduction机器学习综述 (Week 1)Machine Learning - II. Linear Regression with One Variable单变量线性回归 (Wee
2015-04-12 16:07:35 2609 1
原创 Machine Learning - XVIII. Application Example Photo OCR应用实例-照片OCR(Week10)
机器学习Machine Learning - Andrew NG courses学习笔记Application Example Photo OCR应用实例照片OCR(Optical Character Recognition)光学文字辨识Problem Description and Pipeline问题描述和管道Sliding Windows滑窗
2015-04-11 22:00:56 5834
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
Introduction to Computation and Programming Using Python
2015-05-03
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人