自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python进阶 - HTML获取与解析

1 URL的处理1.1 URL介绍HTML使用同一资源定位符(Universal Resource Locator:URL)来定位Internet上的HTML文档信息。URL语法定义如下:protocol://auth/path?query常用协议有:http、https、ftp、mailto、file、telnet一种包含授权的URL详细语法如下:protocol://username@pass

2015-09-28 20:00:02 4539

原创 Python进阶 - 进程与线程

1 Python下的进程编程1.1 创建进程:system函数原型如下:system(command)实际是调用系统内置的命令行程序来执行系统命令, 所以在命令结束之后会将控制权返回给Python进程。 如果返回0,说明执行成功,否则表示失败exec家族共有8个类似函数:execl, execle, execlp, execv, execve, execvp, execvpe exec

2015-09-27 22:31:53 1018

原创 Python进阶 - GUI程序设计(tkinter)

0 概述Python中有许多GUI模块可以用于开发GUI程序。最简单的有Turtle,然而它并不能用来创建图形用户界面。用于开发GUI的库主要有以下几种:Tkinter:Python**内置**的标准GUI库,是一种小巧的开发库,开发速度快,在小型程序中仍有不少应用。它支持跨平台。PyGTK:用C语言写的跨平台的GUI库,现在GTK已发展成了功能强大窗体丰富的GUI库。著名的GNOME即基于GT

2015-09-27 22:30:00 2931

原创 13 - 字符串与正则表达式

1.正则表达式简介正则表达式用于搜索、替换和解析字符串。Python提供了re模块进行正则表达式的验证。正则表达式由字母、数字和特殊字符(括号、星号、问好等)组成特殊字符含义:^ 开始字符$ 结束字符. 匹配任意字符(包括汉字)[m] 匹配单个字符串[m1m2 ... n] 匹配多个字符串[m-n] 匹配m到n之间的数字、字母[^m] 匹配除m以外的字符串( ) 对表达式进行分组\

2015-09-27 22:25:11 686

原创 12 - 模块与函数

1.Python 程序的结构Python程序由package、module和function组成。 package是由一系列模块组成的集合,module是处理某一类问题的集合。、 package必须至少含有一个 init.py 文件,该文件内容可以为空,用于标识当前文件夹是一个包。2.modulePython程序由一个个的模块组成的,一个python文件就是一个模块。当python导入一个m

2015-09-27 22:24:33 466

原创 11 - 元组、集合和字典

1.元组与列表类似,但是元组中的元素是固定的。也就是说,一个元组一旦被创建,就无法对其元素进行添加、删除、替换或重新排序。可以使用元组来防止数据被以外的修改。除元组的数据固定以外,其他方面和列表很像,甚至比列表效率更高。可以通过将元素用一对圆括号括起来创建一个元组示例:t1 = ()t2 =(1, 3, 5)t3 = tuple([2 * x for x in range(1, 5)])

2015-09-23 22:46:55 615

原创 10 - 文件和异常处理

1.文件打开open(name[, mode[, buffering]])打开一个文件,返回一个file类型的对象。如果文件打不开,抛出IOError。注意,想要打开一个文件,使用open函数比file函数好。mode主要包括: ’r’:只读,默认方式‘w’:写入,覆盖原来内容‘a’:写入,在原来内容后面追加‘b’:打开二进制文件使用示例:input = open(r"c:\pybook

2015-09-23 18:11:42 1025

原创 9 - 继承和多态

1. 继承的实现方法与注意事项class ChildClass(ParentClass):子类会继承父类的所有可访问的数据域和方法,它也可以定义自己的数据域和方法。子类在 __init__ 函数中需要调用父类的 __init__ 方法去初始化。常用的方法是:super().__init__()(避免显示指向父类),不需要传递 self 参数。 Python 允许从几个类派生出一个子类,称为多重继

2015-09-22 22:35:41 781

原创 8 - 列表

1. 创建列表l1 = list()l2 = list([2, 3, 4])l3 = list(["red", "green", "blue"])l4 = list(range(3, 6))l5 = list("abcd") # 列表的内容是:'a', 'b', 'c', 'd'也可简写成:l1 = []l2 = [2, 3, 4]l3 = ["red", "green", "bl

2015-09-22 22:35:13 549

原创 7 - 更多字符串和特殊方法

1. 创建字符串s1 = str()s2 = str("Welcome") s1 = ""s2 = "Welcome"s3 = "Welcome"一个字符串对象是不可变的,一旦创建一个字符串对象出来,那么它的内容就不会再改变、为了优化性能,Python使用一个对象来表示具有相同内容的字符串。例如,上面的 s2,s3 就指向同一个对象,他们有着相同的 id 。2.内置字符串处理函数len 返回

2015-09-22 10:54:30 538

原创 6 - 对象和类

1.定义类class ClassName: initializer methods初始化函数一律命名为 __init__,这是一个特殊的方法,它是在创建和初始化这个新对象时被调用的,主要用于完成初始化动作。2.构造方法:c1 = Circle(3)创建对象调用 __init__ 方法初始化对象包括init函数在内的所有方法,都有第一个参数 self 。这个参数self指向调用方

2015-09-22 10:53:54 526

原创 5 - 函数

1.函数的定义def functionName(list of parameters): # fucntion body示例:def sum(i1, i2): result = 0 for i in range(i1, i2 + 1): result += 1 return resultdef main(): print("Sum from

2015-09-19 15:39:01 761

原创 4 - 循环

1.While循环count = 0while count < 100: print("Programing is fun!") count += 1 2.输入输出重定向以文件作为 input 函数的输入数据:python SentineValue.py < input.txt以文件作为 print 函数的输出数据python Script.py > output.py3.

2015-09-19 15:38:30 625

原创 3 - 条件选择语句

1.产生随机数(需要import random)randint(a,b) 产生 a 和 b 之间的随即整数randrange(a,b) 产生a 到 b-1 之间的随机整数random() 产生0到1时间的随机浮点数2.if-elif-else语句要点:每一个if条件后面都要加冒号(:)注意是elif而不是其他的最后一个else后面不跟条件if score >= 90.0: g

2015-09-19 15:38:02 1160

原创 2 - Python数学函数、字符串、对象

1.内置数学函数abs(x) : 绝对值max(x1, x2,...): 最大值min(x1, x2,...) :最小值pow(a, b): 与 a ** b效果相同round(x): 与 x 接近的整数,四舍五入round(x, n): 保留小数点后n位小数2. math模块提供的数学函数fabs(浮点数的绝对值), ceil, floor, exp, log(自然对数), lo

2015-09-19 15:37:29 1037

原创 1 - Python 概述和基本知识

1. 输入输出print("Hello World!","Python","...")var = input("Enter a string:")num1,num2 = eval(input("Enter two number:"))2. 同时赋值x, y = y, x %交换 x 和 y 的值3. 代码换行sum = 1 + 2 + 3 + 4 + 5 \\+ 6 + 7 4. 基

2015-09-19 15:36:55 998

原创 编码规范

适当的注释:在程序开头写一个 summary 来解释程序的功能、特点和技术方法等。在较长的程序中应该为每一个主要步骤中可能比较难以读懂的部分写注释。注释应该尽量简洁以避免其挤在代码中难以阅读。命名惯例变量和函数名:驼峰式命名。例:readDouble类名:首字母大写,驼峰式。例:GeometricObject常量:所有字母大写,用下划线分割单词。如:MAX_VALUE单个item用单数

2015-09-19 15:35:36 595

原创 Sublime Text 3 快捷键

Ctrl + D : 多光标同时编辑,按住可以继续向下选择相同的文本。 Alt + F3 : 一次性选择全部的相同文本进行多光标同时编辑。 Ctrl + L :选择整行,按住会继续选择下一行。 Ctrl + M :光标移动至括号内开始或结束的位置。 Ctrl + P :快速检索,可以查找当前项目中的文件和快速搜索;输入@查找文件主标题/函数,快捷键为Ctrl+R;输入:再输入行号,跳转到文件

2015-09-19 15:35:10 508

原创 Sublime Text 3 搭建Python开发环境

一、插件安装方法直接安装:下载插件安装包到Packages目录(Preference->Packages)使用Package Control插件安装:(1)安装Package Control插件: 按 ctrl + 调出Console,粘贴以下代码并回车:import urllib.request,os,hashlib; h = '2915d1851351e5ee549c20394736b442'

2015-09-19 15:30:12 6381

原创 16-Application Example Photo OCR

1 - Problem Description and Pipeline 问题描述与系统流水线2 - Sliding Windows 滑动窗口检测在 Text detection 和 Character segmentation 中需要用到滑动窗口。Text detection 步骤:首先用已有数据训练模型(如Neural network等) ,用于识别出图片内容是否为文本。 - 用不同大小的

2015-09-02 01:04:04 754

原创 15-Large Scale Machine Learning

1 - Learning With Large Datasets由前面章节的知识可知,在模型属于 low bias & high variance 的时候,增大数据集是对结果大有好处的。 Andrew NG 给的示例: 2 - Stochastic [sto’kæstɪk] Gradient Descent 随机梯度下降常见的 Linear Regression 的梯度下降算法: 它的特

2015-09-02 00:58:38 916

原创 14-Recommender Systems

1 - Problem Formulation 推荐系统电影推荐:nu=n_u = 用户数量nm=n_m = 电影数量r(i,j)=1r(i,j) = 1 用户 j 对电影 i 进行了评价 y(i,j)=y^{(i,j)} = 用户 j 对电影 i 的评分(仅当r(i,j)=1r(i,j)=1时才存在)2 - Content Based Recommendations 基于内容推荐

2015-09-02 00:53:08 555

原创 13-Anomaly Detection

1 - Problem Motivation 异常检测通常用于 Unsupervised Learning 。异常检测应用场景举例:Fraud detection:欺骗检测Manufacturing:制造业设备检测Monitoring computers in a data center:数据中心计算机监控2 - Gaussian Distribution 高斯(正态)分布表达式如下:

2015-09-02 00:46:48 697

原创 12-Dimensionality Reduction

数据的降维处理1 - Motivation I Data Compression II Visualization 数据压缩|可视化 2 - Principal Component Analysis Problem Formulation降维: 2维到1维:找到一个向量 u(1)∈R2u^{(1)}\in R^2 ,让平面上的2维数据投影到这个向量上,并且投影误差最小n维到k维:找到k个

2015-09-02 00:44:25 616

原创 11-Clustering

1 - Unsupervised Learning Introduction 无监督学习数据事先没有标记分类。 应用:Market segmentation 市场分割Social network analysis 社交网络分析Organize computing clusters 计算集群组织Astronomical data analysis 天文数据分析2 - K-Means Al

2015-09-02 00:40:36 665

原创 10-SVM

1 - Optimization Objective 优化目标1.1 从logistic regression来看首先来看Logistic regression的hypothesis函数:hθ(x)=11+e−θTx h_\theta(x)=\dfrac{1}{1+e^{-\theta^Tx}} ,可以知道:当y=1时,我们希望 hθ(x)≈1 h_\theta(x)\approx1 ,那么此时必

2015-09-02 00:38:24 908

原创 9-Machine Learing System Design

1 - Prioritizing What to Work On 众多的改进方法中该选哪一个?以 Spam classification 为例来说明问题。 识别垃圾邮件的基本方法:从大量的邮件中选取出最频繁出现的 n 个词语(包括垃圾邮件关键词和非垃圾邮件关键词,n可取10,000 to 50,000)作为关键词。然后对新邮件进行处理,生成 n x 1维向量 X 作为分类器的输入。降低误差的方法

2015-09-02 00:32:20 592

原创 8-Advice for Applying Machine Learing

如何选择机器学习算法、系统1 - Deciding What to Try Next 在模型遇到问题时该怎么办当你用regularized linear regression 实现了housing prices predict问题之后,发现你的模型在测试新数据时出现非常大的误差。 这时可能的措施如下:Get more training examplesTry smaller sets of f

2015-09-02 00:29:18 501

SCAN社团发现算法

基于Java实现的SCAN社团发现算法,含有示例数据集。 Paper: 《SCAN: A Structural Clustering Algorithm for Networks》 Auther: Xiaowei Xu, Nurcan Yuruk, Zhidan Feng, Thomas A. J. Schweiger Conference: SIGKDD 2007

2018-05-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除