python
文章平均质量分 72
痴澳超
东南大学 学生
展开
-
机器学习笔记2——分类
分类 笔记整理配套教程:coursera,欢迎转载分享!1.背景 你想要在西雅图选一个寿司很好的餐馆,所以你需要找到这样的餐馆。我们可以获得餐馆的评价比如“the sushi of this restaurant is best in the city”,我们可以把这句话输入一个情感分类器,我们可以知道这句话是对这个餐馆寿司的正面评价。(可能有些评价里面包含很多内容,比方说这里的拉面很原创 2016-10-21 16:08:08 · 1646 阅读 · 0 评论 -
Lasso Regression
本内容整理自coursera,欢迎交流转载。1如何选择特征效率 有意义稀疏性1.1法一:全部子集先选择只含有一个特征的最好的特征,然后2个,……以此类推。 假设我们有0~D个特征,由于每个特征都有被选中和没有被选中两种情况,因此算法复杂度为 2(D+1)2^{(D+1)}(指的是有这么多种模型,不包括每种模型的计算和预测的复杂度)。1.2法二:贪心算法每次选择一个剩余特征里面最好的特征原创 2016-11-28 11:01:04 · 2252 阅读 · 1 评论 -
聚类——k-means & MapReduce
本内容整理自coursera,欢迎交流转载。1.聚类——非监督学习的例子聚类指的是我们输入的数据是没有标签的,因此我们输入数据,然后聚类算法输出标签。聚类结果表示为聚类中心和范围。 聚类算法其实有很多限制,比方说有的实际类别相互交叉,不易区分: 有些聚类形式很难发现: 2.聚类算法——k-means算法流程:随机初始化聚类中心;根据观测点距离每个聚类中心的距离,把每个观测点分配给对应原创 2017-01-07 10:10:41 · 4732 阅读 · 1 评论 -
Jupyter Notebook 快捷键速查表
Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。1. 命令模式 (按键 Esc 开启) 一定要同时按住ESC按键 Esc+对应按键 功能 Enter 转入编辑模式 Shift-Enter 运行本单元,选中下个单元原创 2018-02-03 10:20:23 · 2993 阅读 · 0 评论 -
Python字典的深复制与浅复制
1. Python字典浅复制2. 深复制1. Python字典浅复制直接使用“=”是浅复制,比如有一个字典a,然后令b=a,这样的话当你改变b之后,a的内容也会一并改变。2. 深复制Python有一个copy库可以用于深复制。import copya = {"name":"Leo", "age":19}b = copy.deepcopy(a)这样...原创 2018-04-23 10:47:03 · 2757 阅读 · 0 评论 -
Tensorflow Slim入门教程(1)
slim入门教程slim入门教程1. Variable2. Layers2.1 slim.bias_add2.2 slim.batch_norm2.3 slim.conv2d2.4 slim.conv2d_in_plane2.5 slim.conv2d_transpose2.6 slim.fully_connected2.7 slim.avg_pool2d2.8 sli...原创 2018-07-02 21:49:27 · 4022 阅读 · 0 评论 -
Tensorflow Slim入门教程(3)
5. Fine Tuning Existing Models5.1 tf.train.Saver()5.2 导入部分参数5.3 导入名字不同的参数5.4 在不同任务上微调模型6. 评估模型6.1 Metric5. Fine Tuning Existing Models5.1 tf.train.Saver()# Create some va...原创 2018-07-03 15:42:55 · 1215 阅读 · 0 评论 -
001. 初识Python
Hello, Python!一、题目描述编写一个根据给出的属性参数来介绍一个人的函数输入: 两个参数。一个字符串(str)和一个正整数(int)。输出: 字符串(str)。范例:say_hi("Alex", 32) == "Hi. My name is Alex and I'm 32 years old"say_hi("Frank", 68) == "Hi. My...原创 2018-09-08 09:00:02 · 446 阅读 · 0 评论 -
002. Python字符串处理(upper, lambda, )
Correct sentence一、题目描述要求:完成函数correct_sentence(str),输入一个字符串,返回一个以大写字母开头,以“.”结尾的字符串副本输入:字符串输出:字符串示例:correct_sentence("greetings, friends") == "Greetings, friends."correct_sentence("Gree...原创 2018-09-08 09:03:25 · 1546 阅读 · 0 评论 -
003. Python字符串处理-返回第一个单词(strip, split, re)
First World一、题目描述要求:输入一个字符串,返回第一个单词输入:字符串输出:字符串示例:first_word("Hello world") == "Hello"first_word("greetings, friends") == "greetings" 注意: 字符串可能有逗号和句号 字符串原创 2018-09-08 09:06:00 · 7771 阅读 · 0 评论 -
004. python字符串查找(find, index等)
Second index一、题目描述要求:给定两个字符串A和B,返回B在A中第二次出现的下标,如果未找到,返回None。输入:2个字符串输出:int or None示例:second_index("sims", "s") == 3second_index("find the river", "e") == 12second_index("hi", " "原创 2018-09-08 09:07:59 · 1138 阅读 · 0 评论 -
005. Python找到符合要求的子串
Between markers一、问题描述要求:给定一个字符串以及两个标记(开始和结束标记),要求找到字符串中两个标记之间的子串。注意:开始和结束标记不同如果没有开始标记,默认从字符串第一个字符开始如果没有结束标记,默认字符串最后一位为结束如果开始和结束标记都没有,则返回整个字符串如果结束标记在开始标记之前,返回空字符串输入:字符串、开始标记和结束标记输出:...原创 2018-09-08 09:16:05 · 959 阅读 · 0 评论 -
006. Python字典排序
Best stock一、题目描述要求:给定货物价格,找到价格最高的货物输入:一个 货物:价格 的字典输出:价格最高的货物示例:best_stock({ 'CAC': 10.0, 'ATX': 390.2, 'WIG': 1.2}) == 'ATX'best_stock({ 'CAC': 91.1, 'ATX': 1.01,...原创 2018-09-09 09:02:26 · 506 阅读 · 0 评论 -
007. Python词汇计数
Popular words一、问题描述要求:统计字符串中每个单词的频率,按照出现频率从高到低给出词汇字典。输入:字符串和需要搜索的词汇列表输出:词汇字典(键:需要搜索的词汇;值:词频)注意:比如One, one, ONE等视为同样的单词对于未找到的单词,频率为0示例:popular_words('''When I was OneI had just...原创 2018-09-09 09:04:05 · 651 阅读 · 0 评论 -
009. Python基本数学运算
Fiza buzz一、题目描述要求:输入一个数字,如果数字可以同时被3和5整除,输出“Fizz Buzz”;如果数字可以被3整除,而不可以被5整除,输出“Fizz”;如果数字可以倍5整除不可被3整除,输出“Buzz”;其他情况,把数字转换成字符串类型输出输入:整数输出:字符串示例:checkio(15) == "Fizz Buzz"checkio(6) == "F...原创 2018-09-09 09:06:48 · 567 阅读 · 0 评论 -
Online Learning:随机梯度法
本内容整理自coursera,欢迎交流转载。1 大数据情景下的问题 随着数据集越来越大,按照之前的梯度下降(上升)算法,每次更新系数w^\hat{\textbf{w}}都会遍历所有的数据,这样计算会变得很慢。为了解决这个问题,于是有了之后的故事。2 每次使用一个数据进行更新 回想原来的梯度上升法, ∂l(w)∂wj=∑Ni=1hj(xi)(1[yi=+1]−P(y=+1|xi,w))=∑Ni原创 2016-12-06 18:37:54 · 981 阅读 · 0 评论 -
Boosting
本内容整理自coursera,欢迎交流转载。1 概述 i)循环迭代多次 更新样本分布 寻找当前分布下的最优弱分类器 计算弱分类器误差率 ii)聚合多次训练的弱分类器 这里的weighted_error=∑Ni=1αiy^i≠yi˙∑Ni=1αiweighted\_error=\frac{\sum^N_{i=1}\alpha{_i}\dot{\hat{y}_i\neq{y_i}}}{\原创 2016-12-05 16:48:19 · 633 阅读 · 0 评论 -
决策树——过拟合的处理
本内容整理自coursera,欢迎交流转载。1 过拟合回顾 什么情况下我们就认为发生了过拟合呢? 训练集误差越来越小,true error却先变小后变大,我们就说发生了过拟合(overfitting)。 2 原则:使用简单的树 当两棵树在validation set的分类误差相近的情况下,选择复杂度低的决策树。 那么,我们怎么得到复杂度低的决策树呢?有两种方法:early原创 2016-12-04 11:10:54 · 6016 阅读 · 0 评论 -
python闯关1-返回不唯一元素
这来自一个游戏闯关练习python的网站,有些网络可能无法访问,所以我决定开始整理里面的题目和大家分享。题干 你将得到一个含有整数(X)的非空列表。在这个任务里,你应该返回在此列表中的非唯一元素的列表。要做到这一点,你需要删除所有独特的元素(这是包含在一个给定的列表只有一次的元素)。解决这个任务时,不能改变列表的顺序。例如:[1,2,3,1,3] 1和3是非唯一元素,结果将是 [1, 3, 1,原创 2016-10-21 17:45:48 · 837 阅读 · 0 评论 -
python闯关2-罗马数字编码
这来自一个游戏闯关练习python的网站,有些网络可能无法访问,所以我决定开始整理里面的题目和大家分享。题干 罗马数字来源于古罗马编码系统。它们是基于字母表的特定字母的组合,所表示的数等于这些数字相加(或者是相减)得到的数。前十位的罗马数字是: I,II,III,IV,V,VI,VII,VIII,IX和X。 罗马记数系统不是直接的十进制为基础,它没有零。罗马数字是根据这七个符号的组合:**符号原创 2016-10-21 18:06:43 · 1352 阅读 · 0 评论 -
python闯关3——国际象棋问题
来自一个python的闯关网站,从初级到高级。题干 Almost everyone in the world knows about the ancient game Chess and has at least a basic understanding of its rules. It has various units with a wide range of movement原创 2016-10-22 10:43:26 · 2019 阅读 · 0 评论 -
机器学习5——多元回归及其代码实现
本博客整理自coursera,欢迎转载交流。Features 在简单的一元线性回归模型中,我们的features一般是指一些我们现有的变量。其实,在真正的使用中更重要的可能是如何定义这些特征,我们可以用一些量的函数组合来表示特征。比如预测房价,我们可以用面积,浴室个数……表示特征,也可以用log(面积),浴室个数的平方……表示特征,那么我们的模型表示为: yi=w0h0(xi)+w1h1(x原创 2016-11-03 14:25:29 · 2672 阅读 · 0 评论 -
机器学习笔记3——聚类
整理自Coursera。欢迎交流。背景 比方一个人正在阅读一篇文章,你则呢在语料库里面寻找相似的文章来推荐给这个人呢?这是好多公司面临的问题。你在阅读网页内容的时候网站是怎么给你推送你可能喜欢的文章呢?相似度(Similarity) 推送的文章肯定是与你正在阅读的文章相似的,因此有必要介绍一下怎么衡量2篇文章的相似度。 最简单粗暴的办法是把一篇文章打乱,统计每个单词出现的次数。我原创 2016-10-22 20:08:49 · 857 阅读 · 0 评论 -
python闯关4——最大最小
来自一个python编程挑战网站.整理供大家参考提高。题干 在这个任务中,你应该自己写出PY3中实现的内建函数 min 和 max. 一些内建函数在这里是不能用的:import,eval,exec,globals。 别忘了,你需要在你的代码中实现两个函数。 max(iterable, [, key]) 或者 min(iterable, [, key]) max(arg1, arg2,原创 2016-10-24 19:23:38 · 616 阅读 · 0 评论 -
机器学习笔记——岭回归(Ridge Regression)
本内容整理自coursera,欢迎转载交流。 (https://www.coursera.org/specializations/machine-learning)1.一般回归遇到的问题一般的回归模型很容易出现过拟合(overfitting)的问题。 为了说明过拟合,先介绍两个概念: error=bias+variance bias:指的是模型在样本上的输出与真实原创 2016-11-06 09:36:31 · 17651 阅读 · 2 评论 -
机器学习4——推荐系统
整理自coursera,欢迎交流转载。背景 现在我们考虑一个个性化的推荐系统,比如推荐电影、商品等。我们应该如何构建这个系统呢?其实推荐的方法有很多。比方说我们可以根据商品的流行度来推荐,这个方法最大的缺点是缺少个性化;为了实现个性化,我们可以把商品分类,根据分类来向用户推荐,这种方法的输入是用户的购买或浏览历史的特征,输出是用户可能喜欢的商品或多媒体信息,这个方法的优点是个性化原创 2016-10-26 10:59:55 · 1895 阅读 · 0 评论 -
机器学习4-x——音乐推荐系统代码实现
整理自coursera 代码和数据可以在这里下载。import graphlabsong_data = graphlab.SFrame('song_data.gl/')graphlab.canvas.set_target('ipynb')#查看有多少用户users = song_data['user_id'].unique()#数据分为训练集和测试集train_data,test原创 2016-10-27 10:56:32 · 6408 阅读 · 5 评论 -
线性分类器:Logistic Regression
本内容整理自coursera.欢迎交流转载。1 回顾 在这篇博客里我描述过直线、平面和超平面的分类。2 逻辑回归 什么是logistic regression? 假设我们有N个独立向量,每个向量有D个特征x⃗ i(x0,x1,x2,...,xD)\vec{x}_i(x_0,x_1, x_2,...,x_D),矩阵H是特征矩阵,hi(x⃗ i)=x⃗ i(xi)h_i(\vec{x}_i)原创 2016-11-29 19:18:58 · 1368 阅读 · 0 评论 -
python里使用cv2.goodFeaturesToTrack()函数追踪图像里的关键点
首先需要对cv2.goodFeaturesToTrack函数有一个基本的了解: 详细的介绍在这里:http://baike.baidu.com/link?url=zPK3iMJJfkKO0k2bniENAvksIRY0-Ci7weIcpE9AdFybc5tyUsbPT9cUTx4-vBDmhAnCsSKToS3QP8n4JaInfa 我要处理的视频是热成像仪拍摄的,目的是追踪高原创 2016-03-31 09:09:14 · 16351 阅读 · 1 评论 -
ROS学习(三) 使用参数以及相应的 .launch 文件编写
使用参数以及相应的 .launch 文件编写原创 2016-03-30 22:18:51 · 3725 阅读 · 0 评论 -
线性分类器——parameter learning
本内容整理自coursera,欢迎交流转载。1 如何确定系数矩阵 我们可以用likelihood l(w)来观测系数矩阵的分类质量。2 Data likelihoodMLE(maximum likelihood estimation) 注意:这里计算概率时需要注意真值y是+1还是-1,相应的我们在计算的时候需要使用对应的概率。 计算完上述内容之后,我们给出评价模型好坏的公式: l(w)原创 2016-12-02 16:50:54 · 504 阅读 · 0 评论 -
线性分类器——Overfitting & regularization
本内容整理自coursera,欢迎交流转载。1 错误率和正确率error=num of mistakestotal number of data pointserror=\frac{ num\ of\ mistakes}{total\ number\ of\ data\ points} accuracy=num of correcttotal number of data pointsaccu原创 2016-12-03 10:51:40 · 669 阅读 · 0 评论 -
决策树
本内容整理自coursera,欢迎交流转载。1 决策树举例 比方说,我们希望评价一个人的贷款风险评级,可以如下: 2 决策树学习——贪心算法(greedy algorithm) 先来看一个定义: Erroe=num of error predictionstotal numberErroe=\frac{num\ of\ error \ predictions}{total \ numb原创 2016-12-03 20:35:43 · 935 阅读 · 0 评论 -
010. Python 最大最小
The most numbers一、题目描述要求:给定一组浮点数,找到这组数字最大值和最小值的差;要求程序可以自适应个数不同的参数,如果这组数字是空集,返回0.输入:一组数字输出:浮点数示例:checkio(1, 2, 3) == 2checkio(5, -5) == 10checkio(10.2, -2.2, 0, 1.1, 0.5) == 12.4chec...原创 2018-09-09 09:07:56 · 1155 阅读 · 1 评论