- 博客(20)
- 资源 (2)
- 收藏
- 关注
原创 【用python实现《统计学习方法》】之感知机(perceptron)
声明:首先非常感谢李航博士和这篇博文的博主。本文的理论部分主要参考李航博士的《统计学习方法》,而代码实现部分则是在上述的博文基础上完成,并新增了对偶形式的感知机的python实现。感知机(perceptron)是机器学习中最简单的算法之一,容易理解和实现。笔者将使用python实现感知机的算法(重复造轮子),包括感知机的原始形式和对偶形式。model感知机的定义:strategy感知机学习的经验风险
2017-07-02 17:56:08 4170
原创 【爬虫实战一】之糗事百科热门段子采集
糗事百科段子采集的实例已经有很多前辈写过了,但年代久远,普遍基于python2.7,并且没有用到BeautifulSoup,而是自己写正则表达式进行匹配,因此,每次网站改版后,代码重构的工作量比较大。本着造福群众(找项目练手)的原则,笔者写了一个基于python3、requests库和BeautifulSoup库的糗事百科段子采集爬虫。1.先导入所需模块,再创建一个QSBK的类import re
2015-10-02 21:25:28 761
翻译 配置remote使用jupyter-notebook
Remote Access to IPython Notebooks via SSH PYTHON LINUX SSH NOTEBOOK IPYTHON REMOTE TUNNEL Scenario: On your local computer, you want to open and manipulate an IPython notebook running on a remote c...
2018-07-03 17:13:39 997
原创 Numpy 记忆点手册
索引和切片1.Numpy 切片返回的都是视图,除非显示的调用.copy()。2.Numpy 通过boolean索引选取的数据,返回的是副本(重新复制一份); 同样的,花式索引也是返回副本。3.Numpy 索引的方式有:整数索引、布尔值索引、花式索引(fancy indexing)。4.弄清索引和切片。转置和轴交换1.transpose()/swapaxes()都是返回视图。 axis的理解:设
2017-12-21 00:07:17 315
原创 骑士巡游问题:常规解法与启发式方法优化
The knight’s tour puzzle is played on a chess board with a single chess piece, the knight. The object of the puzzle is to find a sequence of moves that allow the knight to visit every square on the boa
2017-12-20 13:24:18 3017 2
转载 linux操作命令大全
最近OS终于换成了Ubuntu,由于我决心十足(技术太渣),Windows系统已经被我故意的(莫名其妙)的删除了???好吧,坚持到底(将错就错)在Ubuntu上玩耍(死磕)吧。1.tar解压命令详解2.anaconda使用总结3.Ubuntu下.7z解压缩大全4.ubuntu安装EnvironmentError: mysql_config not found错误5.几款Ubun...
2017-12-10 15:13:40 253
转载 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-12-10 15:09:56 202
原创 python实现二分搜索树以及改进后的AVL Tree
二分搜索树讲解 python代码:class TreeNode(object): def __init__(self, key, val, parent=None, left_child=None, right_child=None): self.key = key self.val = val self.parent = parent
2017-12-05 15:46:54 434
原创 python实现:无刻度的一大一小水罐取水问题
问题描述:You have two jugs: a A-gallon jug and a B-gallon jug ( A > B ). Neither of the jugs have markings on them. There is a pump that can be used to fill the jugs with water. How can you get exactly C g
2017-10-27 20:31:36 892
原创 【悬而未决的算法题】marker下来等待解决(随时更新)
1.Find a Sudoku puzzle in the local newspaper. Write a program to solve the puzzle. 2.Given a list of numbers in random order, write an algorithm that works in O(nlog(n))O(nlog(n)) to find the kth sm
2017-10-18 21:21:55 347
原创 基数排序法(radix sorting)
基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过数项(item)的位(digit),将要排序的元素分配至某些“桶”中,藉以达到排序的作用。基数排序法是属于稳定性的排序,其时间复杂度为O (nlog(r)m),其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳
2017-10-18 13:26:33 580
原创 《机器学习基石》笔记:第三讲
第三讲主要根据Output Space/Data Labels/learning protocol/Input Space的不同,将机器学习问题划分为几个种类。 1.输出空间(Output Space) 分类器(Classification)经过training set训练,对unseen data进行预测,输出labels。根据labels的不同,可以将机器学习分为Binary classif
2017-10-10 13:16:05 274
原创 《机器学习基石》笔记:第二讲
第二讲主要是通过PLA(Perceptron Learning Algorithm)讲解二分类问题(Binary Classification)。关于PLA算法的基础内容,在这篇博文已经深入探究了,该博文主要记录一些扩展的知识。 1假设空间(hypothesis set) 对于Perceptron来说,假设空间就是样本点(sample points)所在平面的所有直线。 2.PLA的几何解释
2017-10-09 20:18:03 368
原创 《机器学习基石》笔记:第一讲
林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典,从哲学原理讲到算法核心,深入浅出,非常详细。但存在两个问题: 1.林老师是台湾(省)人,很多舶来品词语的翻译和大陆不同,加上林老师讲的比较快,一次听明白还是不容易的。 2.由于课程是视频形式,回头复习比较麻烦。 因此,想把每节课的重要内容以笔记的形式记录下来,以供未来反复回头翻看。希望能坚持下来:) 下面开始正式内容。1.课程介绍
2017-10-08 20:40:29 408
原创 JSP中内置对象的getAttribute()和getParameter()
1.getAttribute()获取的是对象,而getParameter()获取的是字符串。2.request.getAttribute("name")是获取容器里面的值(类似于HashMap),在整个容器中有效,如tomcat。而request.getParameter("name") 是获取上一个页面通过post/get传入本页面的值。
2016-02-17 17:33:09 441
原创 【用python实现《统计学习方法》】之决策树C4.5/ID3
声明:本文根据李航博士的《统计学校方法》中的决策树章节的原理:最大熵信息增益、信息增益比进行决策树的实现。在可视化方面主要参考的这篇博文。决策树算法是一类在数据挖掘中应用的特别多的符号学派分类器,并在集成学习中被大大采用。经典的c4.5和id3以及后来的cart是了解诸如GBDT等集成学校算法的基础,因此笔者尝试自己实现一次(重复造轮子)。model决策树的定义:strategy决策数学习的关键就是
2015-10-02 15:08:54 603 1
java For python 程序员
2018-08-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人