- 博客(19)
- 收藏
- 关注
转载 主成分分析(PCA)学习笔记
这两天学习了吴恩达老师机器学习中的主成分分析法(Principal Component Analysis, PCA),PCA是一种常用的降维方法。这里对PCA算法做一个小笔记,并利用python完成对应的练习(ps:最近公式有点多,开始没找到怎么敲公式,前面几篇都是截的图^_^,后面问了度娘,原来是支持latex的)。代码和数据见github一、PCA基本思路 将数据从原来的...
2019-01-15 17:26:00
1373
转载 AdaBoost学习笔记
学习了李航《统计学习方法》第八章的提升方法,现在对常用的一种提升方法AdaBoost作一个小小的笔记,并用python实现书本上的例子,加深印象。提升方法(boosting)是一种常用的统计学习方法,在分类中通过改变样本的权值分布,学习多个分类器,然后组合这些分类器,提高分类性能。一、 提升方法的问题 1、训练弱分类器时如何更改样本权重或概率分布 2、如何...
2019-01-12 21:47:00
294
转载 隐马尔科夫模型(HMM)学习笔记二
这里接着学习笔记一中的问题2,说实话问题2中的Baum-Welch算法编程时矩阵转换有点烧脑,开始编写一直不对(编程还不熟练hh),后面在纸上仔细推了一遍,由特例慢慢改写才运行成功,所以代码里面好多处都有print。 笔记一中对于问题1(概率计算问题)采用了前向或后向算法,根据前向和后向算法可以得到一些后面要用到的概率与期望值。一、问题2...
2019-01-07 22:51:00
465
转载 隐马尔可夫模型(HMM)学习笔记一
学习了李航的《统计学习方法》中隐马尔可夫模型(Hidden Markov Model, HMM),这里把自己对HMM的理解进行总结(大部分是书本原文,O(∩_∩)O哈哈~,主要是想利用python将其实现一遍,这样印象深刻一点儿),并利用python将书本上的例子运行一遍。HMM是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成观测序列的过程,属于生成模型。H...
2019-01-07 15:56:00
931
转载 k-means学习笔记
最近看了吴恩达老师的机器学习教程(可以在Coursera,或者网易云课堂上找到)中讲解的k-means聚类算法,k-means是一种应用非常广泛的无监督学习算法,使用比较简单,但其背后的思想是EM算法(看李航老师统计学习方法看了半天还是没太明白,后面找了一篇博客,博主对EM算法讲解非常通俗易懂)。这里对k-means算法和应用做一个小笔记,脑袋记不住那么多hh。本文用的数...
2019-01-02 21:08:00
325
转载 pandas练习(四)--- 应用Apply函数
探索学生对酒的消费情况数据见github步骤1 - 导入必要的库import pandas as pdimport numpy as np步骤2 - 数据集path4 = "./data/student-mat.csv" 步骤3 将数据命名为studentstudent = pd.read_csv(path4)student.h...
2018-06-28 22:02:00
423
转载 pandas练习(三)------ 数据分组
探索酒类消费数据相关数据见(github)步骤1 - 导入pandas库import pandas as pd步骤2 - 数据集path3 = "./data/drinks.csv" # drinks.csv步骤3 将数据框命名为drinksdrinks = pd.read_csv(path3)drinks.head()...
2018-06-20 11:14:00
846
转载 pandas练习(二)------ 数据过滤与排序
数据过滤与排序------探索2012欧洲杯数据相关数据见(github)步骤1 - 导入pandas库import pandas as pd步骤2 - 数据集path2 = "./data/Euro2012.csv" # Euro2012.csv步骤3 - 将数据集命名为euro12euro12 = pd.read_csv(pa...
2018-06-13 11:15:00
1807
转载 pandas练习(一)------ 了解数据
探索Chipotle快餐数据(相关数据见github)步骤1 导入pandas库import pandas as pd步骤2 导入数据集path1 = "./data/chipotle.tsv" # chipotle.tsv步骤3 将数据集存入一个名为chipo的数据框内chipo = pd.read_csv(path1, sep ...
2018-06-11 10:02:00
1411
转载 python 循环队列的实现
最近在做一个东西的时候发现需要用到循环队列,实现先进先出(FIFO),不断往里面添加数据,当达到某个限定值时,最先进去的出去,然后再添加。之后需要对队列里面的内容进行一个筛选,作其他处理。首先我想到了python的Queue模块,先简单的介绍一下,具体的可以参考Queue。一、Queue模块Python queue模块有三种队列及构造函数: 1、Python queue模块...
2018-03-18 11:33:00
1216
转载 numpy模块学习笔记
# encoding=utf-8import numpy as npfrom numpy.linalg import *def main(): # 1、最基本的array lst = [[1, 3, 5], [2, 4, 6]] print(type(lst)) # <class 'list'> np_lst ...
2018-03-16 20:07:00
80
转载 Python 进程之间共享数据
最近遇到多进程共享数据的问题,到网上查了有几篇博客写的蛮好的,记录下来方便以后查看。一、Python multiprocessing 跨进程对象共享 在mp库当中,跨进程对象共享有三种方式,第一种仅适用于原生机器类型,即python.ctypes当中的类型,这种在mp库的文档当中称为shared memory方式,即通过共享内存共享对象;另外一种称之为server pr...
2018-03-13 16:39:00
957
转载 MySQL中, 如何查询某一天, 某一月, 某一年的数据.
今天select * from 表名 where to_days(时间字段名) = to_days(now());昨天(包括昨天和今天的数据)SELECT * FROM 表名 WHERE TO_DAYS( NOW( ) ) - TO_DAYS( 时间字段名) <= 1昨天(只包括昨天)SELECT * FROM 表名 WHERE ...
2017-08-15 09:46:00
111
转载 js获取时间
Js获取当前日期时间及其它操作var myDate = new Date();myDate.getYear();//获取当前年份(2位)myDate.getFullYear();//获取完整的年份(4位,1970-????)myDate.getMonth();//获取当前月份(0-11,0代表1月)myDate.getDate();...
2017-08-14 22:11:00
114
转载 nodejs爬虫笔记(五)---利用nightmare模拟点击下一页
目标 以腾讯滚动新闻为例,利用nightmare模拟点击下一页,爬取所有页面的信息。首先得感谢node社区godghdai的帮助,开始接触不太熟悉nightmare,感觉很高大上,自己写代码的时候问题也很多,多亏大神的指点。一、选择模拟的原因 腾讯滚动新闻,是每六十秒更新一次,而且有下一页。要是直接获取页面的话得一页一页的获取,不太方便,又想到了找数据接口,然后通过请求得...
2017-08-07 10:35:00
1083
转载 nodejs爬虫笔记(四)---利用nightmare解决加载更多问题
目标: 解决页面加载更多问题。笔记三中,我们只爬取到网页的部分信息,而点击加载更多后的页面内容是没有提取到的。开始我的想法是找到加载更多的数据接口(可参照:http://www.jianshu.com/p/3fdb6ab47aef),但是我又发现一个问题,当我打开一个订阅号页面时,找到数据接口如下图,点击response会发现里面有相应的内容,对其进行解析时得到的内容却是空的,也就...
2017-08-02 11:03:00
456
转载 nodejs爬虫笔记(一)---request与cheerio等模块的应用
目标:爬取慕课网里面一个教程的视频信息,并将其存入mysql数据库。以http://www.imooc.com/learn/857为例。一、工具1.安装nodejs:(操作系统环境:WiN 7 64位) 在Windows环境下安装相对简单(ps:其他版本我也不太清楚,可以问度娘) http://nodejs.org/download/链接中下...
2017-07-06 10:50:00
159
转载 jQuery选择器总结
jQuery 的选择器可谓之强大无比,这里简单地总结一下常用的元素查找方法$("#myELement") 选择id值等于myElement的元素,id值不能重复在文档中只能有一个id值是myElement所以得到的是唯一的元素 $("div") 选择所有的div标签元素,返回div元素数组 $(".myClass") 选择使用myCl...
2017-06-28 20:32:00
66
转载 MySQL数据库学习笔记----MySQL多表查询之外键、表连接、子查询、索引
本章主要内容:一、外键二、表连接三、子查询四、索引一、外键:1、什么是外键2、外键语法3、外键的条件4、添加外键5、删除外键1、什么是外键:主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性外键:是另一表的主键, 外键可以有重复...
2017-06-26 20:16:00
57
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人