自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 主成分分析(PCA)学习笔记

  这两天学习了吴恩达老师机器学习中的主成分分析法(Principal Component Analysis, PCA),PCA是一种常用的降维方法。这里对PCA算法做一个小笔记,并利用python完成对应的练习(ps:最近公式有点多,开始没找到怎么敲公式,前面几篇都是截的图^_^,后面问了度娘,原来是支持latex的)。代码和数据见github一、PCA基本思路  将数据从原来的...

2019-01-15 17:26:00 1373

转载 AdaBoost学习笔记

学习了李航《统计学习方法》第八章的提升方法,现在对常用的一种提升方法AdaBoost作一个小小的笔记,并用python实现书本上的例子,加深印象。提升方法(boosting)是一种常用的统计学习方法,在分类中通过改变样本的权值分布,学习多个分类器,然后组合这些分类器,提高分类性能。一、 提升方法的问题  1、训练弱分类器时如何更改样本权重或概率分布  2、如何...

2019-01-12 21:47:00 294

转载 隐马尔科夫模型(HMM)学习笔记二

  这里接着学习笔记一中的问题2,说实话问题2中的Baum-Welch算法编程时矩阵转换有点烧脑,开始编写一直不对(编程还不熟练hh),后面在纸上仔细推了一遍,由特例慢慢改写才运行成功,所以代码里面好多处都有print。  笔记一中对于问题1(概率计算问题)采用了前向或后向算法,根据前向和后向算法可以得到一些后面要用到的概率与期望值。一、问题2...

2019-01-07 22:51:00 465

转载 隐马尔可夫模型(HMM)学习笔记一

学习了李航的《统计学习方法》中隐马尔可夫模型(Hidden Markov Model, HMM),这里把自己对HMM的理解进行总结(大部分是书本原文,O(∩_∩)O哈哈~,主要是想利用python将其实现一遍,这样印象深刻一点儿),并利用python将书本上的例子运行一遍。HMM是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成观测序列的过程,属于生成模型。H...

2019-01-07 15:56:00 931

转载 k-means学习笔记

最近看了吴恩达老师的机器学习教程(可以在Coursera,或者网易云课堂上找到)中讲解的k-means聚类算法,k-means是一种应用非常广泛的无监督学习算法,使用比较简单,但其背后的思想是EM算法(看李航老师统计学习方法看了半天还是没太明白,后面找了一篇博客,博主对EM算法讲解非常通俗易懂)。这里对k-means算法和应用做一个小笔记,脑袋记不住那么多hh。本文用的数...

2019-01-02 21:08:00 325

转载 pandas练习(四)--- 应用Apply函数

探索学生对酒的消费情况数据见github步骤1 - 导入必要的库import pandas as pdimport numpy as np步骤2 - 数据集path4 = "./data/student-mat.csv" 步骤3 将数据命名为studentstudent = pd.read_csv(path4)student.h...

2018-06-28 22:02:00 423

转载 pandas练习(三)------ 数据分组

探索酒类消费数据相关数据见(github)步骤1 - 导入pandas库import pandas as pd步骤2 - 数据集path3 = "./data/drinks.csv" # drinks.csv步骤3 将数据框命名为drinksdrinks = pd.read_csv(path3)drinks.head()...

2018-06-20 11:14:00 846

转载 pandas练习(二)------ 数据过滤与排序

数据过滤与排序------探索2012欧洲杯数据相关数据见(github)步骤1 - 导入pandas库import pandas as pd步骤2 - 数据集path2 = "./data/Euro2012.csv" # Euro2012.csv步骤3 - 将数据集命名为euro12euro12 = pd.read_csv(pa...

2018-06-13 11:15:00 1807

转载 pandas练习(一)------ 了解数据

探索Chipotle快餐数据(相关数据见github)步骤1 导入pandas库import pandas as pd步骤2 导入数据集path1 = "./data/chipotle.tsv" # chipotle.tsv步骤3 将数据集存入一个名为chipo的数据框内chipo = pd.read_csv(path1, sep ...

2018-06-11 10:02:00 1411

转载 python 循环队列的实现

  最近在做一个东西的时候发现需要用到循环队列,实现先进先出(FIFO),不断往里面添加数据,当达到某个限定值时,最先进去的出去,然后再添加。之后需要对队列里面的内容进行一个筛选,作其他处理。首先我想到了python的Queue模块,先简单的介绍一下,具体的可以参考Queue。一、Queue模块Python queue模块有三种队列及构造函数:  1、Python queue模块...

2018-03-18 11:33:00 1216

转载 numpy模块学习笔记

# encoding=utf-8import numpy as npfrom numpy.linalg import *def main(): # 1、最基本的array lst = [[1, 3, 5], [2, 4, 6]] print(type(lst)) # <class 'list'> np_lst ...

2018-03-16 20:07:00 80

转载 Python 进程之间共享数据

  最近遇到多进程共享数据的问题,到网上查了有几篇博客写的蛮好的,记录下来方便以后查看。一、Python multiprocessing 跨进程对象共享  在mp库当中,跨进程对象共享有三种方式,第一种仅适用于原生机器类型,即python.ctypes当中的类型,这种在mp库的文档当中称为shared memory方式,即通过共享内存共享对象;另外一种称之为server pr...

2018-03-13 16:39:00 957

转载 MySQL中, 如何查询某一天, 某一月, 某一年的数据.

今天select * from 表名 where to_days(时间字段名) = to_days(now());昨天(包括昨天和今天的数据)SELECT * FROM 表名 WHERE TO_DAYS( NOW( ) ) - TO_DAYS( 时间字段名) <= 1昨天(只包括昨天)SELECT * FROM 表名 WHERE ...

2017-08-15 09:46:00 111

转载 js获取时间

Js获取当前日期时间及其它操作var myDate = new Date();myDate.getYear();//获取当前年份(2位)myDate.getFullYear();//获取完整的年份(4位,1970-????)myDate.getMonth();//获取当前月份(0-11,0代表1月)myDate.getDate();...

2017-08-14 22:11:00 114

转载 nodejs爬虫笔记(五)---利用nightmare模拟点击下一页

目标  以腾讯滚动新闻为例,利用nightmare模拟点击下一页,爬取所有页面的信息。首先得感谢node社区godghdai的帮助,开始接触不太熟悉nightmare,感觉很高大上,自己写代码的时候问题也很多,多亏大神的指点。一、选择模拟的原因  腾讯滚动新闻,是每六十秒更新一次,而且有下一页。要是直接获取页面的话得一页一页的获取,不太方便,又想到了找数据接口,然后通过请求得...

2017-08-07 10:35:00 1083

转载 nodejs爬虫笔记(四)---利用nightmare解决加载更多问题

目标:  解决页面加载更多问题。笔记三中,我们只爬取到网页的部分信息,而点击加载更多后的页面内容是没有提取到的。开始我的想法是找到加载更多的数据接口(可参照:http://www.jianshu.com/p/3fdb6ab47aef),但是我又发现一个问题,当我打开一个订阅号页面时,找到数据接口如下图,点击response会发现里面有相应的内容,对其进行解析时得到的内容却是空的,也就...

2017-08-02 11:03:00 456

转载 nodejs爬虫笔记(一)---request与cheerio等模块的应用

目标:爬取慕课网里面一个教程的视频信息,并将其存入mysql数据库。以http://www.imooc.com/learn/857为例。一、工具1.安装nodejs:(操作系统环境:WiN 7 64位)  在Windows环境下安装相对简单(ps:其他版本我也不太清楚,可以问度娘)  http://nodejs.org/download/链接中下...

2017-07-06 10:50:00 159

转载 jQuery选择器总结

jQuery 的选择器可谓之强大无比,这里简单地总结一下常用的元素查找方法$("#myELement") 选择id值等于myElement的元素,id值不能重复在文档中只能有一个id值是myElement所以得到的是唯一的元素 $("div") 选择所有的div标签元素,返回div元素数组 $(".myClass") 选择使用myCl...

2017-06-28 20:32:00 66

转载 MySQL数据库学习笔记----MySQL多表查询之外键、表连接、子查询、索引

本章主要内容:一、外键二、表连接三、子查询四、索引一、外键:1、什么是外键2、外键语法3、外键的条件4、添加外键5、删除外键1、什么是外键:主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性外键:是另一表的主键, 外键可以有重复...

2017-06-26 20:16:00 57

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除