王大宝的CD

数据挖掘爱好者

数据结构与算法(2)排序算法,用Python实现插入,选择,堆排,冒泡,快排和归并排序

前段时间鼓起勇气和老板说了一下以后想从事机器学习方向的工作,所以最好能有一份不错的实习,希望如果我有好的机会他可以让我去,没想到老板非常通情达理,说人还是要追寻自己感兴趣的东西,忙完这阵你就去吧。所以最近开始疯狂地投实习生简历,各家春招都去投了试试。那天第一次面试去了网易,面试官感觉很年轻,也挺有...

2018-04-11 16:20:01

阅读数:36

评论数:0

数据结构与算法(1)链表,基于Python解决几个简单的面试题

最近头一直很大,老板不停地布置各种任务,根本没有时间干自己的事情,真的好想鼓起勇气和他说,我以后不想干这个了,我文章也发了您就让我安安稳稳混到毕业行不行啊……作为我们这些想要跨专业的人来说,其实很大的一个劣势就是没有经历过一个计算机学科完整的培养,所以对计算机专业的一些很基本但又很重要的内容缺乏足...

2018-03-15 15:26:48

阅读数:72

评论数:0

利用Python通过频谱分析和KNN完成iphone拨号的语音识别

利用Python,通过对波形文件的有效区域提取及频谱分析,利用KNN算法完成一个iphone拨号的语音识别。

2017-09-01 15:37:42

阅读数:1057

评论数:2

数据挖掘(三)分类模型的描述与性能评估,以决策树为例

分类模型的描述主要是混淆矩阵,精确率,召回率等等,分类模型的性能评估则主要讲述了交叉验证这种方式,结合决策树讲解了如何用python实现分类模型的描述与评估。

2017-07-25 09:14:58

阅读数:1842

评论数:2

数据挖掘(二)用python实现数据探索:汇总统计和可视化

数据挖掘的第一步数据探索,包括汇总统计和可视化,介绍了相关概念,并结合鸢尾花数据展示了如何用Python进行汇总统计量的计算以及常用的可视化来帮助我们分析数据的性质。

2017-07-17 09:54:51

阅读数:5136

评论数:13

数据挖掘(一)你真的了解什么是数据挖掘和数据本身吗?

数据挖掘系列的第一篇,介绍了关于数据挖掘的基本概念以及关于数据的方方面面,建立对于数据和数据挖掘的基本认识。

2017-07-10 15:34:53

阅读数:2098

评论数:0

机器学习笔记(十二)朴素贝叶斯算法及实践(NB算法的产生及参数估计)

朴素贝叶斯算法原理及实践,具体阐述了NB算法的应用背景及参数估计,还有用鸢尾花数据做的一个简单的小实例。

2017-04-23 12:29:02

阅读数:1298

评论数:0

机器学习笔记(十一)实践之数据竞赛的套路

梳理参加数据竞赛常见的套路和流程,以泰坦尼克号幸存者预测为例,希望可以帮助大家快速入门竞赛。

2017-04-02 11:08:44

阅读数:3960

评论数:4

机器学习笔记(十)EM算法及实践(以混合高斯模型(GMM)为例来次完整的EM)

EM算法简介,讲述了EM的算法原理及思想,用混合高斯模型(GMM)为例完成了一个完整的EM过程,还有GMM算法的Python实践。

2017-03-24 12:57:01

阅读数:6375

评论数:4

机器学习笔记(九)聚类算法及实践(K-Means,DBSCAN,DPEAK,Spectral_Clustering)

聚类算法的原理介绍及Python的简单实践,主要包括K-Means,DBSCAN,DPEAK,Spectral_Clustering。

2017-03-18 13:59:12

阅读数:4249

评论数:2

机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机

支持向量机(SVM)算法最人性、最白话的解释以及在Python中的调用。

2017-03-12 12:08:22

阅读数:3197

评论数:2

Python读写文件模式

Python读写文件模式的一个小笔记还有我充满怨气的吐槽!!!

2017-03-10 16:13:39

阅读数:496

评论数:0

机器学习笔记(七)Boost算法(GDBT,AdaBoost,XGBoost)原理及实践

Boost(提升)算法介绍,包括GDBT,AdaBoost和XGBoost的原理及Python中的实践。

2017-03-09 12:09:49

阅读数:10557

评论数:6

机器学习笔记(六)Bagging及随机森林

Bagging和随机森林原理介绍以及利用sklearn的实现。

2017-03-05 11:17:21

阅读数:2067

评论数:0

机器学习笔记(五)决策树算法及实践

决策树算法的理论与实践,主要介绍了ID3,C4.5和CART算法,用时可learn自带数据进行了简单的决策树实践。

2017-03-01 12:43:10

阅读数:988

评论数:1

机器学习笔记(四)Logistic回归

Logistic回归原理及推导。构建了一个简单的分类问题,利用库和手写算法比较结果的异同,分类结果良好,但参数相差很大,希望有大神可以指点。

2017-02-19 17:32:37

阅读数:868

评论数:1

机器学习笔记(三) 线性回归及梯度下降算法

机器学习中线性回归相关的内容。包括线性回归损失函数的由来,梯度下降法的应用,正则化处理。

2017-02-15 14:44:07

阅读数:1493

评论数:3

机器学习笔记(二)矩阵和线性代数 例:用Python实现SVD分解进行图片压缩

机器学习中涉及的一些线性代数和矩阵分析的内容,并通过一个例子来表明线性代数的应用,利用Python实现SVD分解来进行图片压缩。

2017-01-17 13:45:17

阅读数:2536

评论数:2

机器学习笔记(一)概率论基础

机器学习基础之概率论相关内容,介绍了概率论中最常用的一些概,各种机器学习常用的分布,以及概率的运算。

2017-01-12 14:14:00

阅读数:1353

评论数:4

第一个完整爬虫:爬取应届生网所有职位的详细信息

在前面几篇博文里其实已经介绍了和Python爬虫相关的很多基础知识,包括基本的抓取网页信息,ip池的建立和使用,多进程在ip验证中的使用,今天我们就把这些内容整合到一起,完成一个真正的爬虫。 我们先来梳理一下思路,要爬取所有职位的详细信息,应该包括以下几步: 1 爬取所有职位及其对应的url ...

2017-01-01 12:37:18

阅读数:2474

评论数:3

提示
确定要删除当前文章?
取消 删除
关闭
关闭