自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (1)
  • 收藏
  • 关注

原创 贝叶斯统计——贝叶斯方法简述

贝叶斯方法简述贝叶斯公式全概率公式贝叶斯统计基本原理统计学中有两个主要学派:频率学派(又称经典学派)和贝叶斯学派。频率学派利用总体信息和样本信息进行统计推断,贝叶斯学派与之的区别在于还用到了先验信息。贝叶斯公式P(A,B)=P(A∣B)P(B)=P(B∣A)P(A)P(A,B)=P(A|B)P(B)=P(B|A)P(A)P(A,B)=P(A∣B)P(B)=P(B∣A)P(A)P(B∣A)...

2019-05-10 23:51:31 3412

原创 贝叶斯统计——常见的概率分布

贝叶斯统计——常见的概率分布离散型概率分布连续型概率分布离散型概率分布概率分布名称分布列数字特征二项分布B(n,p)二项分布\\B(n,p)二项分布B(n,p)f(x)=Cnxpx(1−p)n−xx=0,1,2,...,n,p∈[0,1]f(x)=C_n^xp^x(1-p)^{n-x}\\x=0,1,2,...,n,p\in[0,1]f(x)=Cnx​px(1−p)n−...

2019-05-10 21:37:14 2545 2

原创 豆瓣影评爬虫——导出excel

豆瓣影评爬虫——导出excel#导入库import requestsfrom bs4 import BeautifulSoupimport xlwtimport time#创建worbookworkbook = xlwt.Workbook(encoding='utf-8', style_compression=0)sheet = workbook.add_sheet('movie...

2019-05-08 21:45:22 1178 1

原创 读书笔记 机器学习-周志华 第六章 支持向量机

学习笔记 机器学习-周志华 第六章 支持向量机6.1 间隔与支持向量机6.1 间隔与支持向量机任意点到超平面距离r=∣wTx+b∣∣∣w∣∣r=\frac{|w^Tx+b|}{||w||}r=∣∣w∣∣∣wTx+b∣​两个异类向量到超平面之间的距离之和γ=2∣∣w∣∣\gamma = \frac{2}{||w||}γ=∣∣w∣∣2​,称为“间隔”(margin)。欲找到最大间隔划分平面,即...

2019-03-19 14:52:13 385

原创 读书笔记 机器学习(周志华)第三章 线性模型

读书笔记 机器学习(周志华)第三章 线性模型3.1 基本形式3.2 线性回归3.3 对数几率回归3.1 基本形式线性模型(linear model)试图通过属性的线性组合来进行预测,即f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1x_1+w_2x_2+...+w_dx_d+bf(x)=w1​x1​+w2​x2​+...+wd​xd​+b,一般用向量形式写成f(x)=w...

2019-03-02 17:22:07 375

原创 读书笔记 机器学习(周志华)第二章 模型评估与选择

读书笔记 机器学习(周志华)第二章 模型评估与选择2.1 经验误差与过拟合2.1 经验误差与过拟合“错误率”(error rate):分类错误的样本数占样本总数的比例。如果m个样本中有a个样本分类错误,则错误率E=a/mE=a/mE=a/m,相应地1−a/m1-a/m1−a/m称为“精度”(accuracy),即“精度=1-错误率”。“误差”“训练误差”(training error)或 ...

2019-03-01 17:06:37 359 1

原创 读书笔记 机器学习(周志华)第一章 绪论

读书笔记 机器学习(周志华)第一章 绪论1.1 引言1.2 基本术语1.3 假设空间1.4 归纳偏好1.5 发展历程1.6 应用现状1.7 阅读材料1.1 引言我们能做出有效的预判,是因为我们已经积累了许多经验, 而通过对经验的利用,就能对新情况做出有效的决策。机器学习就是这样一门学科, 他致力于研究如何通过计算的手段, 利用经验来改善系统自身的性能。在计算机系统中, “经验”通常以“数据”...

2019-03-01 10:57:18 304

转载 Anaconda中安装tensorflow (win10环境)

目录一. 安装anaconda二. 在anaconda中安装tensorflow三.  安装可能的异常四.  将tensorflow嵌入到IDE中已有环境:python3.6.1anaconda隔离管理多个环境,互不影响。这里,在anaconda中安装最新的python3.6.5 版本。一. 安装anaconda1. 下载地址: https://www.anacon...

2019-02-21 13:58:13 383

转载 Anaconda完全入门指南

目录1.概述2.Python本身3. Anaconda4.pycharm连接5.结语1.概述很多学习python的初学者甚至学了有一段时间的人接触到anaconda或者其他虚拟环境工具时觉得无从下手, 其主要原因就是不明白这些工具究竟有什么用, 是用来做什么的, 为什么要这么做, 比如笔者一开始也是不明白为啥除了python之外我还需要这么一个东西, 他和python到...

2019-02-21 11:24:35 294

原创 100-Days-Of-ML-Code

目录Day 1 | Data PreProcessingDay2 | Grandient DescentDay 3 | Simple Lenar RegressionDay 4 | Multiple Linear Regression  Day 1 | Data PreProcessingGet the dataset from here.Step 1 : Im...

2019-01-08 12:27:05 250

原创 Python list dict使用

listhttps://docs.python.org/3.5/tutorial/datastructures.htmldicthttps://docs.python.org/3/library/stdtypes.html#mapping-types-dict

2018-12-18 17:38:25 199

原创 机器学习:KNN对iris分类

from sklearn import neighbors #调用neighborsfrom sklearn import datasets #调用datasets里面的iris数据knn = neighbors.KNeighborsClassifier()#knn分类器#调用数据集iris = datasets.load_iris()#print(iris)#使用fit建立模...

2018-11-14 10:39:30 1671

原创 机器学习:sklearn&pydotplus实现Decision Tree

import csvfrom sklearn.feature_extraction import DictVectorizerfrom sklearn import preprocessingfrom sklearn import treeimport pydotplus'''数据集 play.csvRID age income student credit_rating Cla...

2018-11-13 21:40:45 297

原创 爬虫:re库的使用

https://blog.csdn.net/qq_1290259791/article/details/80979384

2018-11-04 00:28:34 630

原创 爬虫:requests & BeautifulSoup 实战案例

爬取猫途鹰旅游网站:https://www.tripadvisor.cn/Attractions-g60763-Activities-New_York_City_New_York.html景点信息from bs4 import BeautifulSoupimport requestsurl_saves = 'http://www.tripadvisor.com/Saves#3768...

2018-11-02 16:42:36 937

原创 爬虫:html网页源码标签

了解HTML网页标签的分类至关重要。网站:http://www.w3school.com.cn/tags/tag_hr.asp详细描述了html网页标签的分类。常见的html标签:<div></div> 表示模块,某个区域的框架<p></p> 表示字符信息,写文字内容<li></li> 表示列表&lt...

2018-11-02 16:30:53 1071

原创 爬虫:BeautifulSoup库的使用

BeautifulSoup库中文文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/常用函数:soup.select():按路径搜索需要的内容soup.select("p nth-of-type(3)")# [<p class="story">...</p>]soup.find_al...

2018-11-02 16:30:29 321

iris数据集

含4个文件,csv有标签和无标签,text有标签和无标签。 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

2018-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除