- 博客(22)
- 资源 (1)
- 问答 (3)
- 收藏
- 关注
原创 爬取新浪微博关于ios12.1.2的内容——多线程爬虫的应用
2018年12月18日凌晨,苹果正式推送ios12.1.2,博主是前天才升级的,结果升完级后发现使用数据流量上网时的信号变差了,具体有两个事例:一是在地铁出口买早餐,刷不出付款码;二是玩游戏的时候很卡。这是升级系统前没有遇到的问题。
2018-12-28 17:18:37 1077
原创 判断喜欢的电影类型——朴素贝叶斯模型的简单应用(2)
上一篇博客已经就**类型**和**制片国家**进行了建模,可初步判断一部电影是否是我喜欢的。但是我们可以看到爬取的还有一个重要的信息,那就是**剧情简介**。所以现在我们就用**剧情简介**再训练一个贝叶斯模型,用于判断是否喜欢一个电影。
2018-11-15 11:38:10 921
原创 判断喜欢的电影类型——朴素贝叶斯模型的简单应用(1)
之前我做了一个豆瓣电影信息的爬取 https://blog.csdn.net/weixin_43374551/article/details/84029439 ,共获得了8608部电影的概要信息。现在我们利用这些数据,可以做一些分析。首先我从这8608部电影中随机挑选了520部我已经看过的电影,挑选方法就是进度条随便拉到哪儿算哪儿,保证了一定的随机性。type这一列代表了我对这些电影的态度,1...
2018-11-14 14:02:33 1560 1
原创 机器学习十大经典算法之Logistic回归(学习笔记整理)
Logistic回归是一种广义线性回归模型,解决的是因变量为二分类变量的预测或判别问题。
2018-11-07 20:58:47 2319 1
原创 机器学习十大经典算法之岭回归和LASSO回归(学习笔记整理)
在线性回归模型中,其参数估计公式为$\beta=(X^TX)^{-1}X^Ty$,当$X^TX$不可逆时无法求出$\beta$,另外如果$|X^TX|$越趋近于0,会使得回归系数趋向于无穷大,此时得到的回归系数是无意义的。解决这类问题可以使用岭回归和LASSO回归,主要针对==自变量之间存在多重共线性==或者==自变量个数多于样本量==的情况。
2018-11-04 00:48:23 101436 29
原创 机器学习十大经典算法之线性回归(学习笔记整理)
一、一元线性回归一元线性回归模型也称为简单线性回归模型,模型中只含有一个自变量,数学表达式y=a+bx+εy=a+bx+\varepsilony=a+bx+ε其中a、b为回归系数,ε\varepsilonε为模型的误差项。要得到理想的拟合线,则要使误差ε\varepsilonε总体上最小,于是转换成了误差平方和最小的问题,此方法就是“最小二乘法”。推导过程:\begin{align}J(a...
2018-10-31 17:58:41 3730
原创 机器学习十大经典算法之朴素贝叶斯(学习笔记整理)
1.高斯贝叶斯分类器import pandas as pdfrom sklearn import model_selection,naive_bayes,metricsimport matplotlib.pyplot as pltdata=pd.read_excel(r'C:\Users\Administrator\Desktop\Skin_Segment.xlsx')#拆分为训练集和...
2018-10-28 12:43:12 2026
原创 机器学习十大经典算法之决策树(学习笔记整理)
一、决策树概述决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。最初的节点称为根节点(如图中的"颜色"),有分支的节点称为中间节点(如图中的"价格"),无分支的节点称为叶节点(如图中的"喜欢")优点:计算复杂度
2018-10-26 16:48:22 1755
原创 机器学习十大经典算法之K-近邻算法(学习笔记整理)
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。...
2018-10-24 20:51:28 1734
原创 抖音热门游戏Fill one-line puzzle game解法的Python代码实现
抖音热门游戏Fill one-line puzzle game解法的Python代码实现导语思路代码验证版权声明:原创文章,转载请注明出处导语最近刷抖音的时候,发现经常有人提问一个游戏的解法,于是去下载了这款游戏,发现还挺好玩的。这个游戏的玩法也很简单,就是一笔画成。比如像这样我以为这个游戏很火,其实AppStore的下载量才寥寥几千。趁它还没有完全火起来,用Python写了一个...
2018-10-10 23:40:09 2460
Access查询使用Switch函数不能超过14个条件怎么解决?
2019-04-24
判断一个词语是否是楼盘名称有什么算法思路?
2018-10-27
pyinstaller打包exe执行无法读取txt
2018-10-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人