- 博客(5)
- 资源 (3)
- 收藏
- 关注
原创 python爬虫解析json数据报错(unicode error) 'utf-8' codec can't decode byte 0xbb in position 0
先解释一些概念序列化(Serialization):将对象的状态信息转换为可以存储或可以通过网络传输的过程,传输的格式可以是JSON、XML等。反序列化就是从存储区域(JSON,XML)读取反序列化对象的状态,重新创建该对象。JSON(JavaScript Object Notation):一种轻量级数据交换格式,相对于XML而言更简单,也易于阅读和编写,机器也方便解析和生
2016-09-25 16:32:52 16599 1
转载 Vim命令合集
命令历史以:和/开头的命令都有历史纪录,可以首先键入:或/然后按上下箭头来选择某个历史命令。启动vim在命令行窗口中输入以下命令即可vim 直接启动vimvim filename 打开vim并创建名为filename的文件文件命令打开单个文件vim file同时打开多个文件vim file1 file2 file3 ...在vim窗口中打开一个新
2016-09-20 09:55:01 256
转载 最大似然估计法(MLE)
最大似然估计(Maximum Likelihood Estimation),是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立同分布的。一、最大似然估计法的基本思想 最大似然估计法的思想很简单:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个 作为真 的估计。
2016-09-18 21:14:05 37956
原创 【3】机器学习实战 第五章 logistic回归
1.getA()方法def plotBestFit(weights): dataMat, labelMat = loadDataSet() dataArr = array(dataMat) #将每个数据点的x,y坐标存为矩阵的形式 n = shape(dataArr)[0]
2016-09-02 15:15:09 639
原创 【2】机器学习实战 第三章 决策树的构造
1.数据类型标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析)本章的决策树算法是ID3,还有其他的决策树算法例如CART,C4.,他们有各自的优缺点。本章的决策树算法适合用来处理标称型数据,尽管通过量化的方法将数值
2016-09-01 17:59:52 479
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人