![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
时光爱客
明天是遥远的,我们只能从当下的努力中嗅出它的味道。
展开
-
LDA 提取新闻中的主题
先说一下遇到的几个问题:1.读取.csv文件的时候,有时候会出现编码问题,我们可以用记事本将.csv文件另存为Utf-8编码的文件就行啦,然后直接用utf-8编码方式打开。例如:df = pd.read_csv(r"*.csv", encoding='utf-8')2.用jieba分词读取新闻内容的时候有时候会出现'AttributeError: 'float' objec原创 2017-11-09 22:12:57 · 4278 阅读 · 0 评论 -
机器学习实例之PCA(主成分分析)
用sklearn自带的鸢尾花数据集,降到两维import matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.datasets import load_irisdata = load_iris()y = data.targetx = data.data#print(x)#print(原创 2017-12-10 21:47:51 · 725 阅读 · 0 评论 -
numpy多维数组的切片操作
import numpy as npitem = np.array([[1,4,5],[5,3,6],[8,15,33]])print(item[0,:])print(item[1,:])print(item[2,:])print(item[:,0])print(item[:,1])print(item[:,2])输出:[1 4 5][5 3 6][ 8原创 2017-12-11 21:00:23 · 1158 阅读 · 0 评论 -
线性回归(linear regression)
假设有线性函数: 可写成: 其中x0 = 0;定义代价函数为: 当然,有时也会写成1/2m,这就是最小二乘法。我们的任务就是选择合适的θ使得代价函数J最小。考虑梯度下降:考虑一个只有一个训练例子的时候,即m=1,则有:对于单个的样本,更新规则为:对于所有的样本,更新规则为:因为它每次更新一个参数θj的时候都需要全部...原创 2018-03-21 22:07:19 · 984 阅读 · 0 评论