![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 92
zjLOVEcyj
composing code was a kind of art
展开
-
sklearn基于贝叶斯算法进行新闻文本分类
所需数据集在搜狗实验室即可下载http://www.sogou.com/labs/resource/ca.phpimport jiebaimport pandas as pdimport reimport numpy as npfrom wordcloud import WordCloudfrom jieba import analyseimport warningswarnings.filterwarnings("ignore")from gensim import corpora,原创 2020-07-25 11:42:48 · 960 阅读 · 1 评论 -
决策树和随机森林对经典鸢尾花数据集分类
1.决策树import pandas as pdimport numpy as npfrom sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.tree import export_graphvizfrom sklearn.tree import De...原创 2020-04-23 16:26:54 · 5660 阅读 · 1 评论 -
逻辑回归实现音乐类型分类
1训练模块import numpy as npfrom sklearn import linear_model, datasetsimport matplotlib.pyplot as pltfrom scipy.stats import normfrom scipy import fftfrom scipy.io import wavfile# 准备音乐数据,进行傅里叶变换取前...原创 2020-04-17 15:30:58 · 503 阅读 · 0 评论 -
逻辑回归对经典鸢尾花数据集进行三分类预测
import numpy as npfrom sklearn import datasetsfrom sklearn.linear_model import LogisticRegressionimport matplotlib.pyplot as pltiris = datasets.load_iris() #获取鸢尾花数据集#获取数据集的全部行,但只取其第四列即花瓣长度X = ...原创 2020-04-13 15:34:32 · 2232 阅读 · 0 评论 -
np.linspace()用法
np.linspace(a,b,c)用于创建一个等差序列的向量,向量值是[a,b]之间均匀分布的c个实数import numpy as nparithmetic_sequence = np.linspace(0,10,9).reshape(-1,1)print(arithmetic_sequence)输出结果如下:[[ 0. ][ 1.25][ 2.5 ][ 3.75][...原创 2020-04-13 15:17:22 · 16939 阅读 · 0 评论 -
利用sklearn.preprocessing.StandardScaler进行数据标准化
在机器学习开发中由于某些特征值不稳定,波动较大,会对我们求参时产生不利影响,所有常常需要进行数据标准化,在此专门记录一下数据标准化的方法1. 首先导入模块from sklearn.preprocessing import StandardScalerimport numpy as np2. 接着实例化一个标准化对象std = StandardScaler()3. 准...原创 2020-02-18 19:14:22 · 2733 阅读 · 0 评论 -
sklearn内置加利福尼亚州房价数据集建立决策树并利用graphviz和pydotplus绘制树模型
#导入模块import matplotlib.pyplot as pltimport pandas as pd#导入sklearn内置的房价数据集from sklearn.datasets.california_housing import fetch_california_housinghousing = fetch_california_housing()#输出数据集描述信...原创 2020-02-24 14:40:36 · 1555 阅读 · 0 评论 -
sklearn.ensemble.RandomForestRegressor建立随机森林,GridSearchCV进行参数选择
import pandas as pd#使用sklearn导入决策树模块from sklearn import tree#导入sklearn内置的房价数据集from sklearn.datasets.california_housing import fetch_california_housing#获取房价数据集housing = fetch_california_housing...原创 2020-02-24 15:27:22 · 3067 阅读 · 0 评论 -
tf.nn.embedding_lookup()的用法
tf.nn.embedding_lookup(a,b)的作用主要在于通过索引b去选取张量a当中的向量,如果b是两行矩阵,则选取出a中的两组向量组成两个矩阵返回,每个矩阵通过b的每行元素值去选取a中的对应向量,示例如下:import tensorflow as tfimport numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = n...原创 2020-02-25 16:33:53 · 131 阅读 · 0 评论 -
np.c_[a,b]和np.r_[a,b]的用法与区别
np.c_[]用于将两个矩阵按列相连,即左右相连,要求两矩阵行数相同np.r_[]用于将两个矩阵按行相连,即上下相连,要求两矩阵列数相同import numpy as npa = [[1,2,3],[4,5,6],[7,8,9]]b = np.ones((3, 1))c = np.ones((1, 3))#np.c_[a, b]用于按列连接两个矩阵 即把两个矩阵左右相连 要...原创 2020-02-26 22:22:21 · 702 阅读 · 0 评论 -
np.cumsum()的用法
np.cumsum(a, axis = 0)用于将数组按行累加,譬如import numpy as npa = np.array([[1,2,3],[4,5,6]])b = np.cumsum(a, axis=0)print(b)输出结果为[[1 2 3][5 7 9]]Process finished with exit code 0np.cummsum(a, axis ...原创 2020-03-01 17:00:03 · 16658 阅读 · 3 评论 -
pandas读取分析保险数据
import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import PolynomialFeaturesfrom sklearn.linear_model import LinearRegression#读入数据data = pd.read_csv('./data/insurance.c...原创 2020-04-12 16:35:14 · 284 阅读 · 0 评论 -
polynomial regression
polynomial regression 即多项式线性回归,是处理面对非线性数据但又想对其使用线性算法时的一种数据转换方式,会增加数据的维度,譬如样本数据为x1,x2,那么转换后的样本特征即为x1, x2, x1*x2, x1^2, x2^2...原创 2020-03-31 21:52:52 · 618 阅读 · 0 评论 -
sklearn不同惩罚项的线性回归模拟实现
lassoimport numpy as npfrom sklearn.linear_model import Lassofrom sklearn.linear_model import SGDRegressorX = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)#实例化一个lasso回归对...原创 2020-03-30 10:02:44 · 355 阅读 · 0 评论 -
sklearn带惩罚项的线性回归
import numpy as npfrom sklearn.linear_model import Ridge #岭回归from sklearn.linear_model import SGDRegressor #随机梯度下降#模拟数据X = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)#...原创 2020-03-25 21:45:09 · 828 阅读 · 0 评论 -
python模拟实现线性回归解析解求最优模型
import numpy as np #数值计算库import matplotlib.pyplot as plt #绘图库# 这里相当于是随机X维度X1,rand是随机[0,1)均匀分布 形状是100行1列X = 2 * np.random.rand(100, 1)# 人为的设置真实的Y一列,np.random.randn(100, 1)是设置error,randn是标准正...原创 2020-03-17 12:03:04 · 690 阅读 · 0 评论