- 博客(10)
- 资源 (20)
- 收藏
- 关注
转载 机器学习中的范数规则化之L0、L1与L2范数
转自https://blog.csdn.net/sinat_26917383/article/details/52092040 机器学习中的范数规则化之(一)L0、L1与L2范数博客的学习笔记,对一些要点进行摘录。规则化也有其他名称,比如统计学术中比较多的叫做增加惩罚项;还有现...
2018-03-31 11:33:12 333
转载 交叉验证
转自:https://blog.csdn.net/holybin/article/details/27185659 一、训练集 vs. 测试集在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(...
2018-03-31 11:13:16 1500
转载 解决过拟合问题
转载自https://blog.csdn.net/huangfei711/article/details/79436698 如何降低过拟合?这是深度学习中非常重要的问题。关于过拟合的相关概念和过拟合带来的危害,可参考笔者之前的博客:过拟合与欠拟合简要总结。如何解决过拟合?1. 获取和使用更多的数据集对于解...
2018-03-30 22:31:18 2623
原创 3D图形、动画
创建3D柱状图"""创建3D柱状图"""import randomimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport matplotlib.dates as mdatesfrom mpl_toolkits.mplot3d import Axes3Dmpl.rcParams['
2018-03-30 10:47:12 626
原创 绘制并定制化图表
定义图表类型–柱状图、线形图、堆积柱状图"""定义图表类型--柱状图、线形图、堆积柱状图"""from matplotlib.pyplot import *x = [1, 2, 3, 4]y = [5, 4, 3, 2]figure()#线形图subplot(231)plot(x, y)#柱状图subplot(232)bar(x, y)#水平柱状图subplot(2...
2018-03-29 17:14:56 766
原创 Python数据可视化编程(三)
导入图像数据到numpy数组"""导入图像数据到numpy数组"""#method oneimport scipy.miscimport matplotlib.pyplot as pltascent = scipy.misc.ascent()plt.gray()plt.imshow(ascent)plt.colorbar()plt.show() #检查对象p...
2018-03-29 10:43:24 6635
原创 Python数据可视化编程(二)
清理异常值method one如何用中位数绝对偏差(MAD)来检测数据中的异常值: firstly,生成0~1之间的随机数 secondly,加入一些异常值 thirdly,用is_outlier检测异常值 lastly,回执两个数据集合的图表,观察区别"""清理异常值"""import numpy as npimport matplotlib.pyplot as ...
2018-03-28 21:14:49 1491
原创 Python 数据可视化编程(一)
读取CSV文件#method oneimport csvimport sysfilename = 'ch02-data.csv'data = []try: with open(filename) as f: reader = csv.reader(f) header = reader.next() data = [row for row in...
2018-03-28 19:18:12 1619 2
原创 《机器学习及实战》读书笔记之进阶篇(模型实用技巧)
3.1模型实用技巧3.1.1特征提升特征抽取、特征筛选3.1.1.1特征抽取有些用符号表示的数据特征已经相对结构化,并且以字典这种数据结构进行存储。这时,我们使用DictVectorizer对特征进行抽取和向量化,如下代码:# -*- coding: utf-8 -*-#DictVectorizer对使用字典存储的数据进行特征抽取与向量化#定义一组字典列表,用来...
2018-03-13 15:01:23 343
原创 《机器学习及实战》读书笔记之基础篇(无监督学习)
无监督学习无标签 聚类或降维2.2.1数据聚类k均值算法1.首先,随机布设K个特征空间内的点作为初始聚类中心 2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找最近的一个,并且把该数据标记为从属这个聚类中心 3.接着,在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心进行计算 4.最后,如果一轮下来,所有数据点从属的聚类中心与上...
2018-03-01 08:40:37 442
tensorflow-DeepFM-master.zip
2019-03-22
LDA主题模型.zip
2019-01-05
推荐相关.zip
2018-10-28
精益数据分析1.pdf
2018-10-14
集体智慧编程.pdf
2018-10-14
推荐系统实践.pdf
2018-10-10
受限玻尔兹曼机笔记.pdf
2018-04-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人