自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 使用jupyter notebook

前提是正确安装好了Anaconda1、在anaconda prompt中输入jupyter notebok即可启动2、打开浏览器,进入:http://localhost:8888/,再输入自己的密码即可登录成功。然后可以通过new->python3来编写自己的机器学习任务。3、一个简单的机器学习回归任务:工业蒸汽量预测数据选择:阿里云 TIANCHI天池赛题背景:火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系

2022-03-23 13:19:31 2475

原创 关于matlab随机森林工具箱安装遇到的问题

1、randomforest工具箱:2、将这个随机森林包复制粘贴放到自己MATLAB安装目录的toolbox目录下3、然后打开MATLAB,打开上面的文件对应的路径位置。可以看到RF_Class_C是随机森林分类编译文件包RF_Reg_C是随机森林回归编译文件包4、首先编译分类包:1、打开RF_Class_C->src->mex_ClassificationRF_train.cpp文件2、然后,将文件中的mxCreateNumericMatrix里面最后的0都改成stati

2022-03-22 21:32:35 9452 5

原创 MySQL学习笔记

DB(database):存储数据库的“仓库”。它保存了一系列有组织的数据。DBMS:数据库管理系统(数据库软件)SQL:结构化查询语言,专门用来与数据库通信的语言。DBMS分为两类:–基于共享文件系统的DBMS(Access)–基于客户机–服务器的DBMS(MySQL、Oracle、SqlServer)一、启动SQL1、打开服务->找到MySQL手动打开和关闭。2、打开cmd命令行(以管理员身份进入)->net stop MySQL(停止)、net start MySQL(启动

2020-10-26 20:48:21 301 1

原创 mysql

本单元目标一、为什么要学习数据库二、数据库的相关概念 DBMS、DB、SQL三、数据库存储数据的特点四、初始MySQL MySQL产品的介绍 MySQL产品的安装 ★ MySQL服务的启动和停止 ★ MySQL服务的登录和退出 ★ MySQL的常见命令和语法规范 五、DQL语言的学习 ★ 基础查询 ★ 条件查询

2020-10-25 10:19:34 164

原创 算法

查找算法顺序表查找int Sequential_search(int *a, int n, int key){ int i; for (i = 1; i <= n; i++) { if (a[i] == key) return i; } return 0;}优化:int Sequential_search2(int *a, int n, int key){ int i; a[0] = key; i = n; while (a[i] != key) {

2020-09-10 17:32:05 100

原创 数据结构基本结构

线性表线性表的顺序存储结构# define OK 1# define ERROR 0# define TRUE 1# define FALSE 0typedef int Status;# define MAXSIZE 20typedef int ElemType;typedef struct{ ElemType data[MAXSIZE]; int length;}SqList;//获得元素Status GetElem(SqList L, int i, ElemType

2020-08-31 17:16:31 206

原创 NLP文本分类问题-电影评论的情感分析

预训练词嵌入数据集是kaggle上的竞赛数据文本分类问题-电影评论的情感分析。https://www.kaggle.com/columbine/imdb-dataset-sentiment-analysis-in-csv-format。从头开始学习嵌入import pandas as pdimport numpy as np#读取csv文件train = pd.read_csv('/kaggle/input/imdb-dataset-sentiment-analysis-in-csv-.

2020-07-28 16:54:29 2277

原创 DC竞赛

任务:信用风险用户识别赛题分析:监督二分类任务比赛链接:DC竞赛-大数据竞赛平台 数据:数据集共分为训练数据集、初赛测试数据集。训练数据集中的文件包含:黑白样本标签(0/1):train_label.csv,共47782条数据。脱敏后的用户基础信息:train_base.csv,共47782条数据。脱敏后的用户操作信息:train_op.csv,共2774988条数据。脱敏后的用户交易信息:train_trans.csv,共591266条数据。初赛测试数据集包含:脱敏后的用户基础信息

2020-07-25 15:58:05 1738 14

原创 绘制学习曲线代码

from sklearn.svm import LinearSVCfrom sklearn.learning_curve import learning_curve#绘制学习曲线,以确定模型的状况def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, train_sizes=np.linspace(.1, 1.0, 5)): """ 画出data在某模型上的l

2020-07-25 13:26:11 408

原创 TiANCHi新闻文本分类代码解读

Task 2 数据读取和数据分析import pandas as pdtrain_df = pd.read_csv(r"E:\tianchi\input\train_set.csv\train_set.csv", sep='\t', nrows=100)1、读取的路径2、分隔符sep。每列的分割字符。设置为’\t’即可3、nrows。表示读取的行数。这里表示先读取100行。正式训练时去掉即可。train_df.head()显示前5行数据%pylab inline#获取每行句子的长度。

2020-07-25 13:23:13 363 1

原创 卷积神经网络的简易实战

kaggle——10 Monkey Species数据集数据集包含两个文件,训练集和验证集。每个文件夹包含10个标记为n0〜n9的子文件夹,每个子生文件夹不同类型的猴子。图像尺寸为400x300像素或更大,并且为JPEG格式(近1400张图像)。具体如下:开始实战可以直接在kaggle官网上使用平台提供的GPU来训练模型:在对应的数据集下面直接New Notebook即可。然后可...

2020-04-23 10:12:58 630

原创 基于tensorflow2.0的深度学习 三

基于卷积神经网络的深度计算机视觉卷积神经网络(CNNs)起源于对大脑视觉皮层的研究, 广泛应用于图像搜索服务、自动驾驶汽车、自动视频分类系统等。此外,CNN还不局限于视觉感知:它们在许多情况下也是成功的,如语音识别和自然语言处理。 不过,我们现在将专注于视觉应用。为什么不简单地使用常规的全连接深层神经网络进行图像识别任务呢? 不幸的是,虽然这对小图像(例如MNIST)可以正常工作,但是由于需要...

2020-04-21 17:51:47 1515

原创 基于tensorflow2.0的深度学习 二

训练深度神经网络对于深度神经网络(10层或者更多层),每层包含数百个神经元。那么训练神经网络你会遇到如下的问题:梯度消失或者梯度爆炸,它们会影响深度神经网络,从而导致低层训练困难没有足够的训练数据或者没有足够的标签训练的速度非常慢一个有数百万参数的模型会很容易出现过度拟合训练集的风险一、梯度消失\爆炸问题梯度消失:由于链式法则,梯度经常会随着算法进展到更低层时变得越来越小。导致的...

2020-04-18 18:31:52 909

原创 基于tensorflow2.0的深度学习 一

人工神经网络 Artificial neural networks(ANN)一、神经元->感知器->多层感知器感知器(The Perceptron)神经元:神经元是线性阈值单元(LTU)、又叫阈值逻辑单元(TLU)LTU的工作:首先每个输入都有一个对应的权重然后LTU对其加权求和:z = w1 x1 + w2 x2 + ⋯ + wn xn = x⊺ w再对结果应用一个...

2020-04-14 16:31:35 853

原创 学习《机器学习实战》八

降维

2020-03-05 22:33:08 234

原创 学习《机器学习实战》七

集成学习和随机森林集成学习集成学习:聚合一组预测器(如分类器或回归器)的技术。投票分类器比如,我们已经用一组训练集训练好了一些分类器:逻辑回归分类器、SVM分类器、随机森林分类器、K-近邻分类器等多种预测器。将这些预测器预测出来的分类结果聚合,得到票数最多的结果作为预测的类别。其中:如果聚合的是预测的类别则叫做硬投票分类器;如果聚合的是类别的概率(即,训练好的模型具有predict_pr...

2020-03-03 11:24:20 312

原创 python数据可视化分析

python数据可视化分析

2020-02-15 16:22:48 2843

原创 Pandas数据探索

Pandas数据探索查看数据排序索引和获取数据应用函数到单元格、列、行分组汇总表增删行列pandas主要数据结构是Series和DataFrame类1、series是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)及一组与之相关的数据标签(即索引)组成。2、DataFrame是一个二维数据结构,即一张格,其中每列数据的类型相同。你可以把它看成由 Series...

2020-02-15 13:00:01 486

原创 学习《机器学习实战》四

训练模型训练模型就是搜寻使成本函数(在训练集上)最小化的参数组合。有助于快速定位到合适的模型、正确的训练算法,以及一套适当的超参数。一、线性回归(LinearRegression)线性模型就是对输入特征加权求和,再加上一个偏置项的常数,以此进行预测。线性回归模型预测:衡量一个回归模型性能指标:均方根误差(RMSE),但求均方误差(MSE)更方便我们生成一些线性数据来测试这个...

2019-12-21 14:29:52 263

原创 学习《机器学习实战》三

分类加载数据书上的代码根本运行不了,所以百度下载了数据文件。MNIST数据是.mat文件(matlab文件),读写.mat文件使用scipy.io模块import scipy.io as sioimport ospath1 = r'C:\Users\点解\scikit_learn_data\mldata'mat_path = os.path.join(path1, 'mnist-ori...

2019-11-30 17:32:58 366 1

原创 学习《机器学习实战》二

端到端的机器学习项目主要步骤:观察大局获得数据从数据探索和可视化中获得洞见机器学习算法的数据准备选择和训练模型微调模型展示解决方案启动、监控和维护系统一、观察大局确定系统是监督式、还是无监督式;是分类任务还是回归任务——确定了这个项目是回归任务(预测房价)选择性能指标,回归问题的典型性能衡量指标是均方根误差(RMSE)、平均绝对误差(MAE)、标准差(SD)...

2019-11-24 13:49:11 615

原创 学习《机器学习实战》一

机器学习实战基于Scikit-Learn和TensorFlow手写笔记第一章

2019-11-19 21:45:37 141

原创 应用概率统计(陈魁 编著)部分答案(统计部分7-9章)

***以下答案为7~9章统计部分的答案 ****第7章 数理统计的基本概念习题7.1、7.2答案:第8章 参数估计知识点总结1、矩法估计步骤2、极大似然估计步骤3、参数的区间估计习题8.1、8.2、8.3、8.5、8.6、8.8、8.11、8.12答案第9章 假设验证知识点总结习题9.1、9.2、9.3、9.5、9.6、9.8答案:...

2019-11-19 12:33:21 11556 1

原创 应用概率统计(陈魁 编著)部分答案(概率部分1~6章)

***以下答案为1~6章概率部分的答案 ***第1章 随机事件及其概率习题1.4、1.8、1.9、1.12、1.13答案:第2章 离散型随机变量习题2.1、2.4、2.6、2.9、2.12答案:第3章 连续型随机变量习题3.2、3.3、3.4、3.5、3.8、3.9、3.13、3.18答案第4章 随机变量的数字特征习题4.1、4.6、4.8答案第5章 ...

2019-11-19 11:07:02 25555 5

原创 学习《机器学习实战》

学习《机器学习实战-基于Scikit-Learn和TensorFlow》心得笔记#第3章 分类刚开始学习机器学习,是导师推荐的书。遇到的困难可不是一般的多呐。都自闭了都。想着跟着打打代码总能学到点思路。但是第二章的数据是在别的网站上面下载的,我这种小学鸡真的搞不定,看了几天之后就跳过第二章想着第三章用的数据集是SKlearn提供的数据集,应该可以轻易获取了吧。可是现实给了我一记响亮的耳光。跟...

2019-10-17 21:11:57 230

10_monkeys_model_1.ipynb

该notebok使用tensorflow框架来实现kaggle官网上的10 monkey数据集的图像分类任务。使用的是卷积神经网络。

2020-07-25

TensorFlow2_classification.ipynb

该notebok使用tensorflow框架来实现fashion-mnist数据集顺序API的图像分类任务。最简单的流程和结构

2020-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除