![](https://img-blog.csdnimg.cn/dfe93e178a5c45c9a84c8055890badb3.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能
人工智能的基本算法,以及相比赛以及算法的相关内容
仓小鼠
某位神秘的研究僧
展开
-
tensorflow2(4)
第四天学习tensorflowimport tensorflow as tfimport numpy as npfrom tensorflow import kerasa = tf.random.normal([4,35,8])a<tf.Tensor: id=5, shape=(4, 35, 8), dtype=float32, numpy=array([[[-0.9...原创 2020-04-15 20:48:21 · 181 阅读 · 0 评论 -
pandas基础学习
数据结构简介在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame。Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据,还具有索引的自动对齐功能;DataFrame类似于numpy中的二维数组,同样可以通用numpy数组的函数和方法,而且还具有其他灵活应用,后续会介绍到Series的创建通过一维数组创...原创 2020-04-25 08:59:30 · 293 阅读 · 0 评论 -
tensorflow2(6)
数据增幅import tensorflow as tfimport numpy as npfrom tensorflow import kerasfrom tensorflow.keras import layers,optimizers,datasetsa = tf.constant([1,2,3,4,5,6])x = tf.range(9)x<tf.Tens...原创 2020-04-18 21:21:54 · 208 阅读 · 0 评论 -
numpy基础复习
Numpy学习ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。用于对整组数据进行快速运算的标准数学函数(无需编写循环)。用于读写磁盘数据的工具以及用于操作内存映射文件的工具。线性代数、随机数生成以及傅里叶变换功能。用于集成由C、C++、Fortran等语言编写的代码的A C API。NumPy本身并没有提供多么高级的数据分析功能,理解NumPy数组以及面向...原创 2020-04-22 20:58:30 · 545 阅读 · 0 评论 -
seaborn学习
seaborn的不用刻意去学,知道大概的意思,参数记不住没有关系,可以后续去相关文档上面查找下面我提供一个连接很好的文章seaborn这篇文章总结的很全面该有的图形操作也都有。...原创 2020-04-29 21:55:42 · 106 阅读 · 0 评论 -
tensorflow2(2)
第二天学习tensorflow2import numpy as npimport tensorflow as tf类型转换a = tf.constant(np.pi,dtype=tf.float16)a<tf.Tensor: id=0, shape=(), dtype=float16, numpy=3.14>tf.cast(a,tf.double)<t...原创 2020-04-11 21:57:57 · 1509 阅读 · 0 评论 -
tensorflow2(5)
第五天学习tensorflow 进度变得更慢了,后面学习神经网络实现就更困难了import tensorflow as tfimport numpy as np数据统计在神经网络的计算过程中,经常需要统计数据的各种属性,如最值、最值位置、均值、范数等信息。由于张量通常较大,直接观察数据很难获得有用信息,通过获取这些张量的统计信息可以较轻松地推测张量数值的分布。向量范数掌握L1 范...原创 2020-04-18 21:23:29 · 243 阅读 · 0 评论 -
模型融合学习以及应用
模型融合背景应用场景精度要求高,时效性低,可以提升准确率,以及一些比赛,模型融合是最重要的方式和方法。(注意:后期大佬们模型融合会得到非常好得效果)分类举个例子,就相当于对于一个二分类来说,主要有三个模型,通过三个最基础的模型来进行投片以此来实现最终的分类的结果。回归对于回归,简答的思路就是平均,对于改进版本是加权平均,例如三个模型,A,B,C那么对模型进行排名,那么A占的权重是3/6,2/6,1/6。对于Bagging和Boosting方法都是通过这种弱分类的方法来实现。BaggingB原创 2020-08-27 19:05:01 · 233 阅读 · 0 评论 -
tensorflow2学习第一天
第一天学习数据类型数据类型import tensorflow as tftf.constant(1)<tf.Tensor: id=0, shape=(), dtype=int32, numpy=1>就是一个整数类型的1tf.constant(1.)<tf.Tensor: id=1, shape=(), dtype=float32, numpy=1.0>...原创 2020-04-11 08:50:45 · 221 阅读 · 3 评论 -
数据分析四大工具
SQL-素材提供者只要学会了一个语言其他就好说了,从mysql开始清洗,统计,处理Excel-分析探索者优点:(可以作图,建模,以及数据透视表)普及度比较高,强大的函数库和扩展包(可以用来建模,可以用来优化求解)门槛最低的自动化工具界面化操作无需编程Python-建模终结者优点不说了,可以大规模的数据分析,以及计算,利用python处理和建模Tableau-人人可用的可视化方式图表制作,可以很简单的作用,也可以进行数据的的处理。...原创 2020-08-27 21:00:01 · 161 阅读 · 0 评论 -
学习tensorflow2(3)
学习tensorflow第三天学习进度有点慢,今天争取多学点Broadcastingimport tensorflow as tfimport numpy as npBroadcasting 称为广播机制(或自动扩展机制),它是一种轻量级的张量复制手段,在逻辑上扩展张量数据的形状,但是只会在需要时才会执行实际存储复制操作。对于大部分场景,Broadcasting 机制都能通过优化...原创 2020-04-12 15:08:53 · 768 阅读 · 0 评论 -
Graph Convolutional Networks for Text Classification
原创 2020-06-15 10:13:38 · 122 阅读 · 0 评论 -
目标写出正则表达式分开大量病例
总体思路1.首先确定相对路径1.1 读文件2.然后写字符串正则表达式匹配初步诊断2.2首先根据每行数据观察是否含有初步诊断,假如没有则遍历下一行,若是存在在则模糊查询肿瘤是否需存在,若是存在则记录下标,若是不存在则继续向后查询,若是匹配到诊断依据和鉴别诊断则直接跳出查找下一个文本3.利用模糊正则匹配匹配初步诊断中的肿瘤的查询4.记录保存相关文档序号5.将记录的相关文档转移到另一个文件...原创 2019-11-07 13:56:44 · 163 阅读 · 0 评论 -
An Unsupervised Representation to Predict the Future of Patients from the Electronic Health Records
无监督从电子健康病例预测患者未来的健康摘要电子健康记录(EHR)的二次使用有望推动临床研究的发展和改善告知临床决策。汇总和表示患者数据方面的挑战阻止了使用EHR进行预测建模的广泛实践。在这里,我们介绍了一种新颖的无监督的特征学习方法从EHR数据得出通用的患者代表促进临床预测建模。特别是三层去噪自动编码器堆栈用于捕获约EHRs的汇总EHR中的分层规则和依存关系来自西奈山数据仓库的700,000名...原创 2019-11-07 15:29:28 · 872 阅读 · 0 评论 -
小白打比赛第一步
打比赛需要会的东西;主要看了这个博主的经验对打比赛有了大致的了解打比赛需要的知识原创 2020-05-26 15:53:26 · 142 阅读 · 0 评论 -
5.1学习笔记(竞赛)
主要学习论文修改方法:建模,论文比赛:原创 2020-05-01 21:48:55 · 92 阅读 · 0 评论 -
二手车价格预测
比赛介绍天池二手车预测大赛,在比赛之前需要学习一些基础的知识,在此提出了几个很好的比赛的笔记,以便于以后采用数据进行分析。数据分析:之零基础入门数据挖掘特征工程:之零基础入门数据挖掘建模调参:之零基础入门数据挖掘数据挖掘终篇!一文学习模型融合!从加权融合到stacking, boosting基本的数据集和数据在我的github上面:后续更新...原创 2020-12-04 14:47:30 · 254 阅读 · 0 评论 -
打好天池比赛的步骤
如何在比赛中取得好成绩并成为大牛:会基本知识掌握学习方法用于实践多与人交流参与天池比赛需要会的基础知识xgb,lgb,catboost,numpy,matplotlib,seaborn,sklearn,keras 常用的基础数据数据挖掘常用的类(PS:sklearn可以多学一点,在无论图像还是自然处理还是数据挖掘等都需要sklearn的知识)参见比赛的步骤报名参赛(PS:报名...原创 2020-05-03 15:36:41 · 1626 阅读 · 0 评论 -
红酒数据集
主要看了深度学习,数据的基本处理方法不是很熟练,需要加强以及学习了红酒数据的处理方法处理了红酒数据集的处理方法:具体请看我的github主要学习了对天池上面的对学生成绩的与预测值的分析,并且完成了对数据的基本的分析的操作,对于美国研究生是否被录取,并且录取决定于那些因素...原创 2020-04-28 15:32:43 · 102 阅读 · 0 评论 -
天池新闻分类大赛基本思路
之前一直在储备知识,今天准备上手一个比赛。数据集来比赛,基本代码赛后会传到我的github1.机器学习方法进行机器学习是利用历史数据训练模型并将此模型用于机器学习的预测任务。对于图形领域给定N个样本M个特征组成NxM个样本特征完成预测,图像领域的每张图片可以看做hight,width,3的特征图,一个三维矩阵进行运算。自然语言处理的领域这种方法是不可行的,由于文本长度不固定,需要将文本表示为计算机能够运算的向量(word Embeding),对于文本处理来说将不定长的文本转化为定长的空间之中这.原创 2020-12-04 14:45:40 · 198 阅读 · 0 评论 -
4.29学习笔记(遗传算法&机器学习)
主要学习了机器机器学习处理基础的数据logistic回归随机森林的算法进行数据分析具体的分析方法见我的天池主页天池这个算法需要更进一步的了解...原创 2020-04-29 21:11:06 · 241 阅读 · 0 评论 -
YOLO原理与操作
目标检测1.应用检测2.好多领域是CV总要目标检测多检测,单检测(多检测优化)图像识别深度主要算法滑窗算法深度学习算法,不同的卷积,把目标检测,滑窗位置为物体位置;缺点:存在大量冗余,效率低可以非常高效进行,滑窗之能看见自己的部分,无法更大部分。区域检测算法健侧出蓝颜色为物体,黄颜色是最大外接矩形,""“这是传统的图形学来建立”"RPN采用CNN的方式检测物体区域YOLOyoloV1,V2,V3Bounding Box轴对齐的框,带方向的框,可以带角度。标记原创 2020-12-04 14:44:27 · 280 阅读 · 0 评论 -
李航:统计学习方法(2)
统计学习以及监督学习这里主要是对李航老师的统计学习方法的一个总结,有的地方可能不恰当,毕竟是个人理解,如果觉得总结的不好的,可以去看书,文本有些图片也是借用李航老师。统计学习重点:统计学习运用模型对数据进行预测与分析,也被成为机器学习。特点:建立在计算机上面,数据研究为对象,目的对数据分析,统计学习为核心应用模型,多个方法的交叉学科。对象:从数据出发提取特征。本书:讨论离散变量方法,且介绍了利用数据构建模型,并且对数据进行分析,观测和收集问题不做讨论。目的:用于对数据预测与分析通过对数据的原创 2020-07-20 14:45:22 · 256 阅读 · 0 评论 -
图像分类基本知识点
应用场景图像分离技术将相册中的图,不在杂乱,淘宝上面的衣服的情况信息,对于医疗的影响识别系统,实例数据集猫狗数据集,0-9数据集,花卉数据集,imageNet数据集,根据层次结构数据集。作用通过数据集的上面的精度表现图像分类模型图像分类的原理矩阵输入-------卷积(抽取特征)-------relu(激活函数,非线性拟合函数,拟合x,y映射)-----池化层(缓解对物体物质的过度依赖)-------全连接层(抽取的全连接进行分类)--------softmax(多进行分类).原创 2020-07-22 16:58:06 · 1188 阅读 · 0 评论 -
数据分析和特征工程
为什么做数据处理课上老师讲的数据例如鸢尾花数据,红酒数据,波士顿数据等等,都是处理好的数据,数据很干净,不会出现缺失等情况。利用对于机器学习模型想要获得更好的结果需要更为合适的数据,因此数据分析以及数据处理就变得很有必要数据挖掘的五大流程1,获取数据 2,数据预测处理3,特征工程4,建模5,上线sklearn 的数据预处理和特征工程数据预处理数据无量纲化不同规格数据转化为统一规格,不同分布数据转化为特定分布。无量纲化就是将数据转化为需要的数据。对于数据无纲化以后能够加快模型的求解速度,以及原创 2020-07-21 10:00:29 · 378 阅读 · 0 评论 -
BP神经网络误差反向推导
根据书上内容整理的。方便以后使用。原创 2020-05-13 23:26:56 · 170 阅读 · 0 评论 -
深度学习优化器Adam解析
Adam的优点Adam主要结合了AdamGrad函数以及RMSProp这两个算法的优点。具体的方程和公式看这篇博客优化器的几种方法原创 2020-05-14 20:54:59 · 669 阅读 · 0 评论 -
关于数据中的空值
数据中的空值处理对于数据处理来说在数据库中主要有两种存储方式:1空字符(“”),2空值(null)具体操作方法主要整理出两种方法:具体操作处理代码写的很不错原创 2020-05-15 15:22:39 · 408 阅读 · 0 评论 -
常见评价指标整理(通俗易懂)
(Ps:图片不是我自己的制作的,借用别人的图片)原博客连接:https://my.oschina.net/liangtee/blog/340317(PS:这里要明确几个概念)Y:实际正类N:实际负类p:预测正类n:预测负类TP :正类预测为正类(真正)TN :负类预测为负类(真负)FP :负类预测为正类(假正)FN :正类预测为负类(假负)ROC,以及AUC曲线被称为分类指标ROC:ROC曲线横坐标:fp=假正/实际负类ROC曲线纵坐标:tp=真正/实际正类(注意:R转载 2020-05-14 21:52:18 · 721 阅读 · 0 评论 -
为啥要用激活函数
为啥要用激活函数(PS:这里为经常会产生误解为啥非得用激活函数,希望再出现问题时候看看这文章能不迷茫)在深度学习和机器学习中主要有两大类的问题1.分类问题(0,1)2.回归问题(一组连续值)加入不采用激活函数,那么只能处理一下简单的线性问题,例如采用一条直线去分解一个分类问题,但是线性分类问题只能分解可分问题,有些数据例如月牙形的数据分布,以及圆环形的数据分布,只是采用简单的数据分布却不是那么容易,因此采用激活函数能使得函数处理非线性问题。常用的激活函数:sigmoid函数:ReLu函数原创 2020-05-13 22:15:39 · 215 阅读 · 0 评论 -
python中的lambda函数
lambda是一个匿名函数。主要作用就是写函数简单不用去想复杂的名字,且函数的作用很简单,调用过以及那就不再调用了原创 2020-05-02 15:40:35 · 111 阅读 · 0 评论