AI
我是一个小学生,好好学习,天天向上
Lucky_JimSir
人生最终的价值在于觉醒和思考的能力,而不只在于生存。—— 亚里士多德
展开
-
置信区间与置信度到底是什么?
机器学习本质上是对条件概率或概率分布的估计,而这样的估计到底有多少是置信度?这里就涉及到统计学里面的置信区间与置信度,本文简要介绍了置信区间这一核心概念,它有助于我们从直观上理解评价估计优劣的度量方法。本文讨论了统计学中的一个基本术语 :置信区间。我们仅以一种非常友好的方式讨论一般概念,没有太多花哨的统计术语,同时还会使用 Python 完成简单的实现!尽管这个术语是非常基础的,但我们有时很难完...转载 2020-03-01 17:56:19 · 758 阅读 · 0 评论 -
生成器generator
Generator 生成器工作原理:generator 加载数据的时候只取一条,放入内存当中,当使用完毕之后该数据便被丢弃;与list的区别:list 加载数据的时候是一次性把所有的数据都加载到内存中,这样当数据量比较大的时候,可能会导致内存爆炸。list的优点在于可以重复使用。...原创 2020-01-08 15:43:04 · 159 阅读 · 0 评论 -
优秀博客搜集
轻松理解条件随机场(CRF):https://www.imooc.com/article/27795用深度学习做命名实体识别(bilstm+crf):https://www.jianshu.com/p/495c23aa5560K折交叉验证: https://blog.csdn.net/weixin_39183369/article/details/78953653...原创 2019-10-18 18:14:25 · 169 阅读 · 0 评论 -
AI项目包括的问题
文章目录数据预处理1、数据清洗2、数据变换3、数据归约特征工程1、Filter2、Wrapper3、Embedded建模数据预处理常用的有四种:数据清洗、数据集成、数据变换、数据归约1、数据清洗分箱:就是分组聚类:检测并且去除孤立点,找出并清除那些落在簇之外的值,这些孤立点被视为噪声计算机和人工检查结合:计算机检测可疑数据,然后对他们进行人工判断缺失值处理:对缺失值进行删除或者插补...原创 2019-10-18 18:10:45 · 221 阅读 · 0 评论 -
天池工业Al大赛-智能制造质量预测
赛题产品特性预测赛题背景:半导体产业是一个信息化程度高的产业。高度的信息化给数据分析创造了可能性。基于数据的分析可以帮助半导体产业更好的利用生产信息,提高产品质量。现有的解决方案是,生产机器生产完成后,对产品质量做非全面的抽测,进行产品质量检核。这往往会出现以下状况,一是不能即时的知道质量的好坏,当发现质量不佳的产品时,要修正通常都为时以晚,二是在没有办法全面抽测的状况下,存在很大漏检...原创 2019-10-18 17:48:30 · 2367 阅读 · 0 评论 -
manufacture
import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inlinetrain = pd.read_excel(r"C:\Users\Administrator\Desktop\jimsir\天池大赛\manufacture\data_fir...原创 2019-10-18 17:46:43 · 1283 阅读 · 1 评论 -
Scipy -- 使用总结
Scipy 是世界上著名的Python开源科学计算库,建立在Numpy之上。它增加的功能包括数值积分、最优化、统计和一些专用函数。Scipy函数库在Numpy的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。Scipy.io进行mat文件的写入与读取from scipy import ioio.savemat(...原创 2019-05-07 19:51:09 · 4366 阅读 · 0 评论 -
概率分布 ---- 泊松分布
1 、甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖, 的时间不够卖:你“甜在心馒头店”又不是小米,搞什么饥饿营...原创 2019-05-07 11:24:04 · 2977 阅读 · 1 评论 -
概率分布 ---- beta分布
相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能性大小。举一个简单的例子,熟悉棒球运动的都知道有一个指标就是棒球击球率(batting average),就是用一个运动员击中的球数除以击球的总数,我们一般认为0.26...原创 2019-05-07 11:08:25 · 1400 阅读 · 0 评论 -
概率分布 ---- 二项分布
二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验称为n重伯努利实验,当试验次数为1时,二项分布服从0–1分布。...原创 2019-05-07 10:57:42 · 663 阅读 · 0 评论 -
概率分布 ---- 正态分布
简介正态分布(Normal distribution),也称“常态分布”,又名高斯分布。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ^ 2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=0,σ=1时的正态分布是标准正态分布。...原创 2019-05-07 10:51:57 · 1822 阅读 · 0 评论 -
概率分布 ---- 均匀分布
简介在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。...原创 2019-05-07 10:46:20 · 5765 阅读 · 0 评论 -
概率分布 ---- 指数分布
转载自:https://blog.csdn.net/ccnt_2012/article/details/89875865原创 2019-05-07 11:24:37 · 1957 阅读 · 0 评论 -
Numpy的矩阵运算及在线性代数中的应用
一、矩阵的创建和算术运算矩阵的创建:1、手动创建: mat(‘字符串’)字符串格式:行与行之间用分号隔开;行内的元素之间用空格隔开。A=np.mat('1 2 3;4 5 6; 7 8 9')2、使用Numpy数组创建1)使用mat(ndarray)函数创建矩阵(利用reshape函数)B=np.mat(np.arange(1,10).reshape(3, 3))2)利用m...原创 2019-05-05 21:10:26 · 415 阅读 · 0 评论 -
Numpy array数组的操作
布尔索引# 创建一个随机整数数组arr2 = np.random.randint(0,50,20)# 打印结果array([17, 42, 35, 3, 38, 1, 34, 12, 24, 39, 30, 33, 46, 0, 30, 0, 32, 28, 16, 0])# 获取布尔索引arr2%2 == 0# 打印结果array([False, ...原创 2019-05-05 14:42:12 · 504 阅读 · 0 评论 -
Numpy ---- 简单使用
1. 简介Numeric Python的简称,是几乎所有python科学计算工具的基础。主要功能:ndarray: 一个具有矢量运算和复杂广播能力的快速并且节省空间的多维数组面向数组的运算: 对于数组进行快速运算的标准数学函数磁盘读写、内存映射线性代数、随机数、傅里叶变换NumPy本身并没有提供什么高级的数据分析能力,但是理解NumPy数组以及面向数组的计算将有利于使用pandas...转载 2019-04-30 17:07:09 · 319 阅读 · 0 评论 -
矩阵的特征值和特征向量
参考网址:https://www.matongxue.com/madocs/228.html原创 2019-04-30 14:40:14 · 218 阅读 · 0 评论 -
2019 年最精彩 AI 论战:李飞飞VS《未来简史》作者赫拉利!
硅谷时间 4月22日晚,在斯坦福可容纳约2000人的超级大演讲厅,以这两本畅销书享誉全球的以色列著名历史学家尤瓦尔•赫拉利(Yuval Noah Harari),与斯坦福一个多月前神秘成立的 “以人为本” AI研究院领导者李飞飞,展开了一场以人工智能为主题的对话。(活动现场:左为赫拉利,中为李飞飞,图自赫拉利 Twitter)如果 AI +生物科技入侵你的大脑,你还是你吗?赫拉利用他在 2...原创 2019-04-26 19:30:07 · 440 阅读 · 0 评论 -
一位医疗 AI 创业者的自述:这个行业到底需要什么样的产品?
医疗AI行业的“游戏规则”本身还没有制定好,企业拿证的局面恐怕还要一段时间才能见到。文 | 李雨晨“今年,将会有很多玩概念的AI创业公司死掉,”张京雷在接受雷锋网采访时表示,“这并不意外。医疗AI行业也将面临这个情况。”张京雷是一名医疗行业的老兵。2017年,张京雷加入医疗AI公司Airdoc担任市场部副总裁,主要负责制定市场战略、渠道开拓等工作。此前他在小苹果儿科医生集团担任市场和运营副...原创 2019-04-24 10:10:29 · 362 阅读 · 0 评论 -
python数据分析----Numpy (一)
一、导入模块import numpy as np二、创建 ndarray 对象,以及一些基本操作1、使用 numpy.arange 创建np.arange(start,end,step,dtype)2、使用numpy.array 创建np.array(list,dtype)3、获取数组的维度和数据类型3.1、返回一个元组,存放对象每一个维度上的大小 array.shap...原创 2019-04-23 11:07:25 · 237 阅读 · 0 评论 -
逃离数学焦虑、算法选择,思考做好机器学习项目的3个核心问题
机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注。正如吴恩达在《机器学习》这门课中所说,他将花费更多的时间来教授机器学习、人工智能的最佳实践以及如何让它们工作。好的工具,在会用和不会用的人之间存在着鸿沟。当我们做一个机器学习项目时,不纠结于各个模型算法的...原创 2019-04-18 11:24:58 · 292 阅读 · 0 评论 -
如何构建一个完整的机器学习项目
一个完整的机器学习项目过程的主要步骤:项目概述。获取数据。发现并可视化数据,发现规律为机器学习算法准备数据。选择模型,进行训练。微调模型。给出解决方案。部署、监控、维护系统参考资料:微信公众号“人工智能爱好者社区”...原创 2019-04-18 11:15:33 · 453 阅读 · 0 评论 -
学习人工智能需要哪些必备的数学基础?
问题一:学习人工智能需要哪些必备的数学基础?对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础、是否要有工程经验、对于深度学习框架应该关注什么等等?因为现在AI火了,很多产品经理/程序员都想转入AI领域。那么对于产品经理来说,针对于AI,我们需要了解些什么呢?AI PM很大程度上不同于互联网领域的产品经理,它涉及到更深的底层逻辑,对个人综合能力要求会更高一...原创 2019-04-18 11:04:19 · 6240 阅读 · 0 评论 -
机器学习第一步,从向量和矩阵开始!
全文共1466字,预计阅读时长2分钟熟练掌握C语言却总是在转型机器学习算法的道路上屡屡跌倒?懂得AI模型的逻辑却在每次伪代码修改后都被报错?你的绊脚石或许不仅仅是对于Python语法的陌生,还有对于数据集的处理摸不着头脑。这时候,就需要我们回归基本概念——从向量、矩阵开始,读懂机器学习语言。不同在何处?在一般性C语言编程中,对于数据的处理主要利用指针。熟悉它的同学们都知道,所谓内存...原创 2019-04-18 10:21:15 · 349 阅读 · 0 评论 -
sklearn与分类算法
【导读】众所周知,Scikit-learn(以前称为 scikits.learn)是一个用于 Python编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k-means 和 DBSCAN,旨在与Python 数值和科学库NumPy和SciPy互操作。本文将带你入门常见的机器学习分类算法——逻辑回归、朴素贝叶斯、KNN、SVM、决策树。01...原创 2019-04-18 10:11:11 · 947 阅读 · 0 评论 -
如何为回归问题,选择最合适的机器学习方法?
在目前的机器学习领域中,最常见的三种任务就是:回归分析、分类分析、聚类分析。那么什么是回归呢?回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。回归分析在机器学习领域应用非常广泛,例如,商品的销量预测问题,交通流量预测问题。那么,如何为这些回归问题选择最合适的机器学习算法呢?01常用回归算法这里介绍一些回归问题中常用的机器学习方法,sklea...原创 2019-04-18 10:02:23 · 512 阅读 · 0 评论 -
tensorflow 常见报错
1、问题描述:jupyter notebook中No module named ‘tensorflow’ ?python3的环境下已经安装好了tensorflow,但是jupyter中还是显示没有。解决方法: python的版本和tensorflow 的版本不兼容;具体包括TensorFlow使用的版本是2.0以上的,python使用3.7,这样是不行的;把Tensorflow的版本改为 :...原创 2019-10-05 19:55:25 · 290 阅读 · 0 评论 -
“让Keras更酷一些!”:层与模型的重用技巧
今天我们继续来深挖 Keras,再次体验 Keras 那无与伦比的优雅设计。这一次我们的焦点是“重用”,主要是层与模型的重复使用。所谓重用,一般就是奔着两个目标去:一是为了共享权重,也就是说要两个层不仅作用一样,还要共享权重,同步更新;二是避免重写代码,比如我们已经搭建好了一个模型,然后我们想拆解这个模型,构建一些子模型等。基础事实上,Keras 已经为我们考虑好了很多,所以很多情况下,...转载 2019-10-10 14:17:19 · 234 阅读 · 0 评论 -
机器学习三大框架对比
导语:Science is NOT a battle, it is a collaboration. We all build on each other’s ideas. Science is an act of love, not war. Love for the beauty in the world that surr ounds us and love to share and bu...转载 2019-09-27 21:22:31 · 828 阅读 · 0 评论 -
机器学习---目标检测
如何理解一张图片?根据后续任务的需要,有三个主要层次一、分类二、检测三、分割检测模型两阶段(2-stage):1、R-CNN(Regions with CNN features):R-CNN系列的开山之作2、Fast R-CNN: 共享卷积运算3、Faster R-CNN: 两阶段模型的深度化单阶段(1-stage):单阶段模型没有中间的区域检出过程,直接从图片获得预测结果,...原创 2019-09-24 19:48:14 · 1264 阅读 · 0 评论 -
机器学习算法汇总
机器学习知识树分类算法1、Naive Bayesian Mode 朴素贝叶斯模型2、K Nearest Neighbors (KNN) K近邻3、Support Vector Machines (SVM) 支持向量机4、Decision Trees 决策树5、Boosting6、随机森林7、Neural Networks 神经网络回归算法1、K Nearest Neighbo...原创 2019-09-24 13:55:11 · 147 阅读 · 0 评论 -
如何学习算法或者模型?(持续更新中)
面对一个陌生算法的时候,一开始无法深入地进行理解,如同在一个门缝里面看一个宫殿的内部构造,一时之间是无法看清看全的,这个时候就要考虑如何才能完全了解这座宫殿呢?从过去学习的经历,我总结出了下面一些方法:1、透过算法的名称,来对该算法有一个直观的理解;2、通过一些算法的结构图,从宏观的角度来看这个算法的构成;3、结合一些公式来对局部的结构节点作进一步的观察;4、去阅读动手用代码实现该算法,...原创 2019-08-27 20:21:47 · 895 阅读 · 0 评论 -
AI存储训练好的模型:pickle模块的使用讲解
在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型读出,而不需要重新训练模型,这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题,它可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作。Pickle模块中最常用的函数为:(1)pickle.dump(obj, file, [,protocol]) 函数的功能...原创 2019-09-06 16:53:16 · 517 阅读 · 0 评论