自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

转载 Python建立多线程任务并获取每个线程返回值

转自:https://www.cnblogs.com/bethansy/p/7965820.html1.进程和线程    (1)进程是一个执行中的程序。每个进程都拥有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据。进程也可以派生新的进程来执行其他任务,不过每个新进程都拥有自己的内存和数据栈,所以只能采用进程间通信(IPC)的方式共享信息。    (2)线程与进程类似,不过他...

2018-09-29 17:02:05 1073

转载 CPU核数跟多线程的关系

一直以来有这样的疑惑,单核CPU适合多线程吗?是不是几个核的CPU开几个线程是最合适的?今天就这一问题查了一些资料,现整理如下:    要说多线程就离不开进程,进程和线程的区别在这里就不详细说了,只将关键的几点:a)进程之间是相互独立的,不共享内存和数据,线程之间的内存和数据是公用的,每个线程只有自己的一组CPU指令、寄存器和堆栈,对于线程来说只有CPU里的东西是自己独享的,程序中的其...

2018-09-29 14:30:03 2030 1

转载 cpu、核与线程

cpu与核心物理核物理核数量=cpu数(机子上装的cpu的数量)*每个cpu的核心数虚拟核所谓的4核8线程,4核指的是物理核心。通过超线程技术,用一个物理核模拟两个虚拟核,每个核两个线程,总数为8线程。 在操作系统看来是8个核,但是实际上是4个物理核。 通过超线程技术可以实现单个物理核实现线程级别的并行计算,但是比不上性能两个物理核。单核cpu和多核cpu都是一个cpu,不...

2018-09-29 11:38:45 667

转载 关于sklearn下class_weight参数的一点源码阅读与测试

版权声明:欢迎转载,请注明原出处 https://blog.csdn.net/go_og/article/details/81281387一直没有很在意过sklearn的class_weight的这个参数的具体作用细节,只大致了解是是用于处理样本不均衡。后来在简书上阅读svm松弛变量的一些推导的时候,看到样本不均衡的带来的问题时候,想更深层次的看一下class_weight的具体作用方式,...

2018-09-27 14:52:07 2466

转载 Sklearn-LogisticRegression逻辑回归(有处理样本不均衡时设置参数的方法)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/CherDW/article/details/54891073逻辑回归:可以做概率预测,也可用于分类,仅能用于线性问题。通过计算真实值与预测值的概率,然后变换成损失函数,求损失函数最小值来计算模型参数,从而得出模型。 sklearn.linear_model.LogisticRegres...

2018-09-26 20:09:28 14274

转载 不平衡数据的分类评价指标总结

转自:https://blog.csdn.net/sqiu_11/article/details/78396443识别任务中混淆矩阵(Confusion Matrix)用于评价算法好坏的指标。下图是一个二分类问题的混淆矩阵:TP:正确肯定——实际是正例,识别为正例FN:错误否定(漏报)——实际是正例,却识别成了负例FP:错误肯定(误报)——实际是负例,却识别成了正例TN:正...

2018-09-26 19:46:53 6975

转载 [干货]如何从不均衡类中进行机器学习

参考自:https://www.svds.com/learning-imbalanced-classes/引言如果您刚从机器学习课程中学习,那么您所使用的大多数数据集都相当容易。除其他事项外,在构建分类器时,样本类是平衡的,这意味着每个类的实例数量大致相同。教师通常使用清理过的数据集,以专注于讲授特定的算法或技术而不受其他问题的干扰。通常你会在两个维度中显示如下的例子,用不同颜色(或形状)...

2018-09-26 18:26:20 384

转载 机器学习中的类别不均衡问题

基础概念类别不均衡是指在分类学习算法中,不同类别样本的比例相差悬殊,它会对算法的学习过程造成重大的干扰。比如在一个二分类的问题上,有1000个样本,其中5个正样本,995个负样本,在这种情况下,算法只需将所有的样本预测为负样本,那么它的精度也可以达到99.5%,虽然结果的精度很高,但它依然没有价值,因为这样的学习算法不能预测出正样本。这里我们可以知道不均衡问题会导致样本较少那一类的高错分率,即...

2018-09-26 18:20:16 1073

转载 机器学习算法一览,应用建议与解决思路 (实用!!!划重点!!!)

作者:寒小阳时间:2016年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334声明:版权所有,转载请联系作者并注明出处1.引言提起笔来写这篇博客,突然有点愧疚和尴尬。愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个歉。尴尬的是,按理说,机器学习介绍与算法一览应该放在最...

2018-09-26 12:53:51 560

转载 sklearn包学习

转自:https://www.cnblogs.com/nolonely/p/6902860.html1首先是sklearn的官网:http://scikit-learn.org/stable/   在官网网址上可以看到很多的demo,下边这张是一张非常有用的流程图,在这个流程图中,可以根据数据集的特征,选择合适的方法。2.sklearn使用的小例子 3.skle...

2018-09-26 10:37:18 1794

转载 机器学习-训练模型的保存与恢复(sklearn)

版权声明:本文为博主原创文章,转载请注明来源。 https://blog.csdn.net/Dream_angel_Z/article/details/47175373在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作,导入joblib即可...

2018-09-26 10:25:10 1875

转载 SGDClassifier和LR,SVM的区别

看了许多文献,以及最近的项目经验,终于真正地搞懂了LR。以前总听大家说,看你对机器学习搞得透彻不透彻,就看你逻辑回归理解得怎么样;自己是统计出身的我,一直很有自信,以为无非就是个极大似然估计,求那个似然函数的极大值而已。然而实际上,这个之中也有很多的说法在里面,比如,求参数的方法。在逻辑回归中,我们极大似然估计的参数是可以通过“极大化该参数值”得到的,然而得到参数之后,并不代表我们就完成了...

2018-09-25 22:05:30 1669

转载 tensorflow学习笔记--embedding_lookup()用法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u013041398/article/details/60955847embedding_lookup( )的用法 关于tensorflow中embedding_lookup( )的用法,在Udacity的word2vec会涉及到,本文将通俗的进行解释。首先看一段网上的简单代码: ...

2018-09-20 11:18:17 527

转载 python中的__name__=='__main__'如何简单理解

转自:http://www.cnblogs.com/GGGGGGZX/p/9206806.html1. 摘要:通俗的理解_name_ == '_main_':假如你叫小明.py,在朋友眼中,你是小明(_name_ == '小明');在你自己眼中,你是你自己(_name_ == '_main_')。if _name_ == '_main_'的意思是:当.py文件被直接运行时,if _na...

2018-09-17 18:01:48 434

转载 回归中的相关系数和决定系数概念及Python实现

衡量一个回归模型常用的两个参数:皮尔逊相关系数和R平方一、皮尔逊相关系数  在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。...

2018-09-17 15:51:06 4099

转载 python中zip()函数的用法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/csdn15698845876/article/details/73411541zip函数的原型为:zip([iterable, …])参数iterable为可迭代的对象,并且可以有多个参数。该函数返回一个以元组为元素的列表,其中第 i 个元组包含每个参数序列的第 i 个元素。返回的列表长度被...

2018-09-17 13:37:30 958

转载 机器学习性能评估指标(精确率、召回率、ROC、AUC)

转自:http://charlesx.top/2016/03/Model-Performance/实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP)。                      P = TP/(TP+FP)而召回率是针对我们原来的样本而言...

2018-09-17 13:18:56 375

转载 机器学习中的 precision、recall、accuracy、F1 Score

转自:https://www.cnblogs.com/weedboy/p/7072010.html1. 四个概念定义:TP、FP、TN、FN先看四个概念定义: - TP,True Positive - FP,False Positive - TN,True Negative - FN,False Negative如何理解记忆这四个概念定义呢?举个简单的二元分类问题 例子:...

2018-09-17 13:12:11 560

转载 numpy.random.seed()方法的作用

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_36142336/article/details/78797190numpy.random.seed()是个很有意思的方法,它可以使多次生成的随机数相同。如果在seed()中传入的数字相同,那么接下来使用random()或者rand()方法所生成的随机数序列都是相同的(仅限使用一次ran...

2018-09-16 10:24:02 686

转载 文本数据预处理:sklearn 中 CountVectorizer、TfidfTransformer 和 TfidfVectorizer

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m0_37324740/article/details/79411651文本数据预处理的第一步通常是进行分词,分词后会进行向量化的操作。在介绍向量化之前,我们先来了解下词袋模型。 1.词袋模型(Bag of words,简称 BoW )   词袋模型假设我们不考虑文本中词与词之间的...

2018-09-13 14:54:38 1092

转载 Python之列表与元组的区别详解

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_878799579/article/details/72909828相同点:都是序列类型回答它们的区别之前,先来说说两者有什么相同之处。list 与 tuple 都是序列类型的容器对象,可以存放任何类型的数据、支持切片、迭代等操作  不同点一:不可变 VS 可变两...

2018-09-10 21:08:26 399

转载 python json读取数据:ValueError: Extra data: line 77 column 2 - line 16485 column 1 (char 1159 - 227243)

https://blog.csdn.net/xzymmd/article/details/81118845

2018-09-07 12:54:39 4488

转载 三大深度学习生成模型:VAE、GAN及其变种

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/heyc861221/article/details/80130968编者按:本书节选自图书《深度学习轻松学》第十章部分内容,书中以轻松直白的语言,生动详细地介绍了深层模型相关的基础知识,并深入剖析了算法的原理与本质。同时还配有大量案例与源码,帮助读者切实体会深度学习的核心思想和精妙之处。...

2018-09-03 21:50:17 3579

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除