2018年09月_Candy_GL

转载 Python建立多线程任务并获取每个线程返回值

转自：https://www.cnblogs.com/bethansy/p/7965820.html1.进程和线程（1）进程是一个执行中的程序。每个进程都拥有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据。进程也可以派生新的进程来执行其他任务，不过每个新进程都拥有自己的内存和数据栈，所以只能采用进程间通信（IPC）的方式共享信息。（2）线程与进程类似，不过他...

2018-09-29 17:02:05 1073

转载 CPU核数跟多线程的关系

一直以来有这样的疑惑，单核CPU适合多线程吗？是不是几个核的CPU开几个线程是最合适的？今天就这一问题查了一些资料，现整理如下：要说多线程就离不开进程，进程和线程的区别在这里就不详细说了，只将关键的几点：a)进程之间是相互独立的，不共享内存和数据，线程之间的内存和数据是公用的，每个线程只有自己的一组CPU指令、寄存器和堆栈，对于线程来说只有CPU里的东西是自己独享的，程序中的其...

2018-09-29 14:30:03 2030 1

转载 cpu、核与线程

cpu与核心物理核物理核数量=cpu数(机子上装的cpu的数量)*每个cpu的核心数虚拟核所谓的4核8线程，4核指的是物理核心。通过超线程技术，用一个物理核模拟两个虚拟核，每个核两个线程，总数为8线程。在操作系统看来是8个核，但是实际上是4个物理核。通过超线程技术可以实现单个物理核实现线程级别的并行计算，但是比不上性能两个物理核。单核cpu和多核cpu都是一个cpu，不...

2018-09-29 11:38:45 667

转载关于sklearn下class_weight参数的一点源码阅读与测试

2018-09-27 14:52:07 2466

转载 Sklearn-LogisticRegression逻辑回归(有处理样本不均衡时设置参数的方法)

2018-09-26 20:09:28 14274

转载不平衡数据的分类评价指标总结

转自：https://blog.csdn.net/sqiu_11/article/details/78396443识别任务中混淆矩阵（Confusion Matrix）用于评价算法好坏的指标。下图是一个二分类问题的混淆矩阵：TP：正确肯定——实际是正例，识别为正例FN：错误否定（漏报）——实际是正例，却识别成了负例FP：错误肯定（误报）——实际是负例，却识别成了正例TN：正...

2018-09-26 19:46:53 6975

转载 [干货]如何从不均衡类中进行机器学习

参考自：https://www.svds.com/learning-imbalanced-classes/引言如果您刚从机器学习课程中学习，那么您所使用的大多数数据集都相当容易。除其他事项外，在构建分类器时，样本类是平衡的，这意味着每个类的实例数量大致相同。教师通常使用清理过的数据集，以专注于讲授特定的算法或技术而不受其他问题的干扰。通常你会在两个维度中显示如下的例子，用不同颜色（或形状）...

2018-09-26 18:26:20 384

基础概念类别不均衡是指在分类学习算法中，不同类别样本的比例相差悬殊，它会对算法的学习过程造成重大的干扰。比如在一个二分类的问题上，有1000个样本，其中5个正样本，995个负样本，在这种情况下，算法只需将所有的样本预测为负样本，那么它的精度也可以达到99.5%，虽然结果的精度很高，但它依然没有价值，因为这样的学习算法不能预测出正样本。这里我们可以知道不均衡问题会导致样本较少那一类的高错分率，即...

2018-09-26 18:20:16 1073

转载机器学习算法一览，应用建议与解决思路（实用！！！划重点！！！）

2018-09-26 12:53:51 560

转载 sklearn包学习

转自：https://www.cnblogs.com/nolonely/p/6902860.html1首先是sklearn的官网：http://scikit-learn.org/stable/ 在官网网址上可以看到很多的demo，下边这张是一张非常有用的流程图，在这个流程图中，可以根据数据集的特征，选择合适的方法。2.sklearn使用的小例子 3.skle...

2018-09-26 10:37:18 1794

转载机器学习-训练模型的保存与恢复（sklearn）

2018-09-26 10:25:10 1875

转载 SGDClassifier和LR,SVM的区别

看了许多文献，以及最近的项目经验，终于真正地搞懂了LR。以前总听大家说，看你对机器学习搞得透彻不透彻，就看你逻辑回归理解得怎么样；自己是统计出身的我，一直很有自信，以为无非就是个极大似然估计，求那个似然函数的极大值而已。然而实际上，这个之中也有很多的说法在里面，比如，求参数的方法。在逻辑回归中，我们极大似然估计的参数是可以通过“极大化该参数值”得到的，然而得到参数之后，并不代表我们就完成了...

2018-09-25 22:05:30 1669

转载 tensorflow学习笔记--embedding_lookup()用法

2018-09-20 11:18:17 527

转载 python中的name=='main'如何简单理解

转自：http://www.cnblogs.com/GGGGGGZX/p/9206806.html1. 摘要：通俗的理解_name_ == '_main_'：假如你叫小明.py，在朋友眼中，你是小明(_name_ == '小明')；在你自己眼中，你是你自己(_name_ == '_main_')。if _name_ == '_main_'的意思是：当.py文件被直接运行时，if _na...

2018-09-17 18:01:48 434

转载回归中的相关系数和决定系数概念及Python实现

衡量一个回归模型常用的两个参数：皮尔逊相关系数和R平方一、皮尔逊相关系数　　在统计学中，皮尔逊相关系数( Pearson correlation coefficient），又称皮尔逊积矩相关系数（Pearson product-moment correlation coefficient，简称 PPMCC或PCCs），是用于度量两个变量X和Y之间的相关（线性相关），其值介于-1与1之间。...

2018-09-17 15:51:06 4099

转载 python中zip()函数的用法

2018-09-17 13:37:30 958

转载机器学习性能评估指标（精确率、召回率、ROC、AUC）

转自：http://charlesx.top/2016/03/Model-Performance/实际上非常简单，精确率是针对我们预测结果而言的，它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)。 P = TP/(TP+FP)而召回率是针对我们原来的样本而言...

2018-09-17 13:18:56 375

转载机器学习中的 precision、recall、accuracy、F1 Score

转自：https://www.cnblogs.com/weedboy/p/7072010.html1. 四个概念定义：TP、FP、TN、FN先看四个概念定义： - TP，True Positive - FP，False Positive - TN，True Negative - FN，False Negative如何理解记忆这四个概念定义呢？举个简单的二元分类问题例子：...

2018-09-17 13:12:11 560

转载 numpy.random.seed()方法的作用

2018-09-16 10:24:02 686

转载文本数据预处理：sklearn 中 CountVectorizer、TfidfTransformer 和 TfidfVectorizer

2018-09-13 14:54:38 1092

转载 Python之列表与元组的区别详解

2018-09-10 21:08:26 399

转载 python json读取数据：ValueError: Extra data: line 77 column 2 - line 16485 column 1 (char 1159 - 227243)

https://blog.csdn.net/xzymmd/article/details/81118845

2018-09-07 12:54:39 4488

转载三大深度学习生成模型：VAE、GAN及其变种

2018-09-03 21:50:17 3579

Candy_GL的博客