凡尔赛亚人-CSDN博客

原创 python 数据结构与算法之查找-day3

1.顺序查找也叫线性查找，从列表第一个元素开始，顺序进行搜索，直到找到元素或搜索到列表最后一个元素为止。

2022-01-19 18:00:53 893

原创 python 数据结构与算法 day2

1. 如何简单快速的判断算法复杂度快速判断算法复杂度（适用于绝大多数简单情况）a 确定问题规模nb 循环减半过程——>lognc k层关于n的循环——>n的k次方碰到复杂情况则根据算法执行过程进行判断2. 空间复杂度空间复杂度：用来评估算法内存占用大小的式子；空间复杂度的表示方式与时间复杂度完全一样a 算法使用了几个变量：O（1）b 算法使用了长度为n的一维列表:O(n)c...

2022-01-16 22:44:50 533

为什么会想着由非科班开始学python的数据结构与算法呢，起因是因为昨天看到了一道题，就是一个基于无向图（不知道是不是这么叫的）的那种，然后题里构建了一个，友谊传播模型，其实也可以称之为病毒传播模型，利用python的字典进行实现，这个时候我突然意识到，对于python 数据结构的不了解可能会给我带来很大的麻烦，于是从今天开始对python 数据结构与算法进行学习，使用的视频教材是B站清华大学博士讲解Python数据结构与算法（完整版）全套100节清华大学博士讲解Python数据结构与算法（完整版）全

2022-01-15 22:22:03 562

原创 PYTHON 并发编程实战（二）

python的并发编程有三种方式多线程Thread多进程Process多协程Coroutine在python中，多线程只能同时使用一个cpu；这是其非常大的一个缺陷相比之下多进程则可以利用多核cpu进行并行运算二、怎样根据任务选择对应技术首先介绍两个概念。CPU密集型和IO密集型。依照我的理解的话，cpu密集型就是需要提前在本地进行运算并且是大量运算的情况；IO密集型顾名思义，，当发生INPUT/OUTPUT 密集的交互时，则就为IO密集型。比如文件的读写，爬虫的下载

2022-01-09 13:54:39 827

原创 PYTHON 并发编程

python 并发编程实践

2022-01-08 14:29:06 1304

原创机器学习——性能度量|Day3

1 ROC与AUC很多学习器是为测试样本产生一个实值或概率预测，然后将这个预测值与一个分类阈值进行比较，若大于阈值则分为正类，否则为反类。而实际上我们可以根据这个实值将测试样本进行排序，分类过程则相当于在这个排序中加了一个截断点，将样本分为两部分，前一部分判做正例，后一部分判做反例。在不同的应用任务中，我们可以根据任务需求来采用不同的截断点，例如若我们更重视“查准率”，则可以选择排序中靠前的位置来“截断”。例如，我们在训练好模型对葡萄进行预测后得到了一组取值在[0,1]之间实值，但我们并不能很好的知

2021-11-02 10:21:05 332

原创机器学习——性能度量|Day2（续）

Day2讲到得PR图用于判定和比较学习器的性能，但单纯的通过概念性的比较和质性研究是无法很好的判断出通用方面某两个学习器的性能优劣的。因此人们设计了一些综合考虑查准率、查全率的性能度量。“平衡点”（Break-Even Point,简称BEP）就是这样一个度量。它是“查准率=查全率”时的取值，例如途中学习器C的BEP是0.64，而基于BEP的比较，可认为学习器A优于B。这是一种度量方式。但BEP还是过于简化了些，在真正筛选学习器性能时，目的明确的情况下很少要求查准率和查全率双高的情况（因为不太

2021-10-31 15:54:54 436

原创机器学习——性能度量|DAY2

在预测任务中给定样例集D={（x1,y1）,（x2,y2）……，（xm,ym）},其中yi是xi的真实标记，要评估学习器f的性能，就要把学习器预测结果f(x)与真实标记y进行比较。回归任务最常用的性能度量是“均方误差”（mean squared error）就是“均方差” （个人感觉类似于高中方差？）更一般的，对于数据分布D和概率密度函数p(x)，均方误差可描述为其实也就是将离散转化为连续。2.1 错误率与精度错误率和精度是分类任务中最常用的两种性能度量，既适用于二分类.

2021-10-30 21:36:59 678

原创机器学习-模型评估与选择Day1

1.评估方法1.1留出法“留出法”即直接将数据集D划分为两个互斥的集合，其中一个集合用来做训练集S，另一个作为测试集T，即D =S并T，S交T为空集，在S上训练出模型后，用T来评估其测试误差，作为对泛化误差的估计。以二分类任务为例，假设D包含1000个样本，将其划分为S包含700个样本，T包含300个样本，用S进行训练后，如果模型在T上有90个样本分类错误，则其错误率为90/300=30%，相应的精度为1-0.3=0.7 即70%。需要注意的：1. 训练集和测试集的划分要尽可能保持数据.

2021-10-28 21:03:00 284

转载机器学习——随机森林和决策树的区别（暂记）

决策树本质是一颗由多个判断节点组成的树。决策树算法的核心是通过对数据的学习，选定判断节点，构造一颗合适的决策树。树模型不需要做归一化：归一化的目的是为了加快梯度下降法的收敛速度，但是决策树模型不需要计算梯度树模型只考虑特征的划分界限，而不需要考虑特征的值范围决策树的关键是选择最优划分属性。一个属性会有多个取值，根据这个属性的不同取值将输入的数据划分为多个样本集合，一个取值对应一个分支集合，(注意，CART树只选取一个取值，因此是划分为二叉树）使得每个取值分支集合中的样本尽可能属于同

2021-10-26 17:26:54 1903

原创网课研究生学术与职业素养讲座mooc答案

第一讲：创新思维与专业研究 1本讲中，讲述者主要以哪条河流作为水利工程的例子进行的讲解？（两个字）黄河 2本讲中，所举的创新型人才示例，不包括下列哪个？ A 比尔盖茨 3本讲从水利科技创新的例子、水利的发展、大学的创新精神三个方面阐述了创新思维与专业研究。 × 4关于本讲谈到的创新精神，下列说法中正确的有...

2021-10-25 13:59:30 43182 25

不配叫赛赛的博客