自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 解决测试类Class not found报错

应该是拉取了其他伙伴上传的idea文件,所以删除了.idea文件,重新打开,确实可以运行了!

2024-06-15 15:10:16 250

原创 Ubuntu下载

参考文档:

2023-09-17 17:56:39 431

原创 hexo init报错Failed to connect to github.com port 443 after 2051 ms: Couldn‘t connect to server

重置Hosts文件并删除与GitHub相关的信息意味着你将删除任何已添加的与GitHub有关的条目,使计算机恢复使用默认的DNS解析来访问GitHub。这可能会解决一些与Hosts文件配置相关的问题,但也可能导致无法访问特定的GitHub资源或服务。与GitHub相关的信息通常是在Hosts文件中添加的条目,用于绕过DNS解析,直接将特定的GitHub域名映射到特定的IP地址。Hosts文件是一个文本文件,用于将域名映射到IP地址,以便在计算机上进行网络连接时进行解析。1、博客解决办法(可看评论区。

2023-07-14 00:13:43 283 1

原创 IDEA遇到Plugin ‘org.apache.maven.plugins:maven-compiler-plugin:3.8.1‘ not found报错

我的依赖报错很多,下面是我解决的过程~IDEA遇到Plugin 'org.apache.maven.plugins:maven-compiler-plugin:3.8.1' not found报错

2023-05-15 16:43:39 5031

原创 设置共享文件夹代码

【代码】设置共享文件夹代码。

2023-05-09 20:57:34 145

原创 axios请求响应结果的结构,axios的请求对象

config:配置对象,包括很多内容,请求类型,请求url,请求体等等data:响应体,服务器返回结果,并且将结果进行json解析,转为对象headers:响应的头信息request:保存当前axios在发送请求时所创建的原生的ajax请求对象status:响应状态码statusText:响应状态字符串。

2023-03-07 22:21:49 1381

原创 数据结构-期末复习(二)

线性表查找和树状查找都是利用了数据元素之间的关系进行查找,只有散列查找是利用关键词值与存储位置来进行查找。1. 数据结构通常有下列4类基本结构:集合、( 线性结构 ) 、树型结构、图型结构2. 数据的基本单位是( 数据元素 ),最小单位是( 数据项 ).3. 两个串是相等的,当且仅当两个串的长度相等且( 各对应位置 )的字符都相同。

2023-02-21 03:17:23 86

原创 数据结构-期末复习(一)

黄色标黄的是答案,蓝色是自己做的,绿色的是没记住的。

2023-02-21 02:37:16 1888

原创 概率论【蜂考】期末速成(三)

n很大的时候可以用正态分布近似二项分布。泊松分布近似二项分布:n大p小。

2023-02-20 01:08:30 230

原创 概率论【蜂考】期末速成(二)

n很大时,p比较大时。

2023-02-19 23:45:52 354

原创 概率论【蜂考】期末速成(一)

事件的运算及概率 0.1,0.70.210.40.2C0.581/67/12 1/2CD0.83;24/830.175;2/35分布函数时累加的。 分布函数是概率累加的思想 2、 3、 4、 5、 标准正态分布 0.001ca1c0.6826 1/6;1/12a0.42;0。9;0.6;0.28 原则:谁简单替换谁

2023-02-19 19:47:51 2225

原创 数据科学导论重点(三)

文本数据体量和市场价值典型的文本处理与分析场景。

2023-02-18 08:27:38 97

原创 数据科学导论重点(二)

对现实世界的一种“有用”的简化估计(Estimation)是使用观测到的数据来拟合参数预测(Prediction)是使用拟合的参数来求解未知的数据 在简单(一元)线性回归SLR模型基础上添加更多的独立变量 d维 1. 根据支持度,寻找所有的频繁项集(频繁k项集) 2. 根据频繁项集,生成频繁规则(长度大于2的频繁k项集) 暴力解法 频繁项集生成的经典算法 ◼APriori算法 ◼DHP算法(课后学习)

2023-02-18 02:51:24 325

原创 数据科学导论重点(一)

连续数据过于细致,数据之间的关系难以分析划分为离散化的区间,发现数据之间的关联,便于算法处理非监督离散化(无类别信息)数值型变量分箱Binning可以减少数据量、压缩数据、去除异常值•等宽划分离散化•优点:简单、易懂•缺点:分成多少个箱合适?受噪音影响大•等高划分离散化等频分箱使用、等距分箱使用聚类:监测并且去除噪声数据•将类似的数据聚成簇• 每个簇计算一个值用以将该簇的数据离散化有监督离散化(有类别信息)—基于熵的离散化。

2023-02-17 23:58:11 908

原创 计组考试复习疑难及没复习到的知识点记录

C语言的逻辑运算只有两种结果,0x00和0x01。

2023-02-16 00:58:31 864 1

原创 《马克思主义基本原理》复习重点

1、马克思主义是马克思和恩格斯共同创立并为后继者所不断发展的科学理论体系。2、马克思理论是关于科学、社会、人类思维发展一般规律的学说,是关于社会主义必将代替资本主义,最终实现共产主义的学说3、马克思主义是关于无产阶级解放,全人类解放和每个人自由而全面发展的学说4、马克思主义是无产阶级政党和社会主义国家的指导思想,是指引人民创造美好生活的行动指南。

2023-02-12 23:12:36 3907 3

原创 计组笔记(七)

字符显示器 图形显示器图像显示器 寻道时间的平均时间:磁头从最外圈到最内圈的时间的一半旋转延迟时间的平均时间:磁头转一圈的时间的一半 寄存器叫做端口 端口一开始就要设置好,中途不能修改 一次传送数据只能传送一个字,是因为和寄存器有数据交流,寄存器又有地址位数限制 硬件执行的特点是并行该指令由硬件执行 送中断:引入中断服务程序 习题

2023-02-08 18:24:44 76

原创 计组笔记(六)

解决io设备与主机之间连接的灵活性的问题。

2023-02-07 22:03:39 79

原创 计组笔记(五)

习题 ps:主存储器不只是用RAM实现,还可以用ROM实现。 硬件阻塞 软件插入NOP 转发技术:数据旁路技术

2023-02-07 14:54:32 97

原创 计组笔记(四)

机器字长:主要受寄存器能够存放的二进制数据的位数的限制。

2023-02-05 18:05:13 70

原创 计组笔记(三)

计算机组成及其原理第三章——存储系统

2023-02-02 13:35:41 87

原创 计组笔记(二)

要对没有定义的数字进行+6(0110)修正8421是各个位的权值 区位码对应94*94的矩阵,有94个区,每个区有94个位 商看每次被除数的最高位,如果最高位是1,那么商是1,如果最高位是0,那么商是0。除去最高位后的其他数和除数进行异或运算。 真值0有两种表现形式 定点小数移位效果相同

2023-01-31 14:35:17 105

原创 计组笔记(一)

cpu、主存、总线、输入/输出设备、主板上的印刷电路:用于导电,传输二进制的0和1。

2023-01-28 15:39:46 172

原创 width=device-width, initial-scale=1

在FreeCodeCamp中一直显示没有通过代码,明明是一样的字符,如下。重要的是逗号后面还有一个空格。

2023-01-16 23:26:00 220

原创 数据分析拆解方法

前四个链接:数据分析拆解方法_Ayy1007的博客-CSDN博客后五个链接:百度安全验证

2023-01-07 20:51:37 118

原创 概率论复习

速成网课:【概率论与数理统计】3小时不挂|概率统计|概统_哔哩哔哩_bilibili传送门:概率问题:关于有放回和无放回抽取的一个问题 - 知乎简要阐述一下:

2022-12-13 22:42:24 4667

原创 字典树-数据结构大作业倒排索引优化

这次数据结构大作业我负责优化倒排索引的代码,我在原来的代码里面加上了字典树。

2022-12-11 22:47:06 118

原创 Python遇到module ‘community‘ has no attribute ‘best_partition‘问题

评论里面能够解决我的问题的是下面这段代码。之后用下面的代码,就可以解决啦!

2022-12-03 00:21:02 735

原创 python作业用过的函数

这一次作业是用数据画地图所涉及的函数和python知识如下(每一个我都写成小标题格式,方便我以后自己查找。

2022-11-30 20:02:24 104

原创 多组输入、while(scanf(“%d“,&n) !=EOF)和while(cin>>n)

这一次作业第一次知道ctrl C最多只能拷贝4094个字符到命令行,所以通过重定向输入流来解决这个问题。在visual studio里面运行要写成scanf_s,但是在oj里面运行时要改成scanf。在主函数里面添加了以下两个函数,in.txt是输入的案例。之前老是遇到这种问题。

2022-11-19 20:55:49 613

原创 DS图—图的邻接矩阵存储及度计算

数据结构作业:假设图用邻接矩阵存储。输入图的顶点信息和边信息,完成邻接矩阵的设置,并计算各顶点的入度、出度和度,并输出图中的孤立点(度为0的顶点)

2022-10-29 15:40:38 320

原创 特征工程衍生技术

对既有数据信息的重新排布。需要知道的是,特征衍生本身不是去创造更多信息,而是借助现有的数据去组合出一些新的数据,进而提高建模效果。1、四大类、26种特征衍生方法2、双变量及多变量特征衍生策略3、二阶及高阶特征衍生技巧4、时序和NLP特征的衍生方法在单变量多项式衍生的基础上增加交叉项的计算,如二阶多项式衍生特征除一次方,二次方以外还有衍生出的任意两个变量相乘。.........

2022-09-15 19:30:13 1138

原创 多组学在药物机制解析和诊断标志物开发中的应用

诊断是否清晰、机制是否明确、靶点是否可靠、药物是否有效。药物是否安全、效用是否持久、代谢是否清楚、生产是否高效。分子分型、发病机制解析、标志物筛选、药靶筛选、药效评析。临床是否安全、临床是否有效、机制是否清晰。新药的发现——临床前研究——临床研究。药物作品机制解析、大队列临床安全评价。药效作用机制解析、药物代谢流及通路。

2022-09-10 17:36:46 597

原创 单细胞多组学联合应用

发生甲基化修饰,抑制下游基因的表达,如果发现某个基因表达下降,则会进行甲基化测序。

2022-09-06 16:22:11 357

原创 机器学习笔记

大数据时代造就人工智能的高速发展。机器学习中包含神经网络,神经网络扩展后造就深度学习算法一张图片会被表示成三维数组形式,例如:300*100*3,表示长*宽*颜色通道(【R,G,B】红,绿,蓝。颜色通道为3表示是彩色图,为1表示是灰色图)像素点的值0-255,值与亮度挂钩。W表示一些权重参数10表示的是有的类别,x表示的是图像的像素点,b是定义的类别数*1的矩阵找出最好的参数:通过梯度下降的方向求解角度。

2022-09-01 19:01:04 291

原创 贝叶斯算法

三大特征互相独立,好苹果有4个,分别是两个大的红色圆果,小的红色圆果,大的红色非规则果。P(c | x) 的求解转化为求解 P(c)和 P(x | c)逆向概率:不知白球黑球概率,根据摸出的结果逆向推算出白球黑球比例。结果:分别推算大的红色圆果是好果或者是一般果子的概率,进行比较。最大似然:最符合观测数据的(即P(D|h)最大的)最有优势。P(x | c):在好苹果这个类别中所有属性的可能取值。正向概率:已知白球黑球比例,求摸出黑球概率。奥斯卡剃刀:P(h)较大的模型有较大的优势。P(c):果子是好苹果。.

2022-08-18 08:57:18 234

原创 主题模型分析

链接入口:【python-sklearn】中文文本 | 主题模型分析-LDA(Latent Dirichlet Allocation)_哔哩哔哩_bilibili概念主题:自动将文本语料库编码为一组具有实质性意义的类别主题分析的典型代表:隐含狄利克雷分布(LDA)最明显的特征:能够将若干文档自动编码分类为一定数量的主题。主题数量需要人为确定主题数量通过对比新旧文档来判断模型的好坏,然后在不同参数的很多模型找到最优模型。 定义函数print_top_words: 将数据进行转化:

2022-08-12 00:13:19 1660 5

原创 Python手写了 35 种可解释的特征工程方法-案例分析

self.data = data # 包含基础变量的数据self.feature_list = feature_list # 变量名前缀self.p_list = p_list # 变量名前缀self.df = pd.DataFrame([]) # 用于收集最终变量的数据框self.core_num = core_num # 35个函数对应35个核self作为第一个参数,是实例对象本身data是传入的数据集feature_list是需要进行处理的特征集p_list是需要聚合的月份集。...

2022-08-09 13:47:13 586

原创 Python手写了 35 种可解释的特征工程方法

通过无差别聚合方法进行聚合得到的结果,通常具有较高的共线性,其所具备的信息量并无明显增加,反而会为广义线性模型带来干扰,影响模型的鲁棒性和稳定性。因此通常时间窗口为1年的场景下,p值会通过先验知识,人为选择3、6、12等,而不是遍历全部取值1~12。实际业务中,许多数时候数据源和建模目标都是确定的,这时候特征工程几乎就决定了最终模型的业务效果。用于预测的特征的原始变量,必须是在模型开发样本和将来模型实施时均可观察到的信息。将每个样本的变量通过各种运算,将单个特征的多个时间节点取值进行聚合的操作。...

2022-08-09 10:08:00 207

原创 英语学习思路【罗肖尼Shawney】

笔记摘自罗肖尼Shawney的视频,链接入口:【高能干货】这个视频将会颠覆你对英语学习的认知——总述·阅读篇_哔哩哔哩_bilibili 1、获得流利外语的能力的唯一途径是大量的听读输入,而不是传统的语法学习2、语言习得的关键是找到大量、有趣、可理解的输入材料,材料越有趣则习得效率越高3、自由消遣阅读是提升语言能力最长效、最自主也是最快乐的途径1、可理解输入假说2、“技能学习”假说积累大量输入,可以相对流利地讲话之后,再集中对主动语法知识进行学习,并且将其使用在书面写作、演讲准备等时间充裕的场合。条件:1、

2022-08-06 10:37:40 968

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除