- 博客(21)
- 收藏
- 关注
原创 pandas刷题笔记
a-zA-Z]:这个变量匹配从 a 到 z 或 A 到 Z 的任何字符。请注意,你可以在方括号内指定的字符范围的数量没有限制,您可以添加想要匹配的其他字符或范围。[^a-z]:这个变量匹配不在 a 到 z 范围内的任何字符。[a-z]*:表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。[a-z]+:表示一个字符范围,匹配从 a 到 z 的任何字符 1 次或多次。[a-z]:表示一个字符范围,匹配从 a 到 z 的任何字符。[0-9]:表示一个字符范围,匹配从 0 到 9 的任何字符。
2023-10-17 16:32:17 72
原创 【无标题】
对于决策树来说,当数据集的特征较多时,构造的决策树往往深度很大,很容易造成对训练数据的过拟合。随机森林本质上是很多决策树的集合,其中每棵树与其他树略有不同,尽管随机森林会出现决策树的特点,但是我们可以对这些树的结果取平均值来降低过拟合。这样既可以减少过拟合,又可以保持树的预测能力。构造随机森林通过调整每个树的数据集和特征选择来构造均不相同的决策树。由于使用了,随机森林中构造每棵决策树的数据集略有不同。由于每个节点的,每棵树的每次划分都是基于特征的不同子集。
2023-07-26 10:39:03 101
原创 使用kraken2进行数据分析工作的一些总结
500GB以上的ubuntu18.04(library原本总共就有200多个GB 而我怀疑解压时生成的tmp文件会占用很多内存 还有taxonomy)这里的install_dir自行设置ubuntu环境下需要配置好cmake,gcc,g++。同时由于需要安装kraken2命令因此需要先安装上anaconda,然后配置conda环境kraken2。
2023-06-27 23:41:39 1337 1
原创 使用django搭建网站的经验教训和各种环境的配置
在完成对django的配置和处理之后,需要用docker配置四个镜像,我这里是参照https://blog.csdn.net/weixin_42134789/article/details/115878467这篇文章完成的docker配置和处理,然后docker安装时我直接参考网上给的教程,并且在阅读CloudMan写的《每天5分钟玩转Docker容器技术》完成了docker操作的熟悉。
2023-05-11 17:27:08 91
原创 第四章:设计可以复用的类
生活中使用的程序,需要用到的功能会有一些高度相似的,因此代码也会想似,如果直接就重新写显然会浪费时间资源,这就是可复用软件构造的伟大之处。
2020-06-25 17:46:44 423
原创 6.2错误和异常处理
6.1节介绍了可靠性,正确性,健壮性的各种概念及相互关系,这里主要关注java中错误和异常处理的典型技术——把愿理落实到代码上。
2020-05-27 17:34:21 370
原创 面向复用的设计模式(Behavioral patterns)
Behavioral patterns包含策略模式,模板模式和迭代器,本文将基于软件构造课(徐汉川老师)梳理其中脉络。
2020-05-05 13:02:42 301
原创 面向复用的设计模式(Adaptor,Decorator,Facade)
面向Java可复用性本文将介绍三种设计模式:Adapter,Decorator,Facade
2020-05-04 21:49:45 378
原创 可复用性的度量、形态与外部表现
面向一个重要的外部质量指标:可复用性——如何构造出可在不同应用中重复使用的软件模块/API?软件复用/重用软件复用的两种维度软件复用的优越性和缺点为什么进行软件复用软件复用的代价开发可复用的软件使用已有软件进行开发如何测度可复用性具有高可复用性的的软件应该是这样的可复用组件的三种层面和形态最主要的复用是在代码层面代码复用的类型(1)源代码复用(2)模式层面的复用:类/接口继承委托(3) Libr...
2020-04-30 22:12:48 619
原创 抽象数据类型(ADT)
@[TOC]抽象数据类型抽象数据类型(ADT)本文基于徐汉川老师的2020年软件构造课程撰写抽象数据类型与表示独立性:能够分离程序中数据结构的形式和对其使用的方式,如何设计良好的抽象数据结构,通过封装来避免客户端获取数据的内部表示(即“表示泄露”),避免潜在的bug—— 在client 和implementer 之间建立“防火墙”。而ADT也具有一定的特性:ADT 的特性:不变量、表示泄...
2020-04-13 19:51:13 1589
原创 软件编程的多维度视角
软件生命周期(SDLC)SDLC(Software Development Life Cycle),即软件生命周期,软件生存周期,是软件的产生直到报废的生命周期,周期内有问题定义、可行性分析、总体描述、系统设计、编码、调试和测试、验收与运行、维护升级到废弃等阶段,这种按时间分程的思想方法是软件工程中的一种思想原则,即按部就班、逐步推进,每个阶段都要有定义、工作、审查、形成文档以供交流或备查,以...
2020-03-01 17:58:07 538
原创 程序人生-Hello’s P2P
计算机系统大作业题目 程序人生-Hello’s P2P专业 计算机科学与技术计算机类学 号 1181000516班 级 计算机四班学生 杨君豪...
2020-01-05 19:55:04 386
原创 程序人生-Hello’s P2P
Version:1.0 StartHTML:000000246 EndHTML:000562314 StartFragment:000088180 EndFragment:000562282 StartSelection:000088206 EndSelection:000562276 SourceURL:mhtml:file://F:\计算机系统\计算机系统大作业\ICS2019大作业论文.mh...
2020-01-05 19:38:29 1317
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人