- 博客(59)
- 收藏
- 关注

原创 那些你不理解的dp背包问题的详解
本文旨在以最通俗易懂的语言讲解动态规划中背包问题的细节问题,这些问题可能成为理解动态规划中的一个个小障碍,这篇文章就是对这类问题的总结归纳,争取实现让读者初步了解dp后可以通过这篇文章学习解决每个疑问,而不是一个个查询消耗热情。
2024-02-08 17:16:36
1160
原创 市场调查中,如何抽样?
想绝对公平→简单随机蛋糕有明显不同层→分层抽样想省事且分布均匀→系统抽样预算少、范围大→整群或多阶段规模相关→PPS不确定该用哪种→先从简单随机开始!下次你吃蛋糕时,可以边吃边想:“这块该用哪种抽样方法?”(笑)常见的概率抽样方法部分由deepseek生成的通俗释意,有助于理解,但还要结合更多具体示例。
2025-02-06 10:03:00
713
原创 数据管理系统期末复习——04关系模型
有必要说明,这一章极为重要,一方面考点多,另一方面也是时至今日依旧最流行的数据库——关系型数据库。其次,这一章主要介绍SQL查询的理论基础:关系代数运算。所以以题目、具体实例来深入学习练习最佳。用户对数据的特殊语义要求通常通过其它约束实现:非空约束、唯一约束、自增长约束、默认值约束、检查约束。其中,检查约束:即指定某一属性的取值范围,如年龄大于18。
2024-12-28 18:20:23
855
原创 数据管理系统期末复习——03文档数据库
在上一节中我们提到过:非关系型数据库,也就是NoSQL——强调Key-Value存储非关联的文档数据库。为什么需要这样的数据库呢?因为传统的关系型数据库已经无法满足快速查询与插入数据的需求,它通过降低数据的安全性,减少对事务的支持,减少对复杂查询的支持,获取性能上的提升。1.游标定义游标是用于查询结果集的指针。当执行查询时,MongoDB会返回一个游标,然后可以使用游标来逐个获取查询结果中的文档。游标可以用于遍历大量数据,支持分页查询,以及在查询过程中进行一些操作。2.游标的类型。
2024-12-28 18:09:19
1008
原创 数据管理系统期末复习——02数据模型
在做判断时,你大概率会被几个词弄懵:主关键字、主码、候选关键字、候选码、主属性、非主属性。好,相信听到这你已经懵了,现在我提前给出通俗的解释:
2024-12-17 11:19:55
549
原创 数据管理系统期末复习——01概述
数据库的组成模式包括(关系操作集合、关系完整性的约束、关系数据结构)下面列出的数据库管理技术发展的 3 个阶段中,没有专门的软件对数据进行管理的是 (I人工管理阶段) I.人工管理阶段 II 文件系统阶段 III 数据库阶段( NoSQL)泛指非关系型的数据库不属于数据库系统特点的是(数据冗余度高 )
2024-12-15 17:23:05
646
原创 Hadoop运行Mapreduce问题集锦——Ubuntu虚拟机配置
运行任务前一直重连。具体来说,错误发生在尝试从的127.0.1.1地址连接到同一台机器的8032端口时,连接被拒绝。
2024-12-15 15:37:30
901
3
原创 一文搞清Conda环境的定位
这两天要用jupyter写一个小作业,同时有一个数学建模小比赛要用到pycharm,遇到了一个问题:jupyter的numpy库版本提示错误无法运行,但是之前一直没问题,于是猜测可能是pycharm中最近更新库时涉及到numpy。而我的jupyter是通过Anaconda安装的,应该在conda环境中运行,而pycharm应该在本地的python下运行,应该是互不影响的啊(加之对环境管理方面理解很少,于是开始来回尝试,又想刨根问底式的弄清楚。
2024-11-26 22:15:02
1329
原创 Web复习——题目2
XML称为__可扩展标记语言__,用于提供数据描述格式,适用于不同应用程序之间的数据交换,而且这种交换不以预先定义的一组数据结构为前提,增强了可扩展性。
2024-11-17 17:01:45
685
原创 Web复习——题目1
释:Servlet接口:2个实现类但HttpServlet继承了GenericServlet的全部方法,5个抽象方法包括了生命周期。释:HTTP1.0一次仅处理一个HTTP请求——>HTTP1.1使用TCP协议节省了建立关闭连接时间,一次处理多个请求。释:客户端-服务器-Servlet容器-Servlet结构,客户端不能直接访问到Servlet,步步传递,层层回传。释:配置Servlet时,用@WebServlet注解配置时,提供了urIPatterns属性用于指定。释:alt:替代文本。
2024-11-16 17:22:00
423
原创 R_机器学习——常用函数方法汇总
createDataPartition()是caret包中的一个非常有用的函数,它主要用于将数据集分割为训练集和测试集。优点在于使二者具有相同分布,模型训练更加合理。
2024-10-26 18:29:03
595
1
原创 Javaweb开发快捷键集锦(Spring boot)
动态SQL于xml文件格式化快捷键Visual Studio:Windows:Ctrl + K, Ctrl + DIntelliJ IDEA或Android Studio:Windows/Linux:Ctrl + Alt + L
2024-10-18 22:12:51
289
原创 比XML更简洁的配置文件——yml(2min了解)
在Java Web开发中,XML(可扩展标记语言)和YAML(YAML Ain't Markup Language)都是常用的配置文件格式。虽然XML在数据结构和组织形式上具有强大的灵活性,但YAML以其简洁性和可读性在配置文件中越来越受到青睐。
2024-10-18 18:49:38
482
原创 即懂——XML Schema的名称空间
XML Schema就像图书馆的管理员,它定义了每种书应该有哪些信息(比如标题、作者、ISBN等),以及这些信息的格式。-- 这里定义小说类书籍的结构 -->在这个例子中,属性定义了小说类书籍的名称空间。定义了一个前缀novels,我们可以用它来引用这个名称空间。
2024-10-17 15:19:47
1087
原创 一起对话式学习-机器学习03——模型评估与模型选择
针对这个问题,实际求解的过程是怎样的?首先确定模型项数(基本形式)后,列出损失函数使用测试数据利用最小二乘法(因为设定未知参数幂次为1,所以是线性问题用最小二乘法)得出一组未知参数解,最后计算一下其训练误差。就这样对于每个项数/复杂度的模型皆如此得出下图:
2024-09-20 22:46:25
702
原创 本科生如何学习机器学习
一、入门阶段1. 数学与统计学基础高等数学:学习微积分、极限、级数等基本概念。 线性代数:掌握矩阵运算、特征值和特征向量、线性方程组等。 概率论与统计学:理解概率分布、假设检验、贝叶斯定理等统计知识。2. 编程语言学习Python:学习Python的基本语法、数据结构、函数、面向对象编程等。 Python库:熟悉NumPy、Pandas、Matplotlib等数据处理和可视化库。3. 机器学习基础基本概念:了解监督学习、无监督学习、半监督学习、强化学习等基本概念。 经典算法:学习
2024-09-16 17:01:22
1129
原创 一起对话式学习-机器学习02——机器学习方法三要素
机器学习方法=模型+策略+算法可以理解为:机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。
2024-09-16 16:56:48
1336
原创 一起对话式学习-机器学习01——贝叶斯学习
这部分的内容看起来很繁琐,但我选择采用这样的形式——对话式学习,只要你耐下心来结合笔记去读,一定能进入状态、读得懂且有所收获。
2024-09-10 18:00:41
650
原创 前端三件套(HTML,CSS,JS)查漏补缺
一些琐碎:内class仅定义行内元素,指的是代码中同一行的元素(如text-align:center);而表格定义块元素,只要属于旗下的元素都适用(如居中margin 0:auto)。最常用——外链式,其中两个定义style的方法:类与id,简单理解为声明库之后直接调用函数,而其中最重要的就是理解各个层级的关系,因为你要合理地进行逐层嵌套。
2024-09-09 23:16:24
486
1
原创 为什么要有mybatis?——mybatis
假设你正在开发一个电商网站,该网站需要处理大量的用户数据、商品数据以及订单数据。在这个过程中,你将频繁地与数据库进行交互,以执行各种查询、插入、更新和删除操作。
2024-09-05 22:31:44
1106
1
原创 一文清晰了解CSS
CSS(Cascading Style Sheets,层叠样式表)前面说了CSS是一种用于描述网页的标记语言。具体地,它通过将样式规则应用到HTML元素上,控制网页的布局、颜色、字体等外观特征。
2024-07-09 16:22:19
544
原创 安装和配置 MSYS2
MSYS2(Minimal SYStem 2)是一个为Windows平台提供的轻量级Linux类系统,它集成了大量的GNU工具链、工具和库,为开发者提供了一个类似于Linux的shell环境和完整的开发环境。以下是关于MSYS2的详细介绍:
2024-07-08 22:55:03
1135
原创 一文清晰了解HTML——简单实例
1.img中src有绝对路径、相对路径及网络路径之分。其中相对路径有../上一目录 ./当前目录 (./可省略) 命令。 【上述为网络路径】2. img还有width与heigh,单位可为px(像素)一般屏幕分辨率为1024*768;可为百分比,意为占body长或高的百分之多少。
2024-07-08 22:40:20
389
原创 R可视化数据必要格式——长格式
在R中,绝大多数图形要求的格式——都是长格式。我们在对数据进行可视化时遇到最头疼、最常见的问题是什么?数据问题。 因为我们往往不会从零自己编程进行可视化,往往是现有模板或积累,而正确的数据格式对应正确的图形包要求,一定会正确出图,所以只有一个问题——数据格式问题。
2024-07-03 21:40:51
615
原创 Linux Shell命令vim使用
其中第一个直接在Linux终端在线进行,第二个则是vim编辑器中的(所谓vim编辑器可以看成将代码写进一个文件进行编辑运行)第三个vim是对文件的操作,这也是Linux最大的作用。以判断引出(学过C++其他语言容易接受)。测试当前用户对某文件是否具有“可执行”权限。测试当前用户对某文件是否具有“可读”权限。测试当前用户对某文件是否具有“可写”权限。等待时间,到时间则停止输入。参数个数 如限制密码长度。测试文件是否为普通文件。屏蔽回显,用于输入密码。输入终结符 例如输入。
2024-06-12 20:22:36
496
原创 Windows使用SSH登录本机Linux虚拟机
SSH(Secure Shell),一种网络协议,可以在安全外壳下实现数据传输通信,所以主要用于,可以简单理解为远程控制。除了计算机间直接互联,在git中也可以看到,常见的协议有两种:ssh和https(HTTP Secure),在push和clone时可以选择不同协议,通过二者区别可以进一步理解及应用。
2024-04-28 13:43:08
611
原创 数据流模型——【数据科学与工程算法基础】
界标模型(规定不同数据段重要性);滑动窗口(只考虑窗口元素);衰减窗口(新到重要,旧者重要程度低)。既然概要了,就不可能很精确,只能近似估计,近似算法就相当于一种误差的评估。保存数据流再查询不可能,需要一种远小于数据流规模的数据结构来。收银机(前缀和,不断叠加);十字转盘(加入的数据有正有负)。一个∈代表相对误差,输出值与真值相差小于∈乘以真值。一个∈就是一个值,输出值与真值相差小于∈。,如直方图、抽样、小波、哈希。
2024-04-01 22:20:04
478
原创 绪论——算法设计原则【数据科学与工程算法基础】
预测值决定P与N,真实值决定T与F:也就是先看预测的,预测的是“正”,哦!那就是阳性的,是真是假呢?看真实值,真是正,那就是真阳性,真实值是负,那就是假阳性(FP)。阴性同理。
2024-03-11 21:16:51
2296
原创 数据科学的算法基础——学习记录跳转中心
本人数据科学与大数据技术专业大二学生,这学期新开了几门专业课,写作业时想拍拍题对答案顺便搜索搜索相关知识再学学巩固一下,结果发现根本拍不到,连相关知识大多都与应用紧密结合,代码型文章,但是课堂上用不到啊,主要要会做题掌握理论知识。出于一篇文章做一门课程可能太过冗杂且不好查找,所以采取分文章续写的方式,这也符合我的学习过程。所以突发奇想,想自己记录学习课程的过程:笔记、理解、题目,做一套专属于大学生的学习系列,各种问题都可以在其中找到答案。,会不断更新添加相应链接。《数据科学的算法基础》
2024-03-04 23:42:05
598
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人