- 博客(93)
- 收藏
- 关注
原创 【大数据】MapReduce 编程-- PageRank--网页排名算法,用于衡量网页“重要性”-排序网页
PageRank 是 Google 创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)在 1998 年提出的一种网页排名算法,用于衡量网页“重要性”的一种方式。它是搜索引擎中用于排序网页的一种基础算法PageRank 的计算流程:假设总共 N 个网页,每个网页初始 PR 值为 1/N。:通过 MapReduce 不断迭代更新 PR 值,直到值趋于稳定。:PR 值越大,说明该网页越重要,排名越靠前第一列:网页编号(如 A)第二列:初始 PageRank 值(例如 0.25)
2025-05-19 14:42:48
1068
原创 【大数据】MapReduce 编程--索引倒排--根据“内容 ➜ 出现在哪些文件里(某个单词出现在了哪些文件中,以及在每个文件中出现了多少次)
将 Hadoop 所需的 JAR 文件添加到项目中,确保可以使用 Hadoop 的 API文件是一种用于打包多个 Java 类文件、资源文件(如图片、配置文件等)以及元数据的压缩文件格式。它类似于 ZIP 文件,但 JAR 文件通常用于 Java 应用程序或库的分发。在 Hadoop 或其他 Java 项目中,JAR 文件是执行程序的主要载体。通过将所有相关的类文件打包到一个 JAR 文件中,可以方便地管理和分发是一组定义了如何通过不同软件组件之间的交互来实现某个功能的接口。
2025-05-19 13:02:43
1134
原创 【大数据】MapReduce 编程--Relation--祖孙辈关系
MapReduce 模型可以分为两个主要阶段:Map 阶段:负责将输入数据分解并转换为键值对(),是数据处理的第一个环节。每一行输入数据都会调用 方法进行处理。Reduce 阶段:负责将 Map 阶段产生的结果进行合并、汇总或过滤,最终输出到结果存储。在 HDFS 上创建一个目录:如果上级目录不存在则一并创建,防止报错将当前目录下的 文件上传到 HDFS 中指定的目录Hadoop MapReduce 中 类的一个框架代码继承自 泛型类。导入 类,Hadoop 中的数据类型是 类
2025-05-12 16:29:43
924
原创 【大数据】MapReduce 编程--WordCount
API 是“Application Programming Interface”的缩写,即“应用程序编程接口”Hadoop 提供了一套,用于开发 MapReduce 程序、访问 HDFS、控制作业等MapReduce 是一种,主要用于处理。MapReduce应用程序至少包含 3 个部分:一个 Map 函数、一个 Reduce 函数和一个 main 函数。
2025-05-12 14:12:22
1122
原创 【 Node.js】 Node.js安装
编辑【系统变量】下的变量【Path】添加Node.js的安装路径--如果没有的话。Node.js 是一个可以在电脑上运行 JavaScript 代码的工具。让 JavaScript 能在服务器/命令行里运行。运行脚本命令(比如构建、启动开发服务器等)安装 JavaScript 第三方库。下载 | Node.js 中文网。勾选使用许可协议,点击Next。我这里安装后就已经有了。管理你项目用到的依赖。
2025-05-01 18:01:50
615
原创 【缓冲区分析】叠加分析-要素叠加
操作类型空间结果特征属性来源属性合并方式说明相交(Intersect)仅保留相交区域输入图层 + 叠加图层合并两图层所有属性,仅限空间相交的要素;不相交部分被舍弃联合(Union)保留全部空间区域输入图层 + 叠加图层所有区域保留,两个图层所有属性字段合并;不相交部分属性为NULL差分(Erase)输入图层中去除与叠加图层重叠区域仅输入图层删除与叠加图层重叠部分,只保留输入图层中未被覆盖区域的原始属性交集取反(Symmetrical Difference)输入和叠加图层中非重叠区域的集合。
2025-04-29 17:35:45
911
原创 【空间数据分析】缓冲区分析--泰森多边形(Voronoi Diagram)-arcgis操作
泰森多边形(Voronoi Diagram):根据一组输入点生成多边形,使得每个多边形内的任意位置到其关联点的距离最近。多边形之间无重叠,全覆盖研究区域。边界是相邻两点连线的垂直平分线。实验操作:使用 Create Thiessen Polygons工具结果:范围问题:直接生成的泰森多边形可能范围过小,无法覆盖整个研究区域扩展生成范围:在创建泰森多边形时,需指定一个足够大的 输出边界(通常用行政区划的四至范围)。在 环境设置(Environment Settings) 中,设置 输出坐标系/处理范围 为行政
2025-04-29 14:44:29
590
原创 空间权重矩阵
邻接关系:空间数据间的邻接关系描述空间单元间有公共边界且公共边界长度非0的的现象,可以认为是名义的、双向的和相等的距离单元格间共享(有公共边界)常用于栅格地图或多边形数据。单元格间共享(即只要接触即可)两个空间单元如果共享,就称为 Bishop 相邻。
2025-04-29 14:25:45
311
原创 【PyCharm- Python- ArcGIS】系统无法识别 pip 命令,手动将 Python 3.12 的路径添加到环境变量中,并确保不会干扰 ArcGIS 的环境。并安装 Flask
按照已经成功安装了一个独立的 Python 3.12 版本,并将其配置为 PyCharm 的 Python 解释器。接下来,要在这个 Python 环境中安装 Flask。
2025-04-28 15:22:39
865
原创 【MySQL 】MySQL 安装自记录全程-详细 (mysql-installer-community-8.0.42.0.msi)
看了一些别人的文章,其实还有些困惑,根据不少都有一些跟我遇到的不太一样,记录一下自己的安装过程下载 MySQL 安装包MySQL数据库官网链接MySQL (MySQL的https://www.mysql.com/点击downloads 推荐下载 MySQL Installer for Windows(推荐选择“Windows (x86, 64-bit), MSI Installer”)如果你只是本地测试,选择 “MySQL Installer (Community)” 就可以。 两个下载链接:mysql-
2025-04-27 18:15:10
1111
原创 【PyCharm- Python- ArcGIS】:安装一个和 ArcGIS 不冲突的独立 Python让PyCharm 使用 (解决全过程记录)
再勾选:pip、tcl/tk、venv等默认选项点击“下一步”后,
2025-04-27 13:40:56
970
原创 【自相关】全局 Moran’s I 指数
也称为,指的是同一变量在不同时间或空间点的值之间的关系。简而言之,自相关:针对同一属性之间进行分析相关性。则是针对空间数据,分析其“空间聚集性”或“分散性”自相关分析:用相同大小的窗口,把数据切分成若干块,再计算数据间的相关性把一整片数据(空间上的)分成小块,一块一块地看每块内部的数据是不是相关的,是不是存在某种或的趋势。这种分析方式就叫做,使用的是统一大小的窗口,目的是发现数据在。
2025-04-15 17:56:57
1198
原创 【MathType7】重要! !强制更新 您的当前MathType 版本即将过期:请立即更新,以避免满在的中断并继续享受我们的功能
这样就阻止了 MathType 的联网行为,从而避免它进行授权验证或推送更新提示。Mathtype与其官方服务器发起了联网操作,然后官网向该软件发起了弹窗命令。:随便填写一个(比如 “Block MathType”)(通过“开始菜单”搜索“Windows 防火墙”):点击“浏览”,选择安装目录下的。:将“域”、“专用”、“公用”全选。阻止 MathType 联网访问。:选择“程序” → 下一步。
2025-04-15 16:40:53
2442
5
原创 【数据库系统概论】第3章 SQL(四)视图(超详细)
1.建立视图语句创建视图CREATE VIEW <视图名> [(<列名> [, <列名>]…)]AS <子查询>用于创建一个新的视图WITH CHECK OPTION表示对视图进行UPDATE,INSERT和DELETE操作时要保证更新、插入或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)如果指定了,那么任何对视图的修改操作都必须满足视图的查询条件。视图列名的规则在创建视图时,视图的列名可以选择性地指定。如果不指定,默认会使用子查询中SELECT子句中所选的列名。
2025-04-14 22:13:50
1052
1
原创 【GeoDa使用】空间自相关分析操作
使用双击打开 GeoDa 软件选择.shp文件导入文件空间权重矩阵(*.gal / *.gwt)是进行任何空间分析的前提。
2025-04-07 20:47:47
1171
原创 【MathType】MathType安装过程和嵌入word过程(自记录)
MathType 是一款功能强大的数学公式编辑器,广泛应用于学术论文、教材编写、科研报告等领域。它支持多种数学符号、公式排版,并且与 Microsoft Word、Google Docs、WPS 等办公软件兼容,极大地方便了数学公式的输入和编辑记录一下安装的过程可能之后再需要安装的话也可以安装这个过程来。
2025-04-01 19:37:47
11964
22
原创 【GeoDa】GeoDa安装
轻量级、无需编程基础、适合地理学/经济学/社会学等领域的研究者。),若能正常显示地图和统计图表,则安装成功。安装完成,桌面出现下面图标(快捷方式),,尝试加载示例数据(______打开 GeoDa,点击菜单栏。选择中文Chinese简体。:免费开源软件,专注于。
2025-04-01 16:56:41
222
原创 【Kettle安装】Kettle安装过程, 电脑已安装java23,安装Kettle 出现报错:尝试启动 Java 虚拟机(JVM)时失败解决方法
支持从数据库(MySQL、Oracle等)、Excel、CSV、JSON、Web服务等多种来源提取数据。✅ 不想影响系统中的其他 Java 软件(比如 IntelliJ IDEA仍然需要 Java 23)如果放在一起,会有一样的文件在同一个文件夹中,发生替换,导致JDK或者JRE功能不全,无法运行。✅ 只想让 Kettle 使用 Java 8,而其他软件仍然使用 Java 23。JAVA_HOME指向的jdk的安装目录,之前安装java23时就配置过了。,高版本(如 JDK 23)可能存在兼容性问题。
2025-03-31 16:02:15
931
原创 【ArcGIS操作】ArcGIS 进行空间聚类分析
ArcGIS 是一个强大的地理信息系统(GIS)软件,主要用于地理数据的存储、分析、可视化和制图启动 ArcMap在 Windows 中,点击“开始”菜单,找到 ArcGIS文件夹,然后点击 ArcMap添加数据 - 点击工具栏上的 (一个黄色文件夹加一个加号)在弹出的窗口中,浏览到你的数据文件,选择并点击“添加”。(.shp)文件按住,然后拖进来添加的数据会显示出,数据框是地图的视图区域 地图浏览:使用工具栏上的 “放大”、“缩小”*和 “平移”工具来浏览地图。也可以通过鼠标滚轮进行缩放。查看数据属性 右
2025-03-30 21:00:19
2155
原创 【ArcGIS】ArcGIS10.6彻底卸载和ArcGIS10.2安装全过程
卸载python3后,解决了ArcGIS与python3冲突问题后,软件可以正常打开使用了但是还是出现了问题用ArcGIS 进行空间分析时,中间操作没有任何报错和问题,但是就是没有运行结果在别人的软件上操作一遍可以出现运行结果关闭确有这个,但真的不是我给它的运行时间不够,反反复复试了很多遍都没有运用结果不知道什么原因但打算卸载重装10,2的版本。
2025-03-28 16:43:31
1190
原创 【ArcGIS】ArcGIS10.8安装(问题--加载一段时间制动消失),解决,卸载python3(问题产生原因:Python3冲突)
不知道是哪里出了问题,最后还是打算卸载了再看看其他的,上面内容纯当做一个失败的记录吧。双击DesktopChinese_CN.msi文件会自动安装语言包,这里我没有安装。弹出的ArcGIS Administrator向导对话框,点击Cancel关闭。打开Crack文件夹,复制AfCore.dll文件,拷贝到安装目录下。原:C:\Program Files (x86)\ArcGIS\。安装完成之后打开ArcMap 10.8。原:C:\Python27\。点击Install开始安装。Python安装目录。
2025-03-19 23:10:53
579
原创 【ArcGIS10.2】ArcGIS10.2彻底卸载
点击Spatial Statistics Tools.tbx就闪退试了几遍偶尔弹出目前没找到解决方案,只能换其他版本重装以下内容记录自己处理的过程。
2025-03-18 10:27:23
1324
原创 【Java-黑马程序员】2024IDEA下载安装[ IntelliJ IDEA]
IntelliJ IDEA – 用于 Pro Java 和 Kotlin 开发的 IDE安装:傻瓜式安装,建议修改安装路径。选择版本Ultimate:功能全面,适合企业开发,需付费。Community:免费,适合个人和小型项目。选择适合你操作系统的版本Windows版的IDEA包含.exe.zip三种版本。.exe:需要双击安装,设置安装路径等。.zip:绿色版,直接解压就能使用。
2025-03-02 22:49:09
1007
原创 [VMware]卸载VMware虚拟机和Linux系统ubuntu(自记录版)
记录一下,不是教程,只是防止我做错了可以回溯一下我打开vscode,就会跳出下图虚拟机,Linux还是很久之前学习安装的,种途可能卸载过(不太记得了),现在尝试彻底卸载参考这写些文章的内容。
2025-02-26 11:42:07
1773
原创 【C++学习】核心编程之类和对象(下)黑马学习笔记—超详细
我们发现,定义一些类,下级别的成员除了拥有上一级的共性,还有自己的特性允许一个类(子类或派生类)继承另一个类(基类或父类)的属性和方法,从而实现代码的重用和逻辑的组织。
2025-02-23 15:23:11
970
原创 [VSCode]彻底卸载和重装,并搭建Java开发环境
由于当初是朋友帮忙装的,所以准备卸载,自己装一遍此时仅仅是删除了应用软件在图示路径中找到文件夹,将其删除,即可彻底清除安装的插件在图示路径下,删除文件夹,即可彻底删除用户信息和缓存信息文件夹我没找到输入图示路径是 Windows 系统中存储用户应用程序数据和配置文件的重要目录。它确保用户在多台设备上有一致的体验。
2025-02-22 16:23:28
1463
原创 【Java-黑马程序员】java官网下载和安装
官网打开官网 ,点击java点击下载java选择适合我们的系统版本的jdk,并点击下载点击.exe.msi.zip。
2025-02-22 12:08:09
829
原创 【数据库系统概论】数据库设计
转换为一个新的关系模式S。把与该联系相连的实体集的主码以及联系本身的属性作为关系S的属。性,各实体集的码组合作为关系S的主码或者主码的一部分,且各实体集的主码为关系S的外码。用户缺少计算机知识,不能准确地表达自己的需求,他们所提出的需求往往不。设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需。为了简化E-R图的处置,现实世界的事物能作为属性对待的,尽量。逐一考察D中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。关系的属性:与该多元联系相连的各实体的码以及联系本身的属性。
2025-02-22 09:21:09
938
原创 【数据库系统概论】第6章 (三)数据依赖的公理系统
(1)属性分类(L、R、N和LR),X代表L类和N类属性,Y代表LR类属性。(5)若X(X∈R)为N类和L类属性组成的属性集,且X+包含了R的。,求它们的属性集的闭包,直。否则,调换一属性反复进行这一过程,直到试完所有Y中的属性。设有关系模式R,F是R上的函数依赖集,求R的所有候选码。包含了R的全部属性,转(5);,若它包含了R的全部属性,则转(4);N类属性,则X包含在R的任一候选键中。,则X可能为R的任一候选码的成员,(1)若X(X∈R)为L类属性,则。全部属性,则X为R的惟一候选键。
2025-02-21 22:55:05
322
原创 【数据库系统概论】第第12章 并发控制
并发控制是指数据库管理系统(DBMS)通过控制多个事务同时执行,保证数据的一致性和隔离性,避免事务间的相互干扰。并发控制就是要用正确的方式调度并发操作,使一个 用户事务的执行不受其他事务的干扰,从而避免造成数据 的不一致性。会产生多个事务同时存取同一数据的情况可能会存取和存储不正确的数据,破坏事务一致性和数据库的一致性。若事务T对数据对象A加上S锁,则其它事务只能再对A 加S锁,而不能加X锁,直到T释放A上的S锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,:采用公平调度策略。
2025-02-21 21:18:54
831
原创 【SQL实验】触发器
3、为图书表设置更新触发器,根据总编号来更新书名(根据图书编号找到相应记录,更新书名),更新完毕后提示“更新后的总编号为:XX,书名为:XX”(其中XX代表相应字段的值);,根据总编号来更新书名、作者、出版社、分类号和单价(根据总编号找到相应记录,然后更新书名、作者等信息),更新完毕后提示“图书表更新成功”;编写测试语句进行测试。4、为ts设置删除触发器,若删除ts记录,则jy表中的相关书籍的记录也应删除,并提示“ts表和jy表相关记录已一并删除”;编写测试语句进行测试。变量需要先声明再赋值。
2025-02-21 21:06:42
563
原创 【数据库系统概论】数据库恢复技术
事务(Transaction)是用户定义的数据操作序列,这些操作被作为一个完整的、不可分割的工作单元来执行。在一个事务内的操作要么全部执行,要么全部不执行。事务:是数据库中用于实现数据操作的一种基本单元。在关系数据库中,一个事务可以是一条SQL语句、一组SQL语句,甚至是整个程序中的部分操作。程序:通常包含多个事务事务是数据库系统中实现恢复和并发控制的基本单位。
2025-01-10 22:06:55
1014
原创 【数据库系统概论】第6章 (二)范式(重点讲在函数依赖范畴内)
设R(U)是属性集U上的一个关系模式。XYZ是U的子集, 并且ZUXY。关系模式R(U)中多值依赖X→→Y成立,
2025-01-10 17:15:24
981
原创 【数据库系统概论】第5章 数据库完整性【!触发器】
针对某一具体应用的数据必须满足的语义要求触发器又叫做事件-条件-动作(event-condition-action)规则当特定的系统事件发生时,对规则的条件进行检查,如果条件成立则执 行规则中的动作,否则不执行该动作。触发器是一个能自动执行的特殊的存储过程CREATE TRIGGER {BEFORE | AFTER} ON REFERENCING NEW | OLD ROW AS [WHEN ];:用来定义一个新的触发器。
2025-01-10 16:54:43
1079
原创 决策树中的ID3算法(过程详解)
决策树是一种类似于流程图的树结构模型,它通过对数据特征的一系列测试和划分来进行决策或预测。信息熵体现了数据集中的不确定性程度。●当信息熵较高时,表明数据中的不确定性大,预测难度增加●信息熵较低则意味着不确定性小,数据更易于预测。示例:考虑贷款申请数据集,只有批准和拒绝两个类,其中9个批准,6个拒绝。条件熵表示在某属性A 的取值已知的情况下,数据集的不确定性:、信息增益量化了选择某个特征进行划分后数据集纯度的提升,信息增益越大,该特征越适合作为决策树的分割条件。【衡量某一属性对数据集分类的效果,表示使用该
2025-01-09 21:47:29
565
原创 【机器学习】L1正则化与L2正则化
L1,L2正则化解决过拟合问题过拟合发生时,模型学习到了训练数据中的噪声或细节,表现为(例如过大的权重值或过于灵活的假设),导致在测试数据上的表现较差欠拟合 理想状态 过拟合过拟合:曲线太过复杂,在机器学习中,正则化的目标是控制模型的复杂度,防止过拟合。其常见形式是向损失函数添加一个约束项(正则项)线性模型的损失函数。
2025-01-09 13:49:28
1126
学C++时的实验和作业
2024-12-17
七态-转化过程-转化原因.的visio流程图,和相关word文档
2024-10-17
基于C++的通讯录管理系统文件
2024-10-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人