自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 Python练习 遍历字典

使用一个字典来存储一些人喜欢的数。请想出5个人的名字,并将这些名字用作字典中的键。再想出每个人喜欢的一个数,并将这些数作为值存储在字典中。打印每个人的名字和喜欢的数。为了让这个程序更有趣,通过询问朋友确保数据是真实的。使用一个字典来存储一个人的信息,包括名、姓、年龄和居住的城市。该字典应包含 first_name、last_name、age 和 city。将存储在该字典中的所有信息都打印出来。Python字典可用于模拟现实生活中的字典。为避免混淆,我们将后者称为词汇表。

2025-01-03 21:47:31 334

原创 解决数据单一化问题的综合方案

需要注意的是,这个实现主要关注数据多样性的评估和管理,你可能需要根据具体的数据类型和业务需求来调整具体的实现细节。你可以通过运行示例代码来查看具体的输出结果。这个实现提供了一个基础框架,你可以根据具体需求进行扩展和修改。

2025-01-03 13:34:30 516

原创 Gladia的结构化关键数据提取(KDE)方法

Gladia的KDE方法代表了音频数据处理和信息提取领域的重要创新,通过结合先进的语音识别技术和生成式模型特性,为非结构化音频数据的处理提供了一个强大而灵活的解决方案。

2025-01-03 13:29:36 161

原创 考拉兹猜想的最终收敛意义

考拉兹猜想最终收敛到 1 的意义,不仅在于解决一个具体的数学问题,更在于它所体现的数学思维方式和对多个数学领域的影响。:序列的收敛路径看似随机,但实际上遵循确定的规则,这引发了对随机过程和确定性系统之间关系的思考。:由于其易懂的规则,考拉兹猜想成为引导学生进入数学探索的良好例子,培养逻辑思维和探索精神。:简单的问题往往蕴含深刻的数学规律,考拉兹猜想的最终收敛性体现了数学的奇妙和美感。:试图证明该猜想的过程中,催生了许多新的数学方法和工具,丰富了数论的研究手段。

2024-12-31 23:10:41 607

原创 BERT及相关模型发展图谱

这张图很好地展示了现代NLP模型的发展脉络,反映了领域的快速发展和多样化趋势。每个分支都针对特定问题或应用场景进行了优化,推动了整个领域的进步。

2024-12-31 09:08:40 337

原创 Hugging Face Transformers 库的特点

丰富的预训练模型易于使用最新研究成果的快速集成强大的社区支持跨框架兼容性高度灵活和可定制化广泛的应用范围

2024-12-31 09:07:29 555

原创 Python的包管理器pip

pip是Python的包管理器(package installer for Python),它是Python生态系统中最重要的组件之一。你可以把它想象成一个"应用商店",通过它我们可以方便地安装、更新和删除Python包。

2024-12-30 12:28:36 253

原创 古籍命名实体识别解决方案

是基于 RoBERTa 架构的古籍预训练模型,适用于繁体和简体中文,特别针对古汉语文本进行了训练。该模型能够捕捉古汉语的语言特点,为在古籍上进行下游任务(如文本分类、序列标注等)提供良好的基础。使用 Hugging Face Transformers 库加载预训练模型,并指定标签数量。库或自定义脚本,将数据加载为模型可训练的数据集。定义训练参数,如学习率、批次大小、训练轮次等。将实体标签映射为数字 ID,方便模型训练。训练完成后,保存模型以便后续加载和使用。使用与模型匹配的分词器进行分词。

2024-12-30 00:41:47 1004 2

原创 机器学习模型部署的三个主要云平台

推理端点是指已训练好的机器学习模型部署到生产环境中,用于实时预测或推理的服务接入点。"专用"意味着这些是独立的、专门用于生产环境的部署方案。亚马逊云服务(AWS)的机器学习平台提供通过 SageMaker 进行模型部署的功能Azure ML微软 Azure 的机器学习服务允许通过 AzureML 部署模型谷歌云平台的机器学习服务支持在 Google Cloud 上部署模型这三个选项都是企业级的专用(dedicated)推理部署解决方案,专门用于生产环境。

2024-12-29 23:58:57 901

原创 NLP 初学者快速熟悉Transformers 库的使用方法

Transformers 是由 Hugging Face 开发的一个非常流行的自然语言处理(NLP)库,它提供了数千个预训练模型,用于执行各种 NLP 任务,如文本分类、问答、文本生成等。

2024-12-29 23:54:48 1013

原创 字典的遍历、嵌套,数据的组织 代码联系 | Python

对于每座城市,都创建一个字典,并在其中包含该城市所属的国家、人口约数以及一个有关该城市的事实。创建多个表示宠物的字典,每个字典都包含宠物的类型及其主人的名字。将这些字典存储在一个名为pets的列表中,再遍历该列表,并将有关每个宠物的所有信息打印出来。在为练习6.1编写的程序中,再创建两个表示人的字典,然后将这三个字典都存储在一个名为people的列表中。遍历这个列表,将其中每个人的所有信息都打印出来。修改为练习6.2编写的程序,让每个人都可以有多个喜欢的数字,然后将每个人的名字及其喜欢的数打印出来。

2024-12-27 12:31:33 272

原创 字典的遍历、格式化输出和条件检查 习题|Python

练习 6.4∶词汇表2 现在你知道了如何遍历字典,请整理你为练习6.3编写的代码,将其中的一系列函数调用 print()替换为一个遍历字典中键和值的循环。当你再次运行这个程序时,这些新术语及其含义将自动包含在输出中。练习6.5:河流 创建一个字典,在其中存储三条河流及其流经的国家。创建一个应该会接受调查的人的名单,其中有些人已在字典中,而其他人不在字典中。对于还未参与调查的人,打印一条邀请参加调查的消息。使用循环将该字典包含的每个国家的名字打印出来。·使用循环将该字典中每条河流的名字打印出来。

2024-12-27 12:27:59 435

原创 字典相关代码习题 | Python

请想出5 个人的名字,并将这些名字用作字典中的键。再想出每个人喜欢的-个数,并将这些数作为值存储在字典中。打印每个人的名字和喜欢的数。练习6.1∶人 使用一个字典来存储一个人的信息,包括名、姓、年龄和居住的城市。也可以先在一行里打印术语,再使用换行符(\n)插入一个空行,然后在下一行里以缩进的方式打印其含义。这些代码示例都展示了Python字典的基本用法,包括创建、访问和遍历字典的操作。想出你在前面学过的5个编程术语,将它们用作词汇表中的键并将它们的含义作为值存储在词汇表中。

2024-12-27 12:25:10 327

原创 蠕变与数字人文

蠕变(Creep)通常是一个工程学或物理学中的术语,指材料在长期受力或高温条件下,发生缓慢、逐步的变形现象。其特点是缓慢、渐进且不可逆。

2024-12-26 18:27:15 301

原创 高斯积分与数字人文的交叉应用

高斯积分在数字人文研究中的应用展现了数学方法与人文研究的深度融合可能。通过合理运用这一工具,可以为人文研究提供新的视角和方法,推动数字人文领域的发展。

2024-12-26 18:23:33 397

原创 材料力学与数字人文

材料力学与数字人文的结合不仅仅是工具和方法的共享,更可能催生新的研究领域和理论框架。在文化遗产保护、文物研究、文化传播模型等方面,这种跨学科的合作具有巨大的潜力。

2024-12-26 18:20:02 717

原创 数值方法在数字人文中的创新应用

这个框架展示了如何将传统的数值分析方法创造性地应用到数字人文领域,为人文学科研究提供了新的量化分析工具和研究范式。通过这种跨学科的方法创新,我们可以更好地理解和分析复杂的人文现象。将计算力学的数值方法应用于数字人文研究,不仅能够提供新的研究视角和工具,还能够帮助我们更深入地理解人文现象的动态特性。这种跨学科的方法论创新,有望带来数字人文研究的新突破。

2024-12-26 18:17:25 415

原创 热力藕合与数字人文的整合研究

热力藕合为数字人文研究提供了新的分析视角和工具。通过量化要素间的关联性并结合可视化技术,可以更深入地理解人文现象的动态变化。未来,随着技术的进步和跨学科合作的深化,热力藕合在数字人文领域的应用将更加广泛,为人文学科的研究与实践注入更多活力。

2024-12-26 18:13:34 296

原创 数字人文中的噪声函数分析

这些噪声函数的设计和应用为数字人文研究提供了新的分析工具,能够更好地模拟和理解文化演化、语言变迁等复杂人文现象。通过合理使用这些工具,我们可以获得更深入的研究洞见。

2024-12-26 18:10:24 233

原创 巴黎圣母院:遗产科学中的数字数据与多学科知识交叉研究

文化遗产研究涉及物质对象与多学科研究的交叉领域,这为产生集体知识提供了一个平台。在数字时代,这种交叉为事实、对象和现象的集体分析与诠释提供了理想的框架,促进了新的科学和文化资源的创造——这些将成为我们明日的遗产。我们如何记录针对同一研究对象的不同视角?我们如何分析这些视角之间的动态互动、重叠和融合以产生新的知识?我们的研究引入了一个新的领域——多维度、多学科的数字数据——作为研究遗产科学中知识生产机制的基础要素。

2024-12-26 14:09:39 444

原创 心理学前言研究方法中的Python

交叉滞后模型(Cross-Lagged Panel Model)是一种用于分析纵向数据中变量之间相互影响的方法。它通过同时考虑时间点间的自回归效应和交叉滞后效应,来探讨变量之间的因果关系。结构方程模型(Structural Equation Modeling, SEM)是一种用于建模复杂变量关系的统计方法。近年来,新方法包括贝叶斯结构方程模型、稀疏SEM、以及机器学习与SEM的结合等。

2024-12-26 13:33:57 420

原创 中国剩余定理解析

问题是:最少要有多少个水果?这就是中国剩余定理要解决的问题!

2024-12-25 18:28:40 1483

原创 提示工程神器 之 少样本提示(Few-Shot Prompting)与代码解析

模型的性能会因提供的示例质量而显著变化。选择的示例不当可能导致结果不准确。高质量的示例可以显著提高模型的总体性能。:尽管少样本方法在处理简单任务时表现出色,但它在需要更大规模和更丰富训练数据的复杂任务中可能难以胜任。:当模型过于紧密地基于一小部分示例进行预测时,可能会出现过拟合,这可能导致无法准确代表任务。:少样本提示技术可能难以应对全新或未知任务,因为它高度依赖所提供示例进行指导。

2024-12-25 18:23:24 406

原创 文件处理与数据分析系统 | Python

这个综合性程序展示了Python编程中的多个重要概念,适合作为学习和实践的参考。

2024-12-25 14:18:55 344

原创 高阶情感分析代码实战 |附流程图、架构图、时序图

设计一个复杂的情感分析系统,结合词向量、情感词典和规则系统,用于数字人文研究中的高阶情感分析。这个示例将展示如何处理中文文本的细腻情感。

2024-12-25 00:57:46 865

原创 边缘计算(Edge Computing)的概念和应用

边缘计算是一种分布式计算架构,它将数据处理和存储功能从中心化的云端服务器转移到更接近数据源头的"边缘"位置。这些"边缘"可以是智能手机、IoT设备、本地服务器等。

2024-12-25 00:43:30 564

原创 代码实现 | 自动化技术博客文章质量打分

需要注意的是,这只是一个基础实现,实际的CSDN质量分析系统可能会更复杂,包含更多的评估维度和更精细的算法。让我帮您实现一个简单的文章质量分析系统。基于多个指标的评分系统,包括标题质量、内容结构、代码分析等。

2024-12-25 00:33:56 220

原创 条件测试 | Python

这个示例代码涵盖了题目要求的所有测试类型,每种类型都提供了至少一组 True 和 False 的测试结果。代码中还包含了清晰的注释和预测结果的说明,帮助理解每个测试的目的。

2024-12-25 00:22:53 491

原创 Python | 条件测试

创建一系列条件测试。包括5个返回True和5个返回False的测试。

2024-12-25 00:18:24 341

原创 for循环 | Python

这种循环结构是Python中最常用的控制流之一,适用于处理序列数据、重复操作和遍历数据结构等多种场景。

2024-12-24 18:12:20 218

原创 Python | 使用向量化运算替代循环

【代码】Python | 使用向量化运算替代循环。

2024-12-24 09:18:18 589

原创 探索类算法的优势

能够快速增加推理规模的方案就屈指可数了,最典型的就是以各种探索类算法为主,接近暴力的探索可以消耗很多算力,但实现方式并不复杂。这类算法在大规模推理场景中表现出独特优势,其性能提升可通过横向扩展计算资源实现,而无需复杂的算法优化。- 从BFS到MCTS均遵循统一的探索范式。- 性能随计算资源呈现良好的扩展性。- 算法框架支持灵活的策略注入。- 基于穷举特性保证解的完备性。- 结果具有可验证性和可重现性。1. **工程实现效率**2. **计算资源利用**3. **系统可扩展性**4. **结果可靠性**

2024-12-23 00:36:56 241

原创 大模型 合成数据步骤详细解析

通过高质量种子数据的筛选、改写、模型评估、自我改进、一致性验证以及多轮推理测试,可以生成高质量、逻辑严谨且多样化的合成数据,为数据驱动的应用提供可靠支持。- **目标**:确保种子数据质量高、覆盖多领域、内容复杂且偏向教育类。#### **4. 根据Answer反向生成指令,并对比验证一致性**- **目标**:通过改写种子数据,扩充数据集,提高多样性。- 基于网页内容,设计并生成高质量的问答对。- **目标**:提升合成数据的推理能力和事实准确率。#### **5. 对于推理类数据,进行多轮测试**

2024-12-23 00:21:24 473

原创 不完整信息与有限理性

通过系统学习复杂性科学,研究者能够获得更完整的系统观念和更有效的问题解决工具,从而更好地理解和应对现实世界中的复杂问题。理解这两个概念对于经济学研究和实践都具有重要意义,它们帮助我们更好地理解现实世界中的决策行为,并为改进决策机制提供了理论基础。理解这两个概念对于经济学研究和实践都具有重要意义,它们帮助我们更好地理解现实世界中的决策行为,并为改进决策机制提供了理论基础。不完整信息是指在经济活动中,参与者无法获得所有相关的信息,这种情况普遍存在于现实世界中。- 不完整信息是客观存在的外部环境特征。

2024-12-22 22:31:52 588

原创 各种列表操作函数的用法 | Python

尝试使⽤各个函数 想想可存储到列表中的东⻄,如⼭川、河流、国家、城市、语⾔或你喜欢的任何东⻄。sort() 修改该列表,使其元素按与字⺟顺序相反的顺序排列。打印该列表,核实排列顺序确实变了。打印该列表,核实已恢复到原来的排列顺序。打印该列表,核实排列顺序确实变了。打印该列表,核实排列顺序确实变了。将这些地⽅存储在⼀个列表中,并确保其中的元素不是按字⺟顺 序排列的。sorted() 按与字⺟顺序相反的顺序打印这个列表,不要修改它。再次打印该列表,核实排列顺序未变。再次打印该列表,核实排列顺序未变。

2024-12-22 11:59:14 716

原创 修改、添加和删除元素 | Python

修改嘉宾名单,将⽆法赴约的嘉宾的姓名替换为新邀请的嘉宾的。每次从名单中弹出⼀位嘉宾时,都打印⼀条消息,让该嘉宾知道。对于余下两位嘉宾中的每⼀位,都打印⼀条消息,指出他依然在。再次打印⼀系列消息,向名单中的每位嘉宾发出邀请。将最后两位嘉宾从名单中删除,让名单变成空的。不断地删除名单中的嘉宾,直到只有两位嘉宾为⽌。时编写的程序为基础,在程序末尾添加⼀⾏代码,你刚找到了⼀张更⼤的餐桌,可容纳更多的嘉宾。打印⼀系列消息,向名单中的每位嘉宾发出邀请。打印⼀条你只能邀请两位嘉宾共进晚餐的消息。

2024-12-22 11:03:55 400

原创 物理信息核函数在数字人文上的应用

通过定义合适的物理信息核函数,如高斯核函数(K(x,y) = e^{-\frac{\left\lVert x - y\right\rVert^{2}}{2\sigma^{2}}}),将这些物理特征映射到高维空间,其中x和y可以是包含古籍物理特征和其他相关特征的向量,\sigma是一个参数。例如,在艺术品修复中,通过聚类算法将不同老化程度和物理特性的绘画作品分类后,可以从颜料的物理化学性质、画布的物理特性等角度解释不同类别作品的损坏原因和修复要点,为后续的保护工作提供更有针对性的建议。4. 增强数据解释性。

2024-12-21 16:03:36 386

原创 分形几何 (Fractal Geometry)与数字人文

分形几何用于分析文本或文化数据的自相似性和复杂性。

2024-12-21 09:36:52 275

原创 代数拓扑在文本分析中的应用

让我们用这个简单的文本来实践一下文本分析的过程 😊。[小明] -----> [读书]"我喜欢吃苹果,这个苹果很甜"科幻小说让他充满想象力。

2024-12-21 09:36:07 930

原创 动力系统 (Dynamical Systems)与数字人文

动力系统用于分析文本或文化数据的时间演化和行为模式。

2024-12-21 09:35:41 360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除