辣炒猫丝-CSDN博客

原创 2024山东大学创新项目实训_20

目的：分析公司的损益表，评估其运营绩效、盈利能力和财务健康。流程：如果缓存存在，则直接读取缓存；否则获取损益表数据，生成问题描述并调用方法进行详细分析，最后将结果写入缓存并返回。2.分析并解释公司的资产负债表缓存答案是一个文件路径，用于存储分析结果的文本文件路径。如果启用了USE_CACHE并且缓存文件存在，则直接从文件中读取分析结果，避免重复分析。获取资产负债表：如果缓存不存在，则调用方法获取资产负债表数据。生成资产负债表字符串。

2024-06-24 11:24:24 585

原创 2024山东大学创新项目实训_19

范围：全局降维涵盖整个数据集，旨在减少数据集的复杂性。关注点：局部降维侧重于局部数据点的结构和相似性。参数差异：局部降维可能会使用不同的邻居数量参数，以便更好地捕捉局部的数据结构。应用：全局降维通常在数据预处理阶段使用，而局部降维则在数据理解和后续分析阶段使用，以更深入地探索数据的特定区域和关系。逐级进行嵌入、聚类和总结之后构建新的向量存储库，创建检索器，加载问题提示，返回配置好的RAG链。

2024-06-24 10:52:39 563

原创 2024山东大学创新项目实训_18

1. 从SEC（美国证券交易委员会）网站获取公司最新的10-K报告的链接。如果不存在，则进行以下操作以获取最新的10-K报告链接。2. 提取并返回股票的关键财务数据，包括最新收盘价、平均日交易量等。创建用于存储10-K报告章节的目录。定义报告章节文件的路径和名称，使用章节编号或名称作为文件名的一部分。计算过去6个月的平均日交易量，即历史数据中每日交易量的平均值。3.从公司的10-K报告中获取指定章节的内容。：如果缓存文件存在，直接读取文件内容，加载为。：返回最新的10-K报告链接。返回提取到的章节内容。

2024-06-24 09:36:24 279

原创 2024山东大学创新项目实训_17

函数接受股票代码（ticker）和时间周期（默认1年，即"1y"）作为参数，使用雅虎财经的API获取该股票的历史数据，并返回其收盘价。

2024-06-24 01:47:38 977

原创 2024山东大学创新项目实训_16

该函数用于通过 HTTP GET 请求获取指定公司、指定季度、指定年份的财报文本数据。，分别表示正确的年份和给定的日期时间。它会将给定的日期时间字符串解析为。，分别表示正确的年份和给定的日期时间。，最后将修正后的日期时间格式化为字符串并返回。对象，然后检查该对象的年份是否与正确的年份。对象，然后检查该对象的年份是否与正确的年份。，最后将修正后的日期时间格式化为字符串并返回。根据指定的季度和年份获取公司的财报收益数据。对象的年份替换为正确的年份。对象的年份替换为正确的年份。2. 从浏览器获取数据。

2024-06-24 01:33:56 414

原创 2024山东大学创新项目实训_15

研报的绘制结果3。

2024-06-24 01:21:35 320

原创 2024山东大学创新项目实训_14

TableStyle: 定义了表格的样式。: 将整个表格的背景颜色设为白色。: 设置表格中所有单元格的字体为 Helvetica，字号为 8。: 设置表格第一行的字体为粗体 Helvetica，字号为 12。: 将表格中所有单元格的垂直对齐方式设置为居中。: 将表格第一列（除标题行外）的水平对齐方式设置为左对齐。: 将表格第二列（除标题行外）的水平对齐方式设置为右对齐。: 在表格的第一行下方添加一条黑色粗线，用作标题栏的分隔线。

2024-06-24 01:17:20 277

原创 2024山东大学创新项目实训_13

以上代码段通过 ReportLab 库创建一个PDF文档，其中包含了标题、子标题和相应的段落内容。每个部分都有其特定的样式定义，确保文档具有良好的可读性和专业性。同时，使用了双栏布局来优化信息的展示效果，使得整体布局更加紧凑和易于阅读。

2024-06-24 01:13:07 264

原创 2024山东大学创新项目实训_12

研报生成功能允许用户在前端输入一个公司股票的代码，然后生成一个pdf形式的研究报告，从多个方面根据已有的信息对该股票以及该公司做出评价和总结。生成的pdf保存在后端，当生成研报后先查找，如果存在它的研报，就会返回给前端进行显示，并且提供预览功能，反之，会返回该文件不存在。

2024-06-24 01:04:36 160

原创 2024山东大学创新项目实训_11

知识库后端功能的设计。

2024-06-24 00:52:09 323

原创 2024山东大学创新项目实训_10

知识库功能后端的设计用于加载环境变量，使用dotenv库加载环境变量文件 (.env) 中的配置，并将其设置为当前环境变量。INIT_LLM函数：这个函数根据给定的平台名称返回对应的语言模型列表，如果平台不存在，则返回空字符串。__init__

2024-06-24 00:49:11 137

原创 2024创新项目实训_09

ZhipuAILLM这段代码实现了一个集成了 ZhipuAI 服务的自定义语言模型ZhipuAILLM类。它通过_call方法实现了与 ZhipuAI 模型的交互，并通过和属性提供了一些默认参数和识别信息。这种结构使得可以通过统一的接口调用 ZhipuAI 的功能，并且可以方便地进行扩展和定制化。

2024-06-24 00:42:21 233

原创 2024山东大学创新项目实训_08

该方法可以用于从新闻网站获取到的新闻添加情感标签，也可以用于给用户给定的新闻内容添加情感标签。这段代码的关键在于利用预定义的模板来生成包含新闻内容的提示，并使用生成模型（假设为。）来生成情感分析结果。在处理生成的文本时，通过识别标志字符串。来提取情感分析结果，以便最终返回给用户。根据新闻内容生成情感分析结果。

2024-06-24 00:35:35 217

原创 2024山东大学创新项目实训_07

核心方法是 `answer`，它接收用户提出的问题，并返回更新后的历史记录。在回答问题的过程中，系统会根据用户提出的问题和历史记录，利用向量数据库和语言模型生成答案。这个类的输入是用户提出的问题，输出是更新后的历史记录。它的功能是根据用户的问题和历史记录生成答案，并保持对话的历史记录。用户可以通过调用 `answer` 方法向系统提出问题，系统将利用向量数据库检索相关文档，并使用语言模型生成答案。该系统具有灵活的参数设置，可以控制生成答案的随机性和检索相关文档的数量。QA_chain_self类。

2024-05-31 11:00:27 149

原创 2024山东大学创新项目实训_06

RAG 技术可以通过允许大型语言模型 (LLM) 在无需重新训练的情况下利用额外的数据资源来提高生成式 AI 的质量。要对文件进行分割，然后对文本进行处理和提取，将文本加到搜索引擎中，实现可以使用关键字进行检索，将LLM进行封装之后，构建prompt。，从而显著提升了回答的准确性与深度。

2024-05-30 09:47:19 168

原创 2024山东大学创新项目实训_05

给出三年来的现金流数据，发行的股票数据，资本支出、支付的现金、投资现金流等等相关数据，并且结合年度进行比较得出结论，分析现金支出的主要去向以及现金获得的主要来源，得出该公司未来现金流是否可观的结论。给出该公司股票的平均日价值、收盘价、市值、每股账面价值等数据，并且给出图示，给出过去几年的市盈率和每股收益的图示数据，给出最终关于是否要买的判断。对该公司过去的财务表现做出总结和评价，表示其是否值得投资，购入股票，对该公司未来的发展也做出预测和建议。

2024-05-30 09:22:17 217

原创 2024山东大学创新项目实训_04

分析了前三年的亏损收益情况，包括涉及到异常项目税收的影响、关于税率的影响、税前利润、净利息收入、总营业收入、基本平均股份、净收益、持续营业净收入等值，并对其，进行解释，说明公司收入情况，不同产品的收益状况、销售成本、运营开支、净收入等情况，并且会将几年的数据进行比较，给出未来公司可能的战略定位。显示公司的财务、债务情况，显示股票相关数据，对其进行解释，显示公司的债务情况，与前几年数据进行对比，并且针对负债对公司是否值得投资做出评价。

2024-05-30 09:12:13 171

原创 2024山东大学创新项目实训_03

2. 对收集到的数据进行清洗和预处理，包括去除HTML标记、去除停用词、词干化等操作，以准备好用于后续分析的数据。3.建立索引，利用搜索引擎技术建立一个能够快速检索新闻的索引。确保索引包含标题、内容、发布日期等重要信息。1. 首先进行了金融数据收集的再完善，在之前数据的基础上又新加了部分内容。本周着力于实现金融新闻搜索与分析的功能。

2024-04-28 23:24:56 374

原创 2024山东大学创新项目实训_02

2. 使用PyPDFLoader对PDF文件进行读取和加载3. 此时通过对pages进行操作可以得到与该PDF文件相关的内容，比如文件的总页数可以通过len(pages)得到。pages是一个List类型的数据，其中就是每一个page。输出page.page_content[0:100]就可以输出该page的前一百个字符。输出page.metadata就可以得到该page的来源（来自于哪一个PDF文件，以及是这个文件的第几个page，从0开始计数）。

2024-04-21 23:36:28 665 1

原创 2024山东大学创新项目实训_01

大模型微调是指在使用预训练的大型神经网络模型时，将其权重参数进一步调整以适应特定任务或领域的过程。在深度学习中，大型神经网络模型通常是在大规模数据集上进行预训练的，例如 ImageNet 数据集上的图像分类任务。这些预训练的模型具有良好的特征提取能力和泛化能力，可以作为特征提取器来解决各种不同的任务。：首先，加载一个在大规模数据集上预训练过的大型神经网络模型：通常情况下，会冻结模型的前几个层次（即底层特征提取器），以保留预训练模型在大规模数据集上学习到的通用特征。这样可以避免过度拟合，并加快微调过程。

2024-04-14 20:02:44 1384 1

m0_63710385的博客