自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 2024山东大学创新项目实训_20

目的:分析公司的损益表,评估其运营绩效、盈利能力和财务健康。流程:如果缓存存在,则直接读取缓存;否则获取损益表数据,生成问题描述并调用方法进行详细分析,最后将结果写入缓存并返回。2.分析并解释公司的资产负债表缓存答案是一个文件路径,用于存储分析结果的文本文件路径。如果启用了USE_CACHE并且缓存文件存在,则直接从文件中读取分析结果,避免重复分析。获取资产负债表:如果缓存不存在,则调用方法获取资产负债表数据。生成资产负债表字符串。

2024-06-24 11:24:24 564

原创 2024山东大学创新项目实训_19

范围:全局降维涵盖整个数据集,旨在减少数据集的复杂性。关注点:局部降维侧重于局部数据点的结构和相似性。参数差异:局部降维可能会使用不同的邻居数量参数,以便更好地捕捉局部的数据结构。应用:全局降维通常在数据预处理阶段使用,而局部降维则在数据理解和后续分析阶段使用,以更深入地探索数据的特定区域和关系。逐级进行嵌入、聚类和总结之后构建新的向量存储库,创建检索器,加载问题提示,返回配置好的RAG链。

2024-06-24 10:52:39 545

原创 2024山东大学创新项目实训_18

1. 从SEC(美国证券交易委员会)网站获取公司最新的10-K报告的链接。如果不存在,则进行以下操作以获取最新的10-K报告链接。2. 提取并返回股票的关键财务数据,包括最新收盘价、平均日交易量等。创建用于存储10-K报告章节的目录。定义报告章节文件的路径和名称,使用章节编号或名称作为文件名的一部分。计算过去6个月的平均日交易量,即历史数据中每日交易量的平均值。3.从公司的10-K报告中获取指定章节的内容。:如果缓存文件存在,直接读取文件内容,加载为。:返回最新的10-K报告链接。返回提取到的章节内容。

2024-06-24 09:36:24 259

原创 2024山东大学创新项目实训_17

函数接受股票代码(ticker)和时间周期(默认1年,即"1y")作为参数,使用雅虎财经的API获取该股票的历史数据,并返回其收盘价。

2024-06-24 01:47:38 959

原创 2024山东大学创新项目实训_16

该函数用于通过 HTTP GET 请求获取指定公司、指定季度、指定年份的财报文本数据。,分别表示正确的年份和给定的日期时间。它会将给定的日期时间字符串解析为。,分别表示正确的年份和给定的日期时间。,最后将修正后的日期时间格式化为字符串并返回。对象,然后检查该对象的年份是否与正确的年份。对象,然后检查该对象的年份是否与正确的年份。,最后将修正后的日期时间格式化为字符串并返回。根据指定的季度和年份获取公司的财报收益数据。对象的年份替换为正确的年份。对象的年份替换为正确的年份。2. 从浏览器获取数据。

2024-06-24 01:33:56 398

原创 2024山东大学创新项目实训_15

研报的绘制结果3。

2024-06-24 01:21:35 303

原创 2024山东大学创新项目实训_14

TableStyle: 定义了表格的样式。: 将整个表格的背景颜色设为白色。: 设置表格中所有单元格的字体为 Helvetica,字号为 8。: 设置表格第一行的字体为粗体 Helvetica,字号为 12。: 将表格中所有单元格的垂直对齐方式设置为居中。: 将表格第一列(除标题行外)的水平对齐方式设置为左对齐。: 将表格第二列(除标题行外)的水平对齐方式设置为右对齐。: 在表格的第一行下方添加一条黑色粗线,用作标题栏的分隔线。

2024-06-24 01:17:20 261

原创 2024山东大学创新项目实训_13

以上代码段通过 ReportLab 库创建一个PDF文档,其中包含了标题、子标题和相应的段落内容。每个部分都有其特定的样式定义,确保文档具有良好的可读性和专业性。同时,使用了双栏布局来优化信息的展示效果,使得整体布局更加紧凑和易于阅读。

2024-06-24 01:13:07 252

原创 2024山东大学创新项目实训_12

研报生成功能允许用户在前端输入一个公司股票的代码,然后生成一个pdf形式的研究报告,从多个方面根据已有的信息对该股票以及该公司做出评价和总结。生成的pdf保存在后端,当生成研报后先查找,如果存在它的研报,就会返回给前端进行显示,并且提供预览功能,反之,会返回该文件不存在。

2024-06-24 01:04:36 148

原创 2024山东大学创新项目实训_11

知识库后端功能的设计。

2024-06-24 00:52:09 307

原创 2024山东大学创新项目实训_10

知识库功能后端的设计用于加载环境变量,使用dotenv库加载环境变量文件 (.env) 中的配置,并将其设置为当前环境变量。INIT_LLM函数:这个函数根据给定的平台名称返回对应的语言模型列表,如果平台不存在,则返回空字符串。__init__

2024-06-24 00:49:11 124

原创 2024创新项目实训_09

ZhipuAILLM这段代码实现了一个集成了 ZhipuAI 服务的自定义语言模型ZhipuAILLM类。它通过_call方法实现了与 ZhipuAI 模型的交互,并通过和属性提供了一些默认参数和识别信息。这种结构使得可以通过统一的接口调用 ZhipuAI 的功能,并且可以方便地进行扩展和定制化。

2024-06-24 00:42:21 217

原创 2024山东大学创新项目实训_08

该方法可以用于从新闻网站获取到的新闻添加情感标签,也可以用于给用户给定的新闻内容添加情感标签。这段代码的关键在于利用预定义的模板来生成包含新闻内容的提示,并使用生成模型(假设为。)来生成情感分析结果。在处理生成的文本时,通过识别标志字符串。来提取情感分析结果,以便最终返回给用户。根据新闻内容生成情感分析结果。

2024-06-24 00:35:35 201

原创 2024山东大学创新项目实训_07

核心方法是 `answer`,它接收用户提出的问题,并返回更新后的历史记录。在回答问题的过程中,系统会根据用户提出的问题和历史记录,利用向量数据库和语言模型生成答案。这个类的输入是用户提出的问题,输出是更新后的历史记录。它的功能是根据用户的问题和历史记录生成答案,并保持对话的历史记录。用户可以通过调用 `answer` 方法向系统提出问题,系统将利用向量数据库检索相关文档,并使用语言模型生成答案。该系统具有灵活的参数设置,可以控制生成答案的随机性和检索相关文档的数量。QA_chain_self类。

2024-05-31 11:00:27 139

原创 2024山东大学创新项目实训_06

RAG 技术可以通过允许大型语言模型 (LLM) 在无需重新训练的情况下利用额外的数据资源来提高生成式 AI 的质量。要对文件进行分割,然后对文本进行处理和提取,将文本加到搜索引擎中,实现可以使用关键字进行检索,将LLM进行封装之后,构建prompt。,从而显著提升了回答的准确性与深度。

2024-05-30 09:47:19 155

原创 2024山东大学创新项目实训_05

给出三年来的现金流数据,发行的股票数据,资本支出、支付的现金、投资现金流等等相关数据,并且结合年度进行比较得出结论,分析现金支出的主要去向以及现金获得的主要来源,得出该公司未来现金流是否可观的结论。给出该公司股票的平均日价值、收盘价、市值、每股账面价值等数据,并且给出图示,给出过去几年的市盈率和每股收益的图示数据,给出最终关于是否要买的判断。对该公司过去的财务表现做出总结和评价,表示其是否值得投资,购入股票,对该公司未来的发展也做出预测和建议。

2024-05-30 09:22:17 204

原创 2024山东大学创新项目实训_04

分析了前三年的亏损收益情况,包括涉及到异常项目税收的影响、关于税率的影响、税前利润、净利息收入、总营业收入、基本平均股份、净收益、持续营业净收入等值,并对其,进行解释,说明公司收入情况,不同产品的收益状况、销售成本、运营开支、净收入等情况,并且会将几年的数据进行比较,给出未来公司可能的战略定位。显示公司的财务、债务情况,显示股票相关数据,对其进行解释,显示公司的债务情况,与前几年数据进行对比,并且针对负债对公司是否值得投资做出评价。

2024-05-30 09:12:13 159

原创 2024山东大学创新项目实训_03

2. 对收集到的数据进行清洗和预处理,包括去除HTML标记、去除停用词、词干化等操作,以准备好用于后续分析的数据。3.建立索引,利用搜索引擎技术建立一个能够快速检索新闻的索引。确保索引包含标题、内容、发布日期等重要信息。1. 首先进行了金融数据收集的再完善,在之前数据的基础上又新加了部分内容。本周着力于实现金融新闻搜索与分析的功能。

2024-04-28 23:24:56 359

原创 2024山东大学创新项目实训_02

2. 使用PyPDFLoader对PDF文件进行读取和加载3. 此时通过对pages进行操作可以得到与该PDF文件相关的内容,比如文件的总页数可以通过len(pages)得到。pages是一个List类型的数据,其中就是每一个page。输出page.page_content[0:100]就可以输出该page的前一百个字符。输出page.metadata就可以得到该page的来源(来自于哪一个PDF文件,以及是这个文件的第几个page,从0开始计数)。

2024-04-21 23:36:28 632 1

原创 2024山东大学创新项目实训_01

大模型微调是指在使用预训练的大型神经网络模型时,将其权重参数进一步调整以适应特定任务或领域的过程。在深度学习中,大型神经网络模型通常是在大规模数据集上进行预训练的,例如 ImageNet 数据集上的图像分类任务。这些预训练的模型具有良好的特征提取能力和泛化能力,可以作为特征提取器来解决各种不同的任务。:首先,加载一个在大规模数据集上预训练过的大型神经网络模型:通常情况下,会冻结模型的前几个层次(即底层特征提取器),以保留预训练模型在大规模数据集上学习到的通用特征。这样可以避免过度拟合,并加快微调过程。

2024-04-14 20:02:44 1364 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除