- 博客(542)
- 资源 (35)
- 收藏
- 关注
原创 vscode的安装并配置c语言环境
Visual Studio Code的下载和安装没有任何难度,直接找到官网https://code.visualstudio.com/进行下载安装即可。比较有难度的是搭建C语言的开发环境,网上有一大堆的教程,但是对于初学者来说确实还是很有难度,经常会出现很多莫名其妙的错误。无论安装什么软件,官方给出的官方文档都是最有说服力的https://code.visualstudio.com/docs/cpp/config-mingw,在这里很多问题都可以找到答案,但是阅读官方文档也有比较大的难度,因此在CSDN、
2020-09-20 21:23:01 4762
原创 BERT-BiLSTM-CRF模型实战
模型上进行预训练用于中文命名实体识别。官方网站下载模型到本地指定路径。配置为目前的模型路径。输入数据格式请处理成。
2024-09-23 15:22:54 132
原创 bert系列模型区别(bert-base-cased/bert-base-uncased/bert-base-chinese)
是一种预训练的语言模型,由Google开发并于2018年发布。BERT的目标是通过将大量无标注的文本数据进行预训练,来学习通用的语言表示。预训练阶段使用了和。在MLM任务中,BERT会随机遮盖输入文本中的一些单词,并通过上下文中的其他单词来预测这些被遮盖的单词。这个任务可以帮助BERT学习到对上下文信息敏感的单词表示。在NSP任务中,BERT会接收两个句子作为输入,并预测这两个句子是否是连续的。这个任务可以帮助BERT学习到对句子级别的上下文信息进行建模。通过这两个任务的预训练,BERT。
2024-09-23 15:00:49 30
原创 python使用动态主题模型DTM(Dynamic topic model)分析B站评论
函数中的时间步之后,对应的主题词也会发生变化,这显示了视频用户讨论主题随时间和视频内容的动态变化。主的昵称等高频但并不特殊的词汇,这种词汇也应该加入停用词表,之后再重新进行主题模型挖掘。加载停用词表,对回复xx人的评论内容,使用正则表达式re去除评论中无意义的昵称。表情符号对应的词汇并没有去除,得到的高频词很大一部分是表情符号,另外,高频词中有。进行分组,对每个视频的所有评论进行分词,如果不在停用词表中,并且长度大于。对于语料的处理直接影响最后的主题结果,虽然已经去除停用词,但对于。查看语料库中的高频词。
2024-09-18 10:00:54 141
原创 动态主题模型DTM(Dynamic topic model)简介及python代码
DTM模型()是一种用于文本数据分析的概率模型,主要用于发现文本数据背后的主题结构和主题的演化过程。DTM模型是LDA模型的一种扩展,能够捕捉文本数据中主题的变化和演化特征。DTM模型的核心思想是将文本数据视为时间序列,将主题模型应用于整个时间序列。它假设文本数据在时间上的分布是由一系列隐含的主题分布演化而来的。DTM模型通过在时间序列上建立时间窗口,并在每个时间窗口内估计主题的分布,来描述主题的演化过程。
2024-09-17 20:40:54 180
原创 Python Pyvis库创建交互式网络图 高级功能详解
通过设置不同的布局算法,可以更灵活地调整网络图的外观。支持创建动态网络图,通过时间轴展示网络图的演化过程。动态网络图支持添加点和边。也提供了一些性能优化的选项。参数可以让网络图在加载时更稳定。支持多种布局算法,包括。
2024-09-16 22:05:39 190
原创 python使用Pyvis库绘制B站评论互动网络结构图
pyvis是一个用于可视化网络的Python库。它基于NetworkX库,提供了用于绘制网络图的高级功能。pyvis支持多种网络类型,包括无向图、有向图、加权图和多图。它还支持多种布局算法,如随机布局、圆形布局、弹簧布局等。pyvis还提供了丰富的可视化选项,包括节点颜色、边的粗细和颜色、标签和标题等。
2024-09-16 19:46:37 295
原创 基于BERT模型的cnews数据集微调文本多分类模型
model.py:定义BERT分类器# Bert# 定义BERT模型# 定义分类器# BERT的输出# 取[CLS]位置的pooled output# 分类# 返回softmax后结果# Bert+BiLSTM,用法与BertClassifier一样,可直接在train里面调用self.classifier = nn.Linear(bert_config.hidden_size*2, num_labels) # 双向LSTM 需要乘以2。
2024-09-04 20:34:52 503
原创 查询GPU版本以及PyTorch中使用单GPU和多GPU
多GPU是指使用多个显卡来同时进行计算,以加速深度学习模型的训练和推断。每个GPU都有自己的内存和计算能力,通过同时利用多个GPU可以并行地执行模型的计算,从而提高整体的计算效率。
2024-09-04 20:10:39 572
原创 python调用阿里云接口实现文本分类、中心词提取和品牌预测
使用电商标题中心词以及类目进行训练,通过给每个词计算一个相关性分数来衡量每个词与句子的相关性程度,进而识别并提取出句子的中心词。NLP自然语言处理调整为5大分类,基础文本服务、电商行业能力、对话智能服务、通用行业能力、医疗行业能力。、标题及其他类似短文本的中心词,目前仅提供电商领域中文中心词提取。品牌预测需要中文电商商品标题,可以返回电商商品标题中包含的品牌词。对用户输入的一段文本,映射到具体的类目上。
2024-08-13 16:50:52 187
原创 pandas教程:pandas读取csv文件并指定字段数据类型
参数来指定每个列的数据类型。这个参数接受一个字典类型的值,其中键是列名,值是数据类型。如果无法进行转换,则会引发一个异常。参数来控制异常的处理方式。当数据与指定的数据类型不匹配时,无法实现解析会报错。列的数据类型为字符串,列的数据类型为浮点数。会在不匹配时引发异常,会将无法转换的值转换为。参数传递,时间类型通过。文件时,我们可以使用。在此示例中,我们指定。列的数据类型为整数,类型的时间数据添加到。
2024-07-31 00:07:53 229
原创 数据库SQL Server列拼接Join和Union
操作用于将两个或多个表中的行结合起来,基于它们之间的某种关系。要求两个查询选择的列数相同,并且相应的列数据类型兼容。是两种不同的操作,它们用于合并来自两个或多个表的数据。则不需要去除重复的行,因此可能会包含重复的数据。操作要求所有合并的列数和数据类型必须相同。操作用于合并两个或多个。
2024-07-16 20:19:58 414
原创 SQL Server设置定时作业调度Schedule
在“步骤”选项卡中,单击“新建”按钮,然后输入步骤的名称和描述。在“计划”选项卡中,单击“新建”按钮来创建一个新的计划。代理将在指定的时间和频率下运行作业,并执行您定义的。右键单击“作业”文件夹,然后选择“新建作业”。在“作业属性”对话框中,输入作业的名称和描述。代理的功能,可以用来设置定时作业。在“命令”文本框中,输入要定期执行的。现在,您已经成功设置了一个定时作业。连接到要设置定时作业的数据库实例。设置每天早上八点执行这个定时任务。在对象资源管理器中,展开“
2024-07-15 20:23:14 796
原创 python datetime库与时间戳timestamp的转换
datetime.timedelta(days[, seconds[, microseconds[, milliseconds[, minutes[, hours[, weeks]]]]]]):表示时间间隔的类。datetime(year, month, day[, hour[, minute[, second[, microsecond[, tzinfo]]]]]):创建一个指定日期和时间的datetime对象。datetime.now():返回当前日期和时间的datetime对象。
2024-07-13 22:29:39 420
原创 数据库SQL Server窗口函数、聚合函数
功能,**它们允许你在结果集的行上执行计算,而不需要将结果集分组为多个输出行。**窗口函数可以对一组行执行计算,这组行与当前行相关,被称为窗口。窗口函数可以执行排名、聚合、行号分配等操作,而无需改变查询结果中的行数。如果我们想计算每个部门内员工的平均薪水,但不想改变结果集中的行数(即仍然为每位员工显示数据),我们可以使用。中的窗口函数(也称为分析函数)是一组非常强大的。降序排列,为每个分区内的行分配一个唯一的行号(分区,并计算每个分区内薪水的平均值(),但结果集中仍包含每位员工的记录。
2024-07-07 01:02:40 534
原创 数据库SQL Server常用操作:增删改查
SELECT *,CONCAT(活动ID,‘_’,unique_id) as unique_key FROM [result].[tmall_single_treasure_warning]通过窗口函数ROW_NUMBER()对每家店铺进行分组,只提取更新时间最新的一条记录,之后再过滤valid_flag=1的店铺作为需要预警的店铺。join (SELECT 活动ID as activity_id,unique_id as uni_id, COUNT(*) AS 累计预警次数。Kepler活动开始时间,
2024-07-07 00:00:00 595
原创 智谱AI ChatGLM-4使用教程:Prompt工程
如果后续章节的理解需要依赖于前面章节的信息,那么在当前部分的总结中附加之前内容的连贯摘要,能够显著提升模型的生成质量。在长对话中,为了确保对话的连贯性和有效性,对之前的交流内容进行精炼和总结,可以保持对话的焦点、减少重复和混乱、加快模型处理速度。方法访问智谱开放平台的知识库,用户可上传相关的知识到知识库,模型将基于用户的查询,,提取相关的语义切片,提供更加精准详细的信息。指定按照具体的长度的输出内容,但是让模型精确的生成一个特定的字数难以实现。当你理解用户的预约会议室的意图时,提取相关的实体,并且以。
2024-07-01 22:49:21 612
原创 智谱AI ChatGLM-4使用教程:网络搜索
使用参数可以自定义搜索内容,提升搜索结果的相关性和精确度。如果不传参数,系统将根据用户的消息自动进行网页检索。client = ZhipuAI(api_key="您的APIKey")tools = [{"search_query": "自定义搜索的关键词"}]"content": "中国 2024 年一季度的GDP是多少"}]
2024-07-01 01:05:47 446
原创 智谱AI ChatGLM-4使用教程:增强检索
通过在大语言模型生成答案之前,先从知识库中检索相关知识,然后将相关知识作为背景信息输入给大模型,有效地提升内容的准确性和相关性。支持将doc、docx、pdf、xlsx类型文件上传到知识库,支持自定义文件切片的大小和规则。文件大小不得超过50MB。用于管理文件,支持上传多个文件,并通过关联知识库ID后进行调用。知识库最大容量为1G、调用方式请参考接口文档。创建知识库后,您将获得一个知识库ID。调用模型服务时,传入知识库ID,使大模型能获取相关内容以响应用户查询。
2024-06-30 23:54:05 183
原创 智谱AI ChatGLM-4使用教程:函数调用Function calling(赠送免费500w token)
北京智谱华章科技有限公司(简称“智谱AI”)致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。公司践行的市场理念,推出大模型MaaS开放平台(),打造高效率、通用化的“模型即服务”AI开发新范式。
2024-06-30 23:52:25 713
原创 scrapy框架爬取淘宝网站信息+selenium自动登录获取cookie
Scrapy是一个适用于Python的快速、高层次的屏幕抓取和web抓取框架。以下是关于ScrapyScrapy是用于抓取web站点并从页面中提取结构化数据的强大工具。它基于Twisted异步网络框架,具有高效的异步处理能力,可以并发地下载和处理多个页面。Scrapy不仅仅是一个简单的HTML解析器,它是一个完整的爬虫框架,具有高度的可扩展性和灵活性。
2024-06-22 23:36:06 335 1
原创 Flask教程8:FastAPI和Flask优缺点及选择
FastAPIFastAPI是一个现代的、高性能的Web框架,基于的类型提示来实现API。它提供了快速、简单和直观的方式来构建Web API。FlaskFlask是一个轻量级的Web框架,简单而灵活,适合构建小型到中型的Web应用程序。它被广泛用于构建原型和快速开发。
2024-06-09 12:09:06 624
原创 Flask教程7:Flask-Restful-Swagger使用
是一个基于Flask和Swagger的扩展,它使得在Python中设计、文档化和测试变得简单而直观。如果你正在寻找一种高效的方式来构建可维护且易于理解的API,那么绝对值得你一试。项目简介Flask是一个轻量级的Python Web框架,Restful则是设计API的一种理念,强调资源的表述状态转移。Swagger是一个用于设计、构建、文档化和使用的工具集。将这三者结合起来,提供了一种方便的方法来实现规范化的API设计,包括自动生成详细的API文档,并支持交互式测试。技术分析。
2024-06-08 13:36:39 431
原创 Flask教程6:使用Flask-restful构建restful API
首先,提供了一致的API设计方式。它采用了一种简洁而直观的方式来定义路由和处理请求。通过使用装饰器或类视图,开发人员可以轻松地将URL映射到相应的处理函数上。这种设计方式使得API的结构更加清晰,易于理解和维护。其次,简化了请求处理的过程。它提供了一系列的请求解析器,可以自动解析请求中的数据并将其转换为适当的数据类型。这样,开发人员就不需要手动解析请求参数,而是可以直接使用解析后的数据进行业务逻辑的处理。除了上述功能之外,还提供了其他一些有用的功能。
2024-06-08 11:46:01 787
原创 Flask教程5:flask数据库SQLAlchemy
它的核心思想于在于将关系数据库表中的记录映射成为对象,以对象的形式展现,程序员可以把对数据库的操作转化为对对象的操作。,我们可能会写特别多的数据访问层的代码,从数据库保存、删除、读取对象信息,但这些代码都是重复的。当需要实现一个应用程序时,如果不使用。则能够大大减少重复性的代码。
2024-05-27 14:03:10 691 1
原创 Flask教程4:Flask数据交互
这一部分涉及到的库和拓展知识过多,将解释放在代码注释中,直接上代码再做简单的流程分析;传统的前端通用表单,需要前后端共同完成操作,前端需要使用。请求发送)到服务器,服务器端进行保存的操作;实现的,也就是说二者之间是存在紧密联系的。,那么服务器端就会为这次会话创建一个。对象时候,服务器会为客户端创建一个。标签来定义表单,而后端则需要使用。文件上传指的是客户端将文件上传(,如果客户端的一次请求没有携带。→ 如果内容不存在会报错;对于单文件的上传,主要用到。,并将通过特殊算法算出一个。→ 如果内容不存在会返回。
2024-05-27 11:37:08 1278
原创 cpolar内网穿透工具—无需部署,远程访问网址
cpolar是一种安全的内网穿透服务,它将局域网下面的本地服务器通过加密隧道暴露至公网,使得公网用户可以正常访问内网服务。只需一行命令,就可以将内网站点发布至公网,方便给客户演示。高效调试微信公众号、小程序、对接支付宝网关等云端服务,提高您的编程效率。
2024-05-27 00:27:27 243
原创 python调用阿里云通义千问(q-wen-max)API-创建智能体Agent
百炼能够让用户定制化构建一个assistant,这个assistant支持多种不同的指令()和描述(prompt),并且可以使用各类工具插件(plugins)和调用已选择的API来回答用户的问题。目前支持多种插件,如代码解释器、图片生成、夸克搜索等,也支持和自定义插件的录入。
2024-05-26 20:42:23 529
原创 python调用阿里云通义千问(q-wen-max)API-智能总结pdf文档内容
插件功能能够使得大模型的生成内容与外部三方应用结合,使得模型生成的内容更加准确和丰富,模型将拥有更好的生成能力。您也可以通过开发自定义插件,来使得模型生成更符合您预期的结果。通义千问的插件包括:文字识别、计算器、图片生成、万豪酒店预定推荐、可以让用户获得更多的能力,比如查询酒店信息,预定酒店、预定机票。可以获得更加实时性的消息,比如体育赛事报道、实时、热点新闻。链接,即可通过调用官方插件来总结文档。可以让用户构建专属的信息库。当然也可以自定义插件。
2024-05-26 20:05:20 360
原创 python调用阿里云通义千问(q-wen-max)API-TTS文本转语音
它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他语言语音)输出的技术,隶属于语音合成(语音合成模型,官方默认提供以下模型可被调用,共有几十种,目前覆盖通用场景、语音播报、配音解说、阅读产品简介、数字人、直播等多种场景。音视频创作中需要将文字转为语音播报的场景,如小说阅读、新闻播报、影视解说、配音等。智能设备/机器人播报的语音内容,如智能客服机器人、智能音箱、数字人等。提交单个语音合成任务,通过回调的方式流式输出中间结果,合成结果通过。)的流式音频,并获取对应时间戳。
2024-05-26 17:10:23 483
原创 python使用163邮箱实现邮件自动发送
mailserver = "smtp.163.com" #邮箱服务器地址username_send = 'qian_info@163.com' #邮箱用户名password = 'DPFVZK' #邮箱密码:需要使用授权码--填写自己独有的username_recv = ['184710@qq.com','20318@qq.com'] #收件人,多个收件人用逗号隔开mail = MIMEText('小王,这是用python发送的一个测试文件,将会用于监控提醒使用。\n你看能收到吗')
2024-05-06 23:37:33 428
原创 Flask教程3:jinja2模板引擎
文件,第二个(及后续)参数为可选项,用于向模板中传递变量。修改格式,我们可以在变量后添加括号,并在括号内定义。模板的第一个参数为指定的模板文件名称,如自定义的。来实现模板的渲染,要使用这个方法,我们需要导入。等属性 → \rightarrow →点击查看。如果想给该变量添加属性便于。
2024-04-30 23:40:50 597
原创 Flask教程2:flask高级视图
装饰器本质上是一个python函数,他可以让其他函数在不需要做任何代码变得的前提下增加额外的功能,其传入参数一般是函数对象(如视图函数),返回值也是一个函数对象;装饰器主要用于有切面需求的场景,如插入日志、性能测试、事务处理等与函数功能无关的操作,对于这些需要多次重用的代码,我们将其放置在装饰器里,就可以无需在每个函数中反复编写;# 定义装饰器函数# 替代登录操作print('登录操作!')# 执行传入的函数对象func()
2024-04-30 23:25:37 1321
原创 Flask教程1:flask框架基础入门,路由、模板、装饰器
Flask是一个非常小的Python Web框架,被称为微型框架;只提供了一个稳健的核心,其他功能全部是通过扩展实现的;意思就是我们可以根据项目的需要量身定制,也意味着我们需要学习各种扩展库的使用。
2024-04-28 00:03:27 732 1
原创 python利用向量数据库chroma实现RAG检索增强生成
向量数据库chroma教程RAG的全称是,中文翻译为检索增强生成。它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。知识更新问题最先进的LLM会接受大量的训练数据,将广泛的常识知识存储在神经网络的权重中。然而,当我们在提示大模型生成训练数据之外的知识时,例如最新知识、特定领域知识等,LLM的输出可能会导致事实不准确,这就是我们常说的模型幻觉。即LLM的知识不可能实时更新。简单来说,RAG对于LLM来说就像学生的开卷考试一样。
2024-04-27 18:35:48 1250 3
原创 向量数据库chroma教程
向量数据库其实最早在传统的人工智能和机器学习场景中就有所应用。在大模型兴起后,由于目前大模型的token数限制,很多开发者倾向于将数据量庞大的知识、新闻、文献、语料等先通过嵌入(embedding)算法转变为向量数据,然后存储在Chroma等向量数据库中。当用户在大模型输入问题后,将问题本身也embedding,转化为向量,在向量数据库中查找与之最匹配的相关知识,组成大模型的上下文,将其输入给大模型,最终返回大模型处理后的文本给用户。
2024-04-27 17:50:51 528 1
全国CO2分析可视化资料
2022-11-26
rapidminer-studio-9.9.0-win64-install.exe
2021-06-02
mathpixsnippingtool.rar
2021-04-30
Zotero-5.0.96_setup.exe
2021-03-31
RStudio-1.4.1106.exe
2021-03-03
Texture-Synthesis-Using-Convolutional-Neural-Networks-master.zip
2021-01-16
Image-Caption-Generator-master.zip_Ticketmaster
2020-12-30
卷积神经网络vgg19.npy
2020-12-13
GeoGebraGeometry-Windows-Installer-6-0-609-0.exe
2020-12-07
vgg16. neural network
2020-12-07
ChromeSetup .exe
2020-10-15
npp.7.9.portable.x64.zip
2020-10-15
新媒体管家_7_4_8__3.crx
2020-10-15
【微信下载】2019软科中国最好学科排名.xlsx
2020-10-06
50部TED精选合集.docx
2020-09-11
四六级真题链接.docx
2020-09-11
2020全国大学生数学建模竞赛.rar
2020-09-10
Dev-Cpp 5.11 TDM-GCC 4.9.2 Setup.zip
2020-09-01
codeblocks-20.03-setup.zip
2020-09-01
ARCTIME_PRO_2.4_WIN64.zip
2020-09-01
HBuilderX.2.8.3.20200728.zip
2020-08-31
typora.zip
2020-08-31
eclipse.zip
2020-08-31
Microsoft VS Code.zip
2020-08-31
Anaconda3.zip
2020-08-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人