- 博客(511)
- 资源 (37)
- 收藏
- 关注
原创 vscode的安装并配置c语言环境
Visual Studio Code的下载和安装没有任何难度,直接找到官网https://code.visualstudio.com/进行下载安装即可。比较有难度的是搭建C语言的开发环境,网上有一大堆的教程,但是对于初学者来说确实还是很有难度,经常会出现很多莫名其妙的错误。无论安装什么软件,官方给出的官方文档都是最有说服力的https://code.visualstudio.com/docs/cpp/config-mingw,在这里很多问题都可以找到答案,但是阅读官方文档也有比较大的难度,因此在CSDN、
2020-09-20 21:23:01 4720
原创 python使用163邮箱实现邮件自动发送
mailserver = "smtp.163.com" #邮箱服务器地址username_send = '[email protected]' #邮箱用户名password = 'DPFVZK' #邮箱密码:需要使用授权码--填写自己独有的username_recv = ['[email protected]','[email protected]'] #收件人,多个收件人用逗号隔开mail = MIMEText('小王,这是用python发送的一个测试文件,将会用于监控提醒使用。\n你看能收到吗')
2024-05-06 23:37:33 198
原创 Flask教程3:jinja2模板引擎
文件,第二个(及后续)参数为可选项,用于向模板中传递变量。修改格式,我们可以在变量后添加括号,并在括号内定义。模板的第一个参数为指定的模板文件名称,如自定义的。来实现模板的渲染,要使用这个方法,我们需要导入。等属性 → \rightarrow →点击查看。如果想给该变量添加属性便于。
2024-04-30 23:40:50 516
原创 Flask教程2:flask高级视图
装饰器本质上是一个python函数,他可以让其他函数在不需要做任何代码变得的前提下增加额外的功能,其传入参数一般是函数对象(如视图函数),返回值也是一个函数对象;装饰器主要用于有切面需求的场景,如插入日志、性能测试、事务处理等与函数功能无关的操作,对于这些需要多次重用的代码,我们将其放置在装饰器里,就可以无需在每个函数中反复编写;# 定义装饰器函数# 替代登录操作print('登录操作!')# 执行传入的函数对象func()
2024-04-30 23:25:37 1260
原创 Flask教程1:flask框架基础入门,路由、模板、装饰器
Flask是一个非常小的Python Web框架,被称为微型框架;只提供了一个稳健的核心,其他功能全部是通过扩展实现的;意思就是我们可以根据项目的需要量身定制,也意味着我们需要学习各种扩展库的使用。
2024-04-28 00:03:27 601 1
原创 python利用向量数据库chroma实现RAG检索增强生成
向量数据库chroma教程RAG的全称是,中文翻译为检索增强生成。它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。知识更新问题最先进的LLM会接受大量的训练数据,将广泛的常识知识存储在神经网络的权重中。然而,当我们在提示大模型生成训练数据之外的知识时,例如最新知识、特定领域知识等,LLM的输出可能会导致事实不准确,这就是我们常说的模型幻觉。即LLM的知识不可能实时更新。简单来说,RAG对于LLM来说就像学生的开卷考试一样。
2024-04-27 18:35:48 702 3
原创 向量数据库chroma教程
向量数据库其实最早在传统的人工智能和机器学习场景中就有所应用。在大模型兴起后,由于目前大模型的token数限制,很多开发者倾向于将数据量庞大的知识、新闻、文献、语料等先通过嵌入(embedding)算法转变为向量数据,然后存储在Chroma等向量数据库中。当用户在大模型输入问题后,将问题本身也embedding,转化为向量,在向量数据库中查找与之最匹配的相关知识,组成大模型的上下文,将其输入给大模型,最终返回大模型处理后的文本给用户。
2024-04-27 17:50:51 220 1
原创 python免费调用阿里云通义千问(q-wen-max)大模型API
通义千问,是基于阿里巴巴达摩院在自然语言处理领域的研究和积累。采用更先进的算法和更优化的模型结构,能够更准确地理解和生成自然语言、代码、表格等文本。除了基本的文本生成和问答能力,还支持更多的定制化需求,可以针对不同场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。创建好API Key之后,进入阿里云服务百炼的个人账号即可看到调用需要的API Key。进入阿里云大模型服务百炼平台,可以看到所有通义千问模型,选择适当的模型进行调用。产品文档中有详尽的参数设置以及使用指引和具体的各种调用代码。
2024-04-20 22:15:43 899
原创 Flask RESTful视图使用(蓝图、装饰器、渲染模板)
在蓝图中,如果使用Flask_RESTful,创建Api对象的时候,传入蓝图对象即可,不再是传入 app 对象。通过endpoint参数为路由起名。
2024-04-18 00:27:05 269
原创 调用阿里云API接口实现电商领域命名实体识别NER
阿里云是全球领先的云计算及人工智能科技公司,成立于2009年,为200多个国家和地区的企业、开发者和政府机构提供服务。阿里云提供了一系列的云计算服务,包括服务器租赁、云数据库、云存储、人工智能等,帮助企业和个人更高效地管理和运行他们的在线业务。阿里云是一个PaaS平台,提供IaaS和SaaS服务。
2024-04-06 16:26:48 490
原创 调用paddleocr实现中文文字识别
飞桨首次开源文字识别模型套件PaddleOCR,目标是打造丰富、领先、实用的文本识别模型/工具库。最新开源的超轻量PP-OCRv3模型大小仅为16.2M。同时支持中英文识别;支持倾斜、竖排等多种方向文字识别;支持GPU、CPU预测;用户既可以通过PaddleHub很便捷的直接使用该超轻量模型,也可以使用PaddleOCR开源套件训练自己的超轻量模型。PaddleOCR是基于深度学习框架的开源OCR。
2024-04-06 16:05:58 358
原创 python scrapy 爬取豆瓣电影top250教程
在初始页面获取电影top250基本信息之外,提取每部电影的链接详情detail_url并得到内部的时长duration和剧情简介。
2024-03-24 16:29:46 127
原创 科大讯飞开放平台-python语音转文字教程
科大讯飞的语音转写()——基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。转写的是已录制音频(非实时),音频文件上传成功后进入等待队列,待转写成功后用户即可获取结果,返回结果时间受音频时长以及排队任务量的影响。如遇转写耗时比平时延长,大概率表示当前时间段出现转写高峰,请耐心等待即可,我们承诺有效任务耗时最大不超过5小时,详情请参考SLA协议。
2024-03-21 23:22:51 514
原创 moviepy简介及使用教程
MoviePy是一个用于视频编辑的Python库,使用户能够处理、编辑和操作视频文件。这个库允许你剪辑视频、添加文本、合并视频剪辑,以及应用各种效果和转换。它建立在和Decorator等库的基础上,使得在处理视频时能够更加高效。下面是一些MoviePy的主要功能和特点:剪辑和合并视频:MoviePy允许你从现有视频中选择特定的片段,然后将它们合并成一个新的视频文件。添加文本和图形: 你可以在视频中添加文本、图形和其他元素,以创建字幕、水印或其他视觉效果。视频效果:MoviePy。
2024-03-21 16:16:07 605
原创 python爬取微博话题、关键词下方的所有帖子
连续获取一个或多个微博关键词搜索结果,并将结果写入文件(可选)、数据库(可选)等。所谓微博关键词搜索即:搜索正文中包含指定关键词的微博,可以指定搜索的时间范围。比如你可以搜索包含关键词“迪丽热巴”且发布日期在2020-03-01和2020-03-16之间的微博。搜索结果数量巨大,对于非常热门的关键词,在一天的指定时间范围,可以获得1000万以上的搜索结果。注意这里的一天指的是时间筛选范围,具体多长时间将这1000万微博下载到本地还要看获取的速度。1000。
2024-03-18 15:12:16 451
原创 python爬取B站CC字幕(隐藏式字幕)
srt的全称是,是一种非常流行的文本字幕,包含一行时间,一行字幕,制作规范非常简单。B站除了博主配置的原生字幕之外,还提供了一种智能生成的字幕——CC字幕,CC是的简称,所谓CC字幕,就是隐藏式字幕。CC是把文字加入NTSC电视信号的一种标准化编码方法。电视机的内置解码器或独立解码器能显示文字。Caption和常见的一般字幕(subtitle)的用法是有区别的,它是在无音状态下通过进行一些解释性的语言来描述当前画面中所发生的事情的字幕,例如画面中出现了背景的声音的时候,Caption。
2024-03-16 20:48:03 487
原创 Python实现视频转音频、音频转文本加文本实体识别
直接提取视频帧,之后实现逐帧的字幕识别,最后合并为视频文案。优点:准确性高;缺点:首先不是所有视频都有字幕,另外对计算资源要求很高,逐帧识别非常耗时。tips:有的视频会对重点字幕使用另外的颜色,或者放大字体等方式。视频先转为音频文件,音频文件使用接口再转为中文文本。优点:速度快,成本低。缺点:准确性较差,首先依赖于语音转文字的准确率,对于特有名词等,以及方言口音的识别较差,很难完全准确识别。可以在理论上考虑两者方法的合并。
2024-03-15 23:48:44 179
原创 python爬取京东评论最新教程2024.03
文本评论数据集可以做主题挖掘和情感分析两方面的工作,并尝试把两者进行结合,分析主题关注度较高的以及用户满意度较高的分类。等一系列信息,通过爬取京东评论并对用户评论做主题分析,可以挖掘海量用户购买商品的购买动机以及使用体验。京东的热门商品品类总会有上万+评论,这些评论汇集着海量信息,并且拥有发布时间、发布。,保存创建时间有利于之后做时间序列维度的用户评论挖掘。,拉动评论页面并换页,会出现与。页评论数据,也就是每种商品爬取。文件中,并可以汇总为一个总的。苹果手表品类,商品评价。
2024-03-12 12:34:09 581 1
原创 基于BERTopic模型的英文20新闻数据集主题聚类及可视化
BERTopic是基于深度学习的一种主题建模方法。BERT是一种用于NLP的预训练策略,它成功地利用了句子的深层语义信息。
2024-03-10 17:39:29 219
原创 启发式算法:遗传算法
染色体是由基因组成的,所以把组成遗传算法染色体(个体)的基本部分称为基因,基因的选择可以多种多样,比如在扇贝例子中,我们用像素作为基因,但实际上扇贝例子的原文是用不同的三角形块作为基因,通过不同三角形块的叠加形成。:在目前的种群中(通常是上一代的种群和新生产的种群的结合)选择一定数量的较优个体,形成新的种群。选择是通过适应度函数f(x)做出的,其中x为个体。:在种群中随机选择m个样本,在这m个样本中,选择适应度函数最好的个体作为下一代的个体,之后将样本回放,重复采用和选择直到选出一定数目的个体。
2024-03-10 14:21:38 54
原创 启发式算法:禁忌搜索 Tabu Search
一般是给被禁对象x一个数(禁忌长度)t,要求对象x在t步迭代内被禁,在禁忌表中采用tabu(x) = t记忆,每迭代一步,该项指标做运算tabu(x) = t-1,直到tabu(x)=0时解禁。禁忌对象:由于需要避免一些操作的重复进行,就要将一些元素放到禁忌表中以禁止对这些元素进行操作,这些元素就是我们指的禁忌对象(通常指找到的局部最优解)。为了避免陷入局部最优解,TS搜索中采用了一种灵活的“记忆”技术,对已经进行的优化过程进行记录和选择,指导下一步的搜索方向,这就是Tabu表的建立。
2024-03-10 00:22:15 58
原创 启发式算法:模拟退火算法
若目标函数f在第i+1步移动后比第i步更优,即fYi1≤fYifYi1))≤fYi)),则总是接受该移动。若fYi1fYifYi1))fYi)),即移动后的解比当前解要差,则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低,逐渐降低才能趋向稳定。
2024-03-09 23:51:26 142
原创 基于BERTopic模型的中文文本主题聚类及可视化
BERTopic是一种结合了预训练模型BERT和主题建模的强大工具。它允许我们将大规模文本数据集中的文档映射到主题空间,并自动识别潜在的主题。它背后的核心思想是通过BERT模型来捕获文档的语义信息,并然后使用主题建模技术来对这些语义信息进行聚类,从而得出主题。BERTopic是一种强大的主题分析工具,它能够自动识别文本数据中的主题,而无需预先定义主题数。通过结合BERT的语义表示和传统主题建模技术,BERTopic为主题分析任务提供了一个高效而精确的解决方案。
2024-03-02 23:00:19 1052
原创 BERTopic安装最全教程及报错处理
等第三方库的版本冲突问题导致安装失败,建议创建虚拟环境之后安装。BERTopic的安装比较复杂,直接安装会报错。4. 正式开始下载BERTopic。下载对应版本的BERTopic。文件到本地,之后再进行安装。的问题,可以使用更高版本的。包的版本问题,降低版本至。原生环境中安装可能因为。
2024-03-02 20:37:01 412
原创 python+Django+Neo4j中医药知识图谱与智能问答平台
功能有图谱搜索、功能列表、联系我们和注册/登录四种功能。请确保您的电脑有以下环境:python3,neo4j。由于数据量较大,运行时间较长。数据库在运行状态,否则无法导入数据。智能问答-为您推荐-健康百科。
2024-02-29 21:25:56 1328
原创 Python模糊匹配搜索fuzzywuzzy和difflib
利用pythonfuzzywuzzy及difflib,两个库均可实现词粒度的模糊匹配,同时可设定模糊阈值,实现关键词的提取、地址匹配、语法检查等。
2024-02-29 16:45:32 255
原创 Python+neo4j构建豆瓣电影知识图谱
该网址拥有丰富的中文知识图谱数据集,OpenKG(Open Knowledge Graph),可供研究人员使用研究。有些人既是导演又是编剧或者演员,重复生成节点会导致重复,所以需要对实体进行去重,然后对唯一实体添加他的多个标签。每次导入节点和关系非常耗时,py2neo提供了子图的方式可以批量导入节点和关系。
2024-02-29 00:14:54 792
原创 基于知识图谱的问答系统KBQA
基于知识图谱的智能问答(KBQA)通过对自然语言处理()、信息检索()、知识检索()、知识推理()、自然语言生成() 等人工智能技术的综合运用,来帮助人们更自然、便捷和精准地获取所需知识。
2024-02-28 17:16:30 359
原创 Cypher语句查询neo4j数据库教程
和能够表达的匹配条件相对简单,更加复杂的查询还是需要用Cypher语句来表达。Py2neo本身支持执行Cypher语句的执行,可以将复杂的查询写成Cypher语句,通过graph.run方法查询,返回的结果可以转化为或者对象,从而和其他数据分析工具无缝衔接。使用Py2neo查询Neo4j中的节点、关系和路径时,条件简单的查询可以通和来实现。而较为复杂的查询,可以写成Cypher语句来查询,查询结果可以转化为pandas的DataFrame或者Series数据类型,与其他数据分析工具结合。
2024-02-27 23:48:37 527
原创 Py2neo查询neo4j周杰伦数据库中的节点、关系和路径教程
Neo4j是一款开源图数据库,Py2neo提供了使用Python语言访问Neo4j的接口。本文介绍了使用Py2neo的和查询图中的节点和关系,以及通过执行Cypher语句的查询方式。
2024-02-27 23:28:55 1428
原创 毕业设计:基于知识图谱的《红楼梦》人物关系可视化
github基于知识图谱的《红楼梦》人物关系可视化:应该是重庆邮电大学林智敏同学的毕业设计,在学习知识图谱的过程中参考使用。app.py是整个系统的主入口templates文件夹是HTML的页面|-index.html欢迎界面|-搜索人物关系页面|-所有人物关系页面|-KGQA.html人物关系问答页面static文件夹存放css和js,是页面的样式和效果的文件raw_data文件夹是存在数据处理后的三元组文件neo_db文件夹是知识图谱构建模块|-config.py配置参数。
2024-02-19 16:43:26 873 9
原创 jieba安装和使用教程
add_word方法加载:向自定义字典中添加词语# 添加自定义词典text = "我喜欢C++语言编程很有趣"jieba.add_word("C++语言")# 打印分词结果方法加载sent = "你认为人工智能、机器学习和深度学习的关系是什么?print("添加前:",jieba.lcut(sent))print("添加后:",jieba.lcut(sent))
2024-02-19 15:29:31 433
原创 pyhanlp最全安装和使用教程
HanLP是一个由中国开发者何晗(hankcs)于 2014 年开发的自然语言处理库,自发布之后,HanLP不断更新迭代,进行了许多新功能和性能的优化,Github上Star数量已超过 3w,其在主流自然语言工具包中非常受欢迎。HanLP具有丰富的功能,可以进行一系列文本分析任务,比如词法分析(分词、词性标注、命名实体识别)、句法分析、文本分类/聚类、信息抽取、语义分析等等。发展至今,HanLP已经衍生出了1.x和2.x两大版本。本文pyhanlp0.1.84。
2024-02-18 00:09:50 479
原创 LTP/pyltp安装和使用教程
语言技术平台():是哈工大社会计算与信息检索研究中心历时十年研制的一整套开放中文自然语言处理系统。提供了一整套自底向上的丰富、高效、高精度的中文自然语言处理模块 (包括词法、句法、语义等5项中文处理核心技术)。本文使用的LTP版本是pyltp版本是0.4.0。
2024-02-17 20:20:40 1131
原创 知识图谱:py2neo导入周杰伦歌单csv文件
通过添加对前两列的描述,则可以对第一列和第二列进行分类查询,此时如果实体entity已经存在,则不建立新的节点Node。如果以普通三元组的形式导入周杰伦歌单csv,会出现很多实体entity的冗余,无法形成完整的知识图谱。的类型,所以颜色相同,无法相互区分歌手、歌曲还是专辑等等。之前写的知识图谱指南。因为没有区分不同实体。
2024-02-16 19:12:50 531
全国CO2分析可视化资料
2022-11-26
rapidminer-studio-9.9.0-win64-install.exe
2021-06-02
mathpixsnippingtool.rar
2021-04-30
Zotero-5.0.96_setup.exe
2021-03-31
RStudio-1.4.1106.exe
2021-03-03
Texture-Synthesis-Using-Convolutional-Neural-Networks-master.zip
2021-01-16
Image-Caption-Generator-master.zip_Ticketmaster
2020-12-30
卷积神经网络vgg19.npy
2020-12-13
GeoGebraGeometry-Windows-Installer-6-0-609-0.exe
2020-12-07
vgg16. neural network
2020-12-07
ChromeSetup .exe
2020-10-15
npp.7.9.portable.x64.zip
2020-10-15
新媒体管家_7_4_8__3.crx
2020-10-15
【微信下载】2019软科中国最好学科排名.xlsx
2020-10-06
50部TED精选合集.docx
2020-09-11
四六级真题链接.docx
2020-09-11
2020全国大学生数学建模竞赛.rar
2020-09-10
Dev-Cpp 5.11 TDM-GCC 4.9.2 Setup.zip
2020-09-01
codeblocks-20.03-setup.zip
2020-09-01
ARCTIME_PRO_2.4_WIN64.zip
2020-09-01
HBuilderX.2.8.3.20200728.zip
2020-08-31
typora.zip
2020-08-31
eclipse.zip
2020-08-31
Microsoft VS Code.zip
2020-08-31
Anaconda3.zip
2020-08-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人