- 博客(21)
- 收藏
- 关注
原创 「GPT」G、P、T分别是啥意思?
与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同,Transformer仅使用自注意力机制(self-attention)来处理输入序列和输出序列,因此可以并行计算,极大地提高了计算效率。在人工智能和机器学习的领域,预训练(pre-training)是指在一个较小的、特定任务的数据集上进行微调(fine-tuning)之前,在一个大数据集上训练一个模型的过程。如果输入数据是自然语言,则Transformer不必像RNN一样一次只处理一个单词,这种架构允许更多的并行计算,并以此减少训练时间。
2023-12-26 16:38:01 1928
原创 「NLP主题分析」LDA隐含狄利克雷分布(Latent Dirichlet Allocation)
e.g.200 维主题模型(定义了200多个主题编号,当前文本段落落入改主题的概率为 XXX),并展示出了关系最密切的主题和代表性词汇。LDA主题模型主要用于推测文档的主题分布,可以将文档集中每篇文档的主题以概率分布的形式给出根据主题进行主题聚类或文本分类。所以想要生成一篇文章,可以先以一定的概率选取上述某个主题,再以一定的概率选取那个主题下的某个单词,不断重复这两步就可以生成最终文章。主题词是主题的具象描述。概率值是指这段文本属于某个主题的概率值,概率值越高,文本的内容越倾向于对应的主题。
2023-12-13 16:27:12 1054
原创 由词性标注Part of speech Tagging引出的概念解释
词性标注任务是为给定句子中的每个单词分配给定标签集中的词性标签。就是对句子中的词进行分类和标注的过程,实际上是一个多分类任务。我们根据词在句法结构或语言形式中的成分,通过词性分类给每个词赋予相应的词性。即判断句子中的每个单词是名词、动词、形容词还是其他词性。词性标注工具:thulac、jieba。
2023-12-13 14:22:16 425
原创 「python爬虫」「selenium」「电商选品数据分析」商品信息抓取小白全教程(二、如何一步步定位目标元素信息)
本篇主要介绍第二个函数,也是最主要的部分对于爬虫需要的一些前置配置以及源网站获取的相关内容,可以参考上一篇文章 -> 商品信息抓取小白全教程(一、源网站的获取以及一些配置的加载)是最为重要的功能了这里函数的输入变量为当前页面所在的页码数字,而页码数的计算则通过后面main函数中range() 的每一项count出。为了把结果很好的保存到xlsx文件中,(csv也可,只需很小的改动),函数中首先定义global变量方便记录xlsx中的行信息接下来就是对于页面的爬取了!!!!!~...
2022-06-21 16:53:40 1027 1
原创 「近似算法APX」Greedy algorithm and local search
Four case studies in this chapter:Scheduling overdue jobsK-centerScheduling jobs in PARALLELMetric travelling salesmanScheduling jobs in PARALLEL with local search, other three with greedy.Difference between greedy and local search:(Quote from book
2021-09-09 13:12:18 429
原创 修改plot的背景颜色[matplotlib][axes][facecolor]
一句话修改背景颜色本次作业要画的diatom dataset在使用get_cmap改变颜色后,有一条线是白色,在图中不可见。因此修改背景颜色。效果如下:csdn上的解答翻遍了,基本上是用subplot的ax来修改颜色。但因为我的情况需要叠加这几条线,因此用不成这些方法。但这个回答很简明: “matplotlib自定义添加 “哆啦A梦”背景图”国外网友我认为很有用的解法:使用 ax = plt.axes() ax.set_facecolor('silver') 但这种方案报warning吓人,
2021-03-18 22:25:49 4953
原创 「Python」一步一步的在python中预处理csv文件--DataFrame笔记
找一个csv文件,也就是可以通过excel打开的那种。我是从mysql中,把一个表导出成了csv,是学生成绩表。在spyder中的console命令行下输入import pandas as pd g_18 = pd.read_csv('Desktop/studentGradeCsv/grade-18-Apr.csv', index_col = "No")表示No为index,并导入改成绩c...
2020-04-14 13:08:58 1025
原创 「JavaWeb」指令 标签
jsp是java server pages 动态网页开发技术比如开发tb的首页,选用前端技术html css js来实现,在实现页面开发之后,发现页面上的数据是固定不变的。真正在运行网站的时候,上面的数据会根据用户的操作发生变化。例如点击购买后 商品的数量会减少,需要做到这一点,则需要前端和后端的通信。需要jsp来实现jsp的实现:在前端页面上插入java代码片段,使用标签功能 小脚本来实...
2020-04-08 15:27:47 344
原创 「JavaWeb」显示服务器日期时间的jsp小应用 NoteFromMOOC
在第一次使用eclipse开发jsp应用程序时,需要设置相关的系统参数。为了解决js页面中服务器端编写中文的问题,需要设置jsp文件编码系统参数在创建一个动态web应用程序,接着再创建jsp文件在jsp文件中编写获得当前系统日期时间的java代码把应用程序部署到tomcat容器上,运行tomcat容器在浏览器中输入网址,访问jsp页面的显示效果。eclipse系统参数新建dyn...
2020-04-08 14:35:00 2092
原创 「JavaWeb」知识点复习 servlet jsp mysql eclipse相关点
web后端 与数据库进行交互与处理相应的业务逻辑web应用后端技术包括javaweb php asp.net pythonjavaweb 使用java开发web应用核心jsp servlet组件 = mvc开发模式web前端:htm实现网页的l结构 css实现网页的表示 js实现网页的行为层bootstrap:前端开发框架jquery:是js工具库java语言中的jdbc:ja...
2020-04-08 14:07:28 478
原创 「JavaWeb」Tomcat服务器的启动以及界面hello world
在jdk与tomcat已经完成之后,也就是这个机器以前跑过javaweb的项目时,新建一个javaweb项目的方法。Eclipse左上角 new->projectNew project 下选择web文件夹中的Dynamic Web Project。原因:因为网页即HTML页面,确切的说是页面中的某些数据,是由Servlet动态生成的。之后显示如下Projectname需要填...
2020-03-30 10:21:14 2914
原创 学生成绩评估分析系统实现的思路
很久之前一个跟着大佬的进度写(抄)完的spring项目,在springtoolsuite中。找问题打开项目Run As spring boot app,直接可打开,运行好像没错误。没有特别打开tomcat没有特别打开mysql数据库浏览器输入 http://localhost:8080/ 则可显示删改可使用,修改数据项时可更新“更新时间“增可使用,但通过网页中新增数据项无法显...
2020-03-17 15:20:04 51
原创 「Python」Mac下pip出现command not found和Could not find a version that satisfies the requirement ...解决方式
两个报错的解决方式在第2和3问题描述command not found解决方式Could not find a version that satisfies the requirement...(from versions: ) No matching distribution found for ...解决方式相关解释需使用python第三方库时,需要单独提前安装,一般这些库都已经...
2020-03-17 15:05:49 5074
原创 「MYSQL」无法使用delete语句删除列的报错error1175--模拟学生成绩信息导入mysql
ERROR1175 You are using safe update mode and you tried to update a table without a WHERE that uses a KEY column解决方式一:在每个sql删除语句中,where必须提到主键的值没有带键限制的where语句操作不会执行。解决方式二:打开终端,输入密码进入mysql,指令set sql...
2020-03-16 23:37:15 452 1
原创 「MYSQL」解决中文无法导入mysql问题的几种尝试error1366--模拟学生成绩信息导入mysql
已经在mysql中建能想到需要的表几张,手动建每张表都在建立时手动设置、输入初始化了列,和每列的数据格式设置可能出现的中文乱码问题如何处理乱码问题处理乱码问题参考2小白(我的)问题 如何在macOS的终端下使用mysql终端mysql指令123为我的密码 0.0这下可以查看设置中文乱码的链接来提前进行防止中文乱码的设置了。show create database te...
2020-03-16 23:00:32 284
原创 「python爬虫」「selenium」「电商选品数据分析」商品信息抓取小白全教程(一、源网站的获取以及一些配置的加载)
由于需要用到python进行商品数据分析、电商的选品
2020-03-16 19:51:33 1180
原创 mvc+云数据库+数据分析思路
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...
2020-02-01 15:47:38 184
原创 java.lang.UnsatisfiedLinkError: 我折腾了一下午的问题
今天调试百度鹰眼轨迹的相关功能时,在最后的最后跳了一个错。如下:java.lang.UnsatisfiedLinkError: No implementation found for long com.baidu.platform.comjni.map.commonmemcache.JNICommonMemCache.Create() (tried Java_com_baidu_platform...
2018-09-18 16:47:42 6869
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人