自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

什么都干的派森

常见工作问题记录

  • 博客(8)
  • 资源 (8)
  • 收藏
  • 关注

原创 图书推荐算法

1.先根据一个分类将图书进行首次切分#mermaid-svg-7QFAOope4Tab3GOh .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-7QFAOope4Tab3GOh .label text{fill:#333}#mermaid-svg-7QFAOope4Tab3GOh .node rect,#mer

2021-09-27 15:59:57 5411 4

原创 python数组排序方法详解(sort, sorted,argsort)

这三个排序方法应对日常工作基本够用先说一下三者的区别sort, sorted 是用在 list 数据类型中的排序方法argsort 是用在 numpy 数据类型中的排序方法( numpy 里也有一个 sort 方法,下面会讲)sort 和 sorted 的区别如下????先看两个简单的升序排序,分别使用 sorted 和 sort 方法# sorted num_list = [1, 8, 2, 3, 10, 4, 5]ordered_list = sorted(num_list)print

2021-09-27 14:03:34 67853 10

原创 python pdf和图片互转

1.安装两个包pip install PyMuPDF PySimpleGUI2.pdf转图片import fitzdef pdf2img(pdf_path, img_dir): doc = fitz.open(pdf_path) # 打开pdf for page in doc: # 遍历pdf的每一页 zoom_x = 2.0 # 设置每页的水平缩放因子 zoom_y = 2.0 # 设置每页的垂直缩放因子 mat =

2021-09-18 17:49:23 6462 12

原创 Chrome将网页背景变成黑色(真正的夜间模式、深色模式)

Chrome虽然有个深色模式,但是这个深色模式只是把浏览器外框变成了黑色,页面原来的底色还是白色,如果需要长时间浏览页面的话,眼睛依然会有些酸痛。真正的深色模式应该这样做。1.将这一行url粘贴到地址栏回车。chrome://flags/#enable-force-dark2.往下拖找到 Force Dark Mode for Web Contents 这项功能,将选项中的Default 改为 Enabled3.此时下方会弹出一个提示告诉你重启浏览器后会生效,要不要重启,点这个 Relaunc

2021-09-18 09:02:00 20765 16

原创 MYSQL报错 1093 - You can‘t specify target table ‘data‘ for update in FROM clause

报错如下1093 - You can’t specify target table ‘data’ for update in FROM clause报错的sql语句# 把id编码最大的书的作者名字更新为“北岛”UPDATE book SET author='北岛' WHERE id IN ( SELECT MAX(id) FROM book)原因使用一条sql语句同时查询、更新了同一个表,mysql 和 sqlserver 都会出现这个问题解决办法在查询的结果外再包裹一层查询,使

2021-09-15 17:41:51 5685 5

原创 基于协同过滤的推荐算法(用户协同、物品协同、模型协同)

文章目录介绍1.基于用户的协同过滤推荐2.基于项目(物品)的协同过滤推荐3.基于模型的协同过滤推荐实现步骤1.用户协同过滤和物品协同过滤的实现方法1.收集用户偏好2.计算用户或物品的相似度3.推荐2.模型协同过滤的实现方法待补充介绍1.基于用户的协同过滤推荐基于用户的协同过滤推荐的基本原理是,根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群。基于邻居的历史偏好信息,为当前用户进行推荐。即:归类相似用户ABC,推荐用户BC的物品给用户A优点:可以间接发现相似用户的潜在兴

2021-09-04 16:24:53 13516 8

原创 中英文常用标点符号统一清洗为英文格式

def cleaning_msg(msg): ''' 清洗标点符号为英文格式 :return: ''' return msg.replace('(', '(').replace(')', ')').replace('!', '!'). \ replace('?', '?').replace(',', ',').replace(';', ';').replace(':', ':'). \ replace('”', '"').replace

2021-09-03 19:34:38 5851 6

原创 中文命名实体识别迁移学习扩展版

文章目录中文命名实体识别迁移学习扩展版1.首先把项目搭建好2.然后进行扩展中文命名实体识别迁移学习扩展版1.首先把项目搭建好参考这篇博文:https://blog.csdn.net/weixin_43721000/article/details/1199936642.然后进行扩展参考这个项目:https://gitee.com/smdg/named-entity-recognition-ner/blob/master/README.md(1) 项目简单说明把ner_run.py、serv

2021-09-01 08:56:35 5847 4

【文章话题分类论文】OpenAlex Topic Classification Whitepaper

本文介绍了openalex实现文章话题聚类和新文章自动归类话题的方式

2024-04-26

qwebchannel.js

QWebChannel 是 Qt 框架中用于在 Web 页面和 Qt 应用程序之间进行通信的类,python 的pyqt 和 pyside 可以基于 qwebchannel 与 js 进行双向通信

2024-04-16

Vue.js v2.7.16

下载到本地在html头部通过scripts脚本引入,类似这样 <script src="./static/js/vue.js" type="text/javascript"></script> 注意将相对路径配置正确

2024-04-16

【PyQt5.15.13】安卓版重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt5.15.13】macOS版重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt5.15.13】【windows版】重新编译QT支持html5视频播放

将文件中的 Qt5WebEngine.dll 和 Qt5WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide5` 或 `venv\Lib\site-packages\PyQt5` 中)

2024-03-23

【PyQt6.6.2】安卓版重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

【PyQt6.6.2】macOS版重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

【PyQt6.6.2】【windows版】重新编译QT支持html5视频播放

将文件中的 Qt6WebEngine.dll 和 Qt6WebEngineCore.dll 替换掉项目环境目录下的对应文件(对应项目环境目录在项目根路径下的 `venv\Lib\site-packages\PySide6` 或 `venv\Lib\site-packages\PyQt6` 中)

2024-03-23

各国发展水平统计信息(对所有国家发展水平聚类,确定待援助国家,涵盖算法:K-Means、DBSCAN、Hierarchical)

country : 国名 child_mort : 每1000个婴儿的5年死亡率 exports : 人均商品和服务出口,以人均国内生产总值的百分比给出 health : 人均卫生支出总额,以人均国内生产总值的百分比给出 imports : 人均商品和服务进口,以人均国内生产总值的百分比给出 Income : 人均净收入 Inflation : 国内生产总值年增长率的测算(通货膨胀率) life_expec : 如果按照目前的死亡率模式,新生儿的平均寿命是多少年 total_fer : 如果目前的年龄生育率保持不变,每个妇女生育的孩子数量 gdpp : 人均国内生产总值,计算方法是国内生产总值除以总人口

2023-10-28

商场客户信息数据集(201条)

该数据集适合做一些聚类算法的学习,如Kmeans等,数据集包含 性别、年龄、收入、消费等级四个字段,除性别外其余都为数字类型的数据

2023-10-24

住宅属性数据集【房屋价格预测-线性回归】

住宅包括如下属性: SalePrice - the property's sale price in dollars. This is the target variable that you're trying to predict. MSSubClass: The building class MSZoning: The general zoning classification LotFrontage: Linear feet of street connected to property LotArea: Lot size in square feet Street: Type of road access Alley: Type of alley access LotShape: General shape of property LandContour: Flatness of the property Utilities: Type of utilities available LotConfig: Lot configuration .......

2023-05-15

坦尼克号登船人员名单数据集(生还预测 二分类问题)

第一列age ,表示的是年龄 第二列cabin,表示客舱号 第三列embarked表示登船港口,S是Southampton南安普顿,C是Cherbourg法国瑟堡,Q是Queenstown爱尔兰昆士敦 第四列fare,表示船票价格 第五列name,表示的是名字 第六列parch,船上父母数/子女数,不同代的直系亲属数,比如某人和他的女儿及父亲同在这个船上,则他的这个数值就是父母数(1)+子女数(1)=2 第七列passengerId,表示乘船编号 第八列pclass,表示客舱等级,这里有三级,1为一等舱,2为二等舱,3为三等舱 第九列sex,表示性别male为男性,famale为女性 第十列sibsp,表示兄弟姐妹数/配偶数,同一代的直系亲属人数,比如某人和他的弟弟及妻子同在这个船上,则他的这个数值就是兄妹数(1)+配偶数(1)=2 第十一列surverved,表示是否存活,1为生存,2为死亡 第十二列ticket,表示船票编号

2023-04-28

MNIST手写数字 数据集

1. 数据文件 train.csv 和 test.csv 包含手绘数字的灰度图像,从0到9 2.train.csv 有 label, test.csv 没有 3.每幅图像高28像素,宽28像素,总共784像素 4.每个像素都有一个与之关联的像素值,表示该像素的亮度或暗度,数字越大表示越暗 5.该像素值是0到255之间的整数,包括0和255

2023-04-20

squad数据集(qa任务 )

加载方式: from datasets import load_dataset raw_datasets = load_dataset("squad", cache_dir='F:/datasets') # F:/datasets 为数据集下载后的本地目录

2023-03-07

猫狗二分类数据集【训练集+测试集共37500张图】

训练集共25000张,猫狗各12500张,前一半是猫后一半是狗 测试集共12500张,猫狗参半

2022-08-11

500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集

500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集,好的一批

2022-07-26

nvidia/stt_zh_citrinet_1024_gamma_0_25 语音识别模型

stt_zh_citrinet_1024_gamma_0_25 语音识别模型,包含中英等16种语言的语音识别,hugface上的模型名叫 nvidia/stt_zh_citrinet_1024_gamma_0_25

2022-07-26

Davlan/bert-base-multilingual-cased-ner-hrl NER命名实体识别模型

huggingface上的Davlan/bert-base-multilingual-cased-ner-hrl命名实体识别模型,包含中英等16种语言的人名、地名、组织识别

2022-07-25

FashionMNIST单通道十分类图片数据集【测试集+训练集】

FashionMNIST这是一个单通道的十分类图片数据集,初学机器学习时的常用数据集,包括了六万张图片的训练集和一万张图片的测试集

2022-07-16

sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 模型

这是一个句子转换器模型,它将句子和段落映射到 384 维密集向量空间,可用于聚类或语义搜索等任务,是 sentence_transformers 库的模型之一,官网下载速度缓慢,容易被墙,下载解压后,可以参考此文章进行模型本地加载 https://blog.csdn.net/weixin_43721000/article/details/125507996

2022-06-30

sentence-transformers/allenai-specter 模型

可用于语义聚合任务中的文本编码器,它将句子和段落映射到 768 维密集向量空间,是 sentence_transformers 库的模型之一,官网下载速度缓慢,容易被墙,下载解压后,可以参考此文章进行模型本地加载 https://blog.csdn.net/weixin_43721000/article/details/125507996

2022-06-28

emnlp2016-2018.json

包含 标题 和 摘要 等信息的数据集,适用于文本分类、相似度计算等任务,资源来自https://sbert.net/datasets/emnlp2016-2018.json,但是被墙了资源不太好找

2022-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除