项目
Happy丶lazy
这个作者很懒,什么都没留下…
展开
-
错别字识别数据构建
最近在做错别字识别的项目,数据集需要自己构造,于是写了一个小脚本。text_list = ['每到重要历史关头,我们党都会总结党的历史,从中吸取历史智慧,掌握历史主动', '四个历史时期各自承担前后相继的历史任务:救国、立国、富国、强国']for text in text_list: text_list = [] # 去掉文本中的特殊符号,因为特殊符号没有拼音 for num, char in enumerate(text): if (char >= u'\原创 2021-12-15 10:11:29 · 731 阅读 · 0 评论 -
paddle 进行目标检测_猫狗猴的识别
最近参加文本分类的比赛,发现自己写的代码和paddle的结果差别还是很大的,我的bert代码一直过拟合,哎,先用paddle吧,毕竟是百度大佬的,如果你想快速做出来一些东西,推荐使用paddle,这个项目是之前做过猫狗猴的图片分类,现在继续用这个数据集进行目标检测数据集制作VOC类型数据集,需要使用 labelImg工具(https://github.com/tzutalin/labelImg),推荐直接使用pip install labelImg -i https://mirror.baidu.原创 2021-10-27 16:55:22 · 873 阅读 · 0 评论 -
bert文本分类
之前做过分类,但是好多代码是我自己写的,没有很规范,最近整理了一下# -*- coding:utf-8 -*-# bert文本分类baseline模型import osimport numpy as npimport pandas as pdimport torchimport torch.nn as nnimport torch.utils.data as Dataimport torch.optim as optimimport transformersfrom transfor原创 2021-10-22 16:30:17 · 808 阅读 · 6 评论 -
Python实现RFM模型
模型介绍RFM模型即"R"——Recency(最近一次消费时间)、“F”——Frequency(一段时间内消费频次)、“M”——(一段时间内消费总额)。这三个指标可以将我们的用户划分成不同的等级和层次,目的是为了衡量他们的用户价值,从而能够更准确地将成本和精力花在更精确的用户层次身上。一个典型的例子就是针对一个明显无意愿的流失用户,对其继续push自己的核心产品,费时费力也费钱。数据清洗import pandas as pdimport numpy as npimport osdf = pd.原创 2020-10-11 16:04:21 · 1329 阅读 · 0 评论 -
python 日历+记事
当老师要求用ssh框架去做一个日历且带有记事功能时,内心是奔溃的,所以去询问老师是否可以用python去做,老师是常年做开发的,思路以及行动都比较活,所以,课设就问题不大了,我先展示自己的页面点击查询按钮可以进行年份的查询点击添加学习计划,将使用pandas代替数据库进行数据点击查看学习计划还需要一个csv文件,需要的可以留言或者去我的下载里寻找,...原创 2019-08-09 18:04:27 · 1737 阅读 · 2 评论