自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (4)
  • 收藏
  • 关注

原创 AIGC:文本与图像生成工具的应用探索

青年理工工作者生活研究所 第2季。ChatGPT正在产生心智吗。

2023-11-01 01:04:24 173 1

原创 卸载流氓软件云龙输入法和智能云输入法的方法

步骤三:点击‘编辑’,在查找中直接输入‘智能云’,然后把下面的相应的文件删除就可以了。注意:我删除的是\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\CTF\TIP\下面的注册表(就查找出来的)版权声明:本文为CSDN博主「学什么都是一堆bug的研究僧」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。步骤二:在计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\CTF\TIP\(这下面有好多注册表)

2023-04-16 16:51:21 3132 3

原创 Python中的pip常用方法:换源、安装、升级、查询、卸载

换源临时使用格式:pip install -i 镜像网址 包名清华源: pip install-i https://pypi.tuna.tsinghua.edu.cn/simple 包名使用清华源临时安装numpy:pip install-i https://pypi.tuna.tsinghua.edu.cn/simple numpy设为默认使用当pip版本>=10.0.0直接输入指令:格式:pip config set global.index-url 镜像网址清华...

2021-05-06 12:43:31 1017

原创 基于条件随机场模型的中文分词改进(Python中文分词)

4. 基于条件随机场模型的中文分词改进方法4.1.改进分词速度4.1.1 更改存储特征值的数据结构在保存征值时,我们可以用字典、列表等数据结构来对结果保存。经过多次对不同数据结构的测试,发现在字典内嵌套的层数越多,遍历的速度越慢。针对特征四的所有结果中……最慢的是形如: {'希': {'B': {'前': {' '长':0}, '后': {'望': 0}}, 'M': {'前': {'阎': 0 }, '后': {'军': 0}}, 'E': {'前': {'里': 0}, '后': {'.

2020-11-21 02:28:15 1625 1

原创 基于条件随机场模型的中文分词实现(Python中文分词)

1. 引言在中文分词领域,基于字标注的方法得到广泛应用,通过字标注分词问题可转换为序列标注问题,现在分词效果较好且常用的是基于条件随机场(CRFs)的标注模型。其模型思想是,条件随机场模型对应一个无向图 ,,Y中的元素与无向图的顶点一一对应。在条件X下,随机变量的条件概率分布符合图的马尔科夫性质,即可称当前是一个条件随机场。条件随机场模型用于在给定需要标记的观察序列的条件下,计算整个编辑序列的联合概率分布,求解出句子中字的标记序列的联合概率分布,从而实现分词。2. 相关工作本次...

2020-11-20 23:10:43 2424

原创 OpenMP并行优化高斯朴素贝叶斯算法 - 通过身高、体重和肺活量推测性别(机器学习)

OpenMP并行设计在串行代码的基础上,OpenMP通过# pragma omp parallel for num_threads(thread_count) 指令,对所有涉及大型数组的for循环进行多线程处理,以此达到并行效果。用OpenMP进行共享内存并行计算使用pragma omp parallel for提高训练速度由于本项目串行需要多次通过for(i=0;i<dataLen;i++)循环遍历整个数组来求值,因此十分适合使用pragma omp parallel for指令来进

2020-11-20 00:34:41 927 2

原创 MPI并行优化高斯朴素贝叶斯算法 - 通过身高、体重和肺活量推测性别(机器学习)

MPI并行设计在读取数据时使用串行,其余for循环都采用MPI并行。具体步骤如下:1. 0进程读取数据文件,生成dataSet数组。2.通过MPI_Scatterv()函数将dataSet数组分为多个长度不等的数据块,向各进程散射数据块。3.各进程进行求和,通过MPI_Gather()函数将结果返回0进程累加,从而得出平均值。4.0进程通过MPI_Bcast()函数将平均值(r)广播到所有进程。5.各进程计算标准差的部分内容:。6.0进程完成剩余的标准差计算得出标准差SD。7.得到高斯分布

2020-11-19 23:49:55 1330 1

原创 C语言手撕高斯朴素贝叶斯 - 通过身高、体重和肺活量推测性别(机器学习)

#include"allHead.h"/*basicData.csv:性别、身高、体重 [i][0,1,2]addVitalCapacityData.csv:性别、身高、体重、肺活量 [i][0,1,2,3]*///性别:0表示未知,1表示男,2表示女float dataSet[DATA_LEN][EIGEN_NUM]; //数据集double maleNum=0;//男性总数double femaleNum=0;//女性总数double meanValue[2][3]; .

2020-11-19 21:05:04 1424

原创 C语言手撕高斯朴素贝叶斯 - 通过身高和体重推测性别(机器学习)

目录目录目录项目介绍项目1-1的准确度项目可行性:原理简介高斯分布(正态分布)朴素贝叶斯代码流程获取数据(数据清洗)代码实现头文件 allHead.h源文件handleData.cpp源文件及主函数 naiveBayes.cpp项目介绍1-1 通过身高、体重推测性别1-2通过身高、体重、肺活量推测性别1-3 MPI优化1-4 OpenMP优化项目1-1的准确度本项目用了150行C语言代码实现高斯-朴素贝叶斯,虽受限于数...

2020-08-02 17:26:33 2942

原创 Ubuntu使用Gparted调整分区大小—进入图形界面前一直停留在debian界面

今天按照教程操作—Ubuntu使用Gparted调整分区大小:https://www.cnblogs.com/z12568/p/10434930.html在选择完语言和界面mode后,在这下图的界面卡了很久:Debian GNU/Linux stretch/sid debian tty1debian login: user (automatic login)Linux debian 4.3.0-1-686 #1 SMP Debian 4.3.5-1 (2016-02-06) 1686Th

2020-07-03 20:28:30 2342

原创 Python_pandas:读取CSV文件、查找指定列和单元格、解决NaN问题

目录为什么不推荐用csv库?为什么推荐使用panda读取csv文件?开始panda操作csv文件之旅:0.csv文件预览1.读取csv文件2.查找指定列及指定单元格2.1指定列:通过索引指定列名为hour的列2.2指定单元格:1001A列23时的AQI值3.解决遇到的"NAN"为什么不推荐用csv库?本段说说使用csv库常见的问题:csv.DictWriter():该函数返回的结果遍历一次之后,再次遍历返回的结果是空列表。 csv.reader():返.

2020-07-01 19:58:35 58426

原创 利用Python对百度今日热点事件排行榜关键词的爬取

百度今日热点事件排行榜URL:今日热点事件排行榜代码:#CrawBaiduTop.pyimport requestsfrom bs4 import BeautifulSoupimport bs4tops = [] #创建空列表,用于储存词条url = 'h...

2018-04-06 19:23:32 3371

naiveBayes_MPI.c

朴素贝叶斯MPI并行

2021-03-27

NB_OpenMP.c

朴素贝叶斯OpenMP并行

2021-03-27

python中文分词:基于条件随机场模型的中文分词实现及改进全项目.zip

配合该项目使用:https://blog.csdn.net/admiz/article/details/109882968

2020-11-21

中文语料库:msr_training.utf8.ic

语料库。配合该实验使用:https://blog.csdn.net/admiz/article/details/109846185

2020-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除