自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 问答 (3)
  • 收藏
  • 关注

原创 pyLDAvis报错:TypeError: drop() takes from 1 to 2 positional arguments but 3 were given

1、工具:jupyter notebook。

2024-01-17 15:59:26 1425 2

原创 如何去掉word上方页眉处的横线

1.首先点击任一页眉。

2023-09-16 16:55:57 487

原创 jieba.load_userdict报错:FileNotFoundError: [Errno 2] No such file or directory

【代码】jieba.load_userdict报错:FileNotFoundError: [Errno 2] No such file or directory。

2023-09-12 10:00:03 512

原创 SPSS逻辑回归分类变量(哑变量)设置

哑变量(Dummy Variable),又称为虚拟变量、虚设变量或名义变量,从名称上看就知道,它是人为虚设的变量,通常取值为0或1,来反映某个变量的不同属性。对于有n个分类属性的自变量,通常需要选取1个分类作为参照,因此可以产生n-1个哑变量。

2023-09-08 12:47:35 2767

原创 中介变量、调节变量与协变量

在平时看论文过程中偶会接触到这几个概念,然而都没想过弄明白,每次总觉得只要看明白个大概反正自己又不用这种方法…作为科研人,还是应该保持谦逊,保持学习中介变量(mediator)是自变量对因变量发生影响的中介,是自变量对因变量产生影响的实质性的、内在的原因,也就是说,自变量通过中介变量对因变量产生作用。举个例子:中介变量的作用原理如图所示:其中,c 是 X 对 Y 的总效应,ab 是经过中介变量 M 的中介效应(mediating effect),c′是直接效应。当只有一个中介变量时‚效应之间的关系可以

2023-03-30 18:07:42 10046 1

原创 指定wb用户在指定日期范围内的wb内容抓取

(1)首先对config文件中的参数进行修改,改成自己需要的,包括ID,cookie,是否下载图片等,具体参数作者在README中写得很清楚。博主:https://www.cnblogs.com/wangzheming35/(4)时间可能较长,运行完毕后出现weibo文件夹,数据都存在里面。注:代码非本人编写,只是记录一下具体操作过程。

2023-03-22 16:03:53 353

原创 pyecharts 地图绘制

可以实现目标地图绘制效果的python库很多,这里用的是pyecharts,具体可百度。世界地图+按数据进行分级着色;

2022-10-29 09:44:43 9309

原创 python报错decoding to str: need a bytes-like object, float found

我这里是因为.csv数据表中有空值,所以可以选择丢弃空值数据。

2022-10-08 11:48:43 900 1

原创 nltk.download(‘averaged_perceptron_tagger‘)报错

其实是很简单的问题,一看就是少了download()里面那个文件。可能是网速问题导致,同时看网上教程走github也下载不了,最后找的网盘资源。环境:win11+jupyter notebook+python3。

2022-09-29 18:23:45 1951

原创 浮动和清除浮动

注意:overflow:hidden可以解决子元素浮动,父元素高度塌陷的问题,是取消浮动的影响,借助BFC容器的特点,这个容器里面的浮动元素会参与父盒子的高度计算。通过clear属性来清除浮动,清除浮动元素对非浮动元素的影响。使用空白的div添加clear样式将浮动元素和非浮动元素隔开。给父元素添加伪元素选择器来清除浮动(推荐使用)非浮动元素里面的文本会被浮动元素挤出来。非浮动元素会占用浮动元素原来的位置。给受影响的元素添加 clear属性。子元素浮动,父元素高度塌陷。将浮动元素和非浮动元素隔开。

2022-09-17 10:19:15 102

原创 浮动哈哈哈

注意:overflow:hidden可以解决子元素浮动,父元素高度塌陷的问题,是取消浮动的影响,借助BFC容器的特点,这个容器里面的浮动元素会参与父盒子的高度计算。通过clear属性来清除浮动,清除浮动元素对非浮动元素的影响。使用空白的div添加clear样式将浮动元素和非浮动元素隔开。给父元素添加伪元素选择器来清除浮动(推荐使用)非浮动元素里面的文本会被浮动元素挤出来。非浮动元素会占用浮动元素原来的位置。给受影响的元素添加 clear属性。子元素浮动,父元素高度塌陷。进浮动元素和非浮动元素隔开。

2022-09-16 19:30:14 160

原创 选择器基础

对于选择器来说,丰富选择器的写法,可以精确找到页面中的某些标签。

2022-09-16 19:28:02 318

原创 盒模型(非要让我凑满五个字标题)

上面就是一个标准盒模型:content:代表内容区域,存放内容,文本或者里面图片等等padding:内边距,盒子内部的空间,内容与边框之间的间距,相当于快递中的泡沫border:盒子的边框,四周边框可以分别设置。margin:代表外边距,盒子和盒子之间的间距(分为父子关系和兄弟关系)

2022-09-16 19:25:03 288

原创 CSS基础(二)

设置字体的类型,每种系统默认指代的字体不一致。

2022-09-16 19:21:08 106

原创 CSS基础(一)

用户可以在浏览器中更改标签默认的样式。

2022-09-16 19:11:39 244

原创 HTML基础

语法: < dt > 中国 < dd > 中华人民共和国 < dt > 汽水 < dd > 冒着泡泡的肥仔水 < dt > 中国 < dd > 中华人民共和国 < dt > 汽水 < dd > 冒着泡泡的肥仔水

2022-09-16 19:06:38 575

原创 中餐馆过程vs中餐馆特许经营

中餐馆过程写在前面:关于中餐馆过程到底是什么,网上说法太多了,搞不清楚(我是入门级),在此仅记录我所搜集各种论文和资料中觉得比较靠谱的说法。中餐馆过程简单来说是对狄利克雷过程Dirichlet Processs(DP)的一种比较形象化的表示,除此以外,常见方法还有 Pólya urn和Stick-Breaking Construction等。中餐馆过程可以较好地表明,从DP中提取的数据都是离散的,并表现出聚类特性。中餐馆特许经营中餐馆特许经营简单来说是对层次狄利克雷过程(Hierarchical

2022-05-07 18:54:39 846

原创 深度学习入门(一)

一、基础概念深度学习是机器学习领域的一个重要部分,动机在于建立和模拟人脑进行分析信息的神经网络,该网络可以模拟人脑的机制处理数据,尤其是在图像识别任务中有飞跃性效率提升。二、深度学习经典框架如TensorFlow、Turi Create、BERT等,其中支持python的有TensorFlow、pytorch、Theano、MXNet等;简单介绍一下TensorFlowTensorFlow就是Google的深度学习框架。所谓框架就是别人帮我们构造好的基础软件应用,通过调用它们可以避免自己造“轮

2022-04-21 21:52:29 1374

原创 贝叶斯定理

一、简介贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系。(百度百科)二、引入事例隔壁老王要去10公里外的一个地方办事,他可以选择走路,骑自行车或者开车,并花费了一定时间到达目的地。在这个事件中,可以把交通方式(走路、骑车或开车)认为是原因,花费的时间认为是结果。若老王花了一个小时的时间完成了10公里的距离,那么很大可能是骑车过去的,当然也有较小可能老王是个健身达人跑步过去的,或者开车过去但是堵车很严重。若老王一共用了两个小时

2022-04-16 15:27:42 694

原创 SQL基础—DML与DDL

一、DML(Data Manipulate Language):数据操作语言(一)主要操作: insert 、update、delete1.插入(1)方式一语法:insert into 表名(字段名,...) values(值,...);特点:①要求值的类型和字段的类型要一致或兼容;②字段的个数和顺序不一定与原始表中的字段个数和顺序一致但必须保证值和字段一一对应;③假如表中有可以为null的字段,注意可以通过以下两种方式插入null值:字段和值都省略字段写上,值使用null④

2022-04-14 16:15:34 607 2

原创 SQL基础—DQL基础查询

基础语法select 查询列表from 表名;其中:1、查询列表可以是字段、常量、表达式、函数;#查询常量select 常量值;#查询表达式select 100/1234;#查询函数select 函数名(实参列表);2、查询结果是一个虚拟表;补充说明1、要注意查询常量时:字符型和日期型的常量值必须用单引号引起来,数值型不需要;2、起别名的两种方式:①as②空格3、去重操作:select distinct 字段名 from 表名;4、关于加号 +作用:做加法运算

2022-04-10 19:01:44 333

原创 SQL基础—SQL简介

SQL简介结构化查询语言(Structured Query Language)简称 SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。这里将其主要分为五个部分:数据查询语言(DQL): 简单说也就是对数据的查询语句,用以从表中获得数据,确定数据怎样在应用程序给出。数据操作语言(DML):简单理解就是对数据的增、删、改,其语句包括INSERT、UPDATE和 DELETE。数据定义语言(DDL): 简单说就是对表的增、删、改,其语句包

2022-04-10 18:43:03 772

原创 已经成功安装了但是jupyter notebook仍然找不到模块

问题描述工具、语言:jupyter notebook+anacondapython有时会遇到这样的情况,命名已经install了模块,notebook还是报找不到模块错误。再装已经提示satisfied。原因分析及解决个人认为,通常是因为装了不止一个python版本。使用pip命令装到另一个python上了。这里仅提供个人的一个解决方法,不一定最好,但是简单:(1)直接打开anaconda navigator;(2)侧边找到environments;(3)这里我是有三个(base是最基本

2022-04-01 22:25:16 6769

原创 jupyter notebook找不到包错误

报找不到包错误而且install了也没用(由于版本冲突或者太老了太久了等等原因)的情况下直接conda创建一个虚拟环境,安装需要的包和对应的python版本(如果需要的话),再打开notebook。省时省力,且整洁不互相干扰。虚拟环境具体创建方法搜一下就行,网上很多。...

2022-04-01 22:07:45 1294

原创 LDA主题建模过程及参数详解

平台及工具语言:python平台:anaconda+jupyter notebook语料库:近三百篇英文文献的摘要主要代码首先,# pandas处理csv数据import pandas as pddf = pd.read_csv("abs_all.csv",error_bad_lines=False,encoding='gb18030')df.head()输出:文本预处理def lemmatize_stemming (text): # 词形归并 wordnet_le

2022-03-27 11:26:02 8484 4

原创 微机原理 串操作指令笔记

大三学习微机原理与接口技术时做的笔记,迁移一下,做个分享和交流。顺带一提,当时是疫情在家上网课,老师完全放羊没上过课(真不是我没听),纯自学,如有错漏在所难免,还请多多包涵~...

2022-03-26 21:43:18 670

原创 常用主题建模方法简单对比LSA&PLSA&LDA&HDP

几种常用的主题建模方法潜在语义分析(LSA/I)概率潜在语义分析(PLSA)潜在狄利克雷分布(LDA)层次狄利克雷过程(HDP)LSA/I存在的主要问题SVD计算非常耗时,尤其文本处理,词和文本数都是非常大的,对于这样的高维度矩阵做奇异值分解是非常难的;主题个数值的选取对结果的影响非常大,很难选择合适的k值;LSI是基于矩阵分解的,得到的不是一个概率模型,缺乏统计基础,结果难以直观的解释。几种方法间的关系最近也是刚接触主题建模,根据在网上以及书籍和文献搜集资料,我个人作如

2022-03-26 21:29:26 2407

原创 读取csv文件时报错‘xxx‘ codec can‘t decode byte 0xd3 in position xx ...

问题简介语言:python平台:jupyter notebook在使用pandas读取csv文件时报'gb18030' codec can't decode byte 0xd3 in position xx ...报错语句:df = pd.read_csv("datascience.csv", encoding='gb18030')问题分析根据报错内容可知大致就是文件编码问题,所采用的编码没办法解码目标文件。解决方法网上大致有以下几种方法:法一:修改编码方式为更广范围编码,如‘gb18

2022-03-17 20:14:33 1460 1

原创 LSI(潜在语义索引)主题建模简介

一、潜在语义索引(Latent Semantic Indexing,以下简称LSI)(一)简介有的文章也叫Latent Semantic Analysis(LSA)。在这里我称做LSI,它是一种简单实用的主题模型,也是最早出现的主题模型了,它的算法原理很简单,是基于奇异值分解(SVD)的方法来得到文本的主题的。一次奇异值分解就可以得到主题模型,同时解决词义的问题,非常漂亮。但是LSI有很多不足,导致它在当前实际的主题模型中已基本不再使用。(二)应用得出文本的主题模型;通过LSI得到的文本主题矩阵

2022-02-22 17:03:55 1466

原创 win10 annconda 报错:ModuleNotFoundError: No module named ‘conda‘

具体错误Traceback (most recent call last): File "D:\Anaconda\Scripts\conda-script.py", line 16, in <module> from conda.cli import mainModuleNotFoundError: No module named 'conda'背景环境win10+anaconda3最近在进行深度学习的入门学习需要在linux下运行某python库,因此进行了linux子

2021-12-22 22:29:38 3282

原创 win10中ubuntu子系统从系统盘迁移到其他盘

Win10 安装的Linux子系统默认安装在C盘,但是我害怕日后系统盘爆掉,就折腾了一下,把它迁移到d盘(当然也可以选择其他盘)。环境背景win10(版本号20H2)+linux子系统ubuntu具体操作1.建好目标文件夹,也就是希望迁移到的地方。我是在d盘新建了名为ubuntu的文件夹;2.修改该文件夹的权限:打开cmd,执行以下命令:icacls D:\ubuntu /grant "zj:(OI)(CI)(F)"注:其中D:\ubuntu是我的目标迁移路径,zj是我的用户名,不知道用户名

2021-12-19 17:26:09 6211 3

原创 ubuntu中进行复制粘贴

ubuntu中无法进行复制粘贴今天刚刚接触linux,在win10中装了linux子系统,也就是ubuntu,我在win中复制了文件路径可是发现无法粘贴至ubuntu的命令窗口,一个一个敲真的很麻烦。解决法1.有看到说输入两行命令安装什么东西就好的,但是对我来说没用。具体参考:https://www.cnblogs.com/laochun/p/13288234.html法2.具体参考:点击跳转注意:这里是ctrl+ shift,而不是单ctrl,我一开始没看清操作了好几次ctrl+C都没用,后面才

2021-12-19 16:03:16 4903

原创 《数亦有道》C7机器学习脑图&机器学习如何选择算法

机器学习的算法选择路径图:举例:如要对2000多条评论数据进行情感分析,去掉三星评价,把高于三星作为正面情感,低于三星作为负面,正负标记分别为1,0。由图可知,有已标记数据->样本数小于100000->是文本数据->选择朴素贝叶斯模型。...

2021-12-16 14:15:54 889

原创 jupyter notebook使用pyLDAvis报错ModuleNotFoundError: No module named ‘pyLDAvis‘

问题发生背景python入门;在尝试使用 pyLDAvis做简单的主题提取;问题及相关代码pyLDAvis是已经安装好了,如图(已注释):但是在输入以下语句时发生了报错:报错代码段:import pyLDAvisimport pyLDAvis.sklearnpyLDAvis.enable_notebook()pyLDAvis.sklearn.prepare(lda,tf,tf_vectorizer)具体报错截图:解决方法有博主提出应该是没有安装成功,以管理员身份安装,我操作了

2021-12-15 21:24:49 7284

原创 《数亦有道》C6自然语言处理学习 脑图

2021-12-14 21:26:06 317

原创 jupyter notebook报错No module named ‘sklearn.cross_validation‘

具体错误原因及解决原因:sklearn.cross_validation已被抛弃,现在 cross_val_score已经归sklearn.model_selection了。因此只要把导入语句改成:from sklearn.model_selection import cross_val_score

2021-12-14 16:36:22 1984

原创 anaconda创建env报错 ResolvePackageNotFound

具体错误如图:按照其他博主(方法详情)提供的方法操作了还是有部分报错:解决策略这个错误应该就是一些包没能安装好,我是直接开始编码、运行,等缺包报错的时候再手动去安装一下。如有更好的解决方法还请多多指教。...

2021-12-13 21:23:05 4783 4

原创 关于保研(管工)

其实关于保研,我并不想过多提及,毕竟自己保得并不好,也因此心里一直比较失落。但还是决定写写,总归是段经历,归省自己,也能给他人作个小参考。基本情况本科双一流,非211/985(保研到了本校);保研专业:管理科学与工程 ; 保研边缘人反思和小建议(仅供参考)因为是保研边缘人,所以我其实一直在备战考研,可是暑假感觉自己复习状态不好,临九推的时候感觉自己保研可能有戏就交了材料,没想到获得了保研资格。于是着急忙慌地准备各种材料,海投各个有九推的高校。其实真心不建议像我这样立场不坚定,如果觉得自己保研有戏,

2021-12-13 10:41:31 240

原创 python自然语言处理之spacy详解

spaCy简介spaCy号称工业级Python自然语言处理(NLP)软件包,可以对自然语言文本做词性分析、命名实体识别、依赖关系刻画,以及词嵌入向量的计算和可视化等。spaCy模块有4个非常重要的类:Doc:Doc对象由Tokenizer构造,然后由管道的组件进行适当的修改。doc对象包含Token的序列和Token的注释(Annotation);Span:Span对象是Doc对象的一个切片;Token:在自然语言处理中,把一个单词、一个标点符号、一个空格等叫做一个token;Vocab(voc

2021-12-12 19:35:09 9591 1

原创 python os模块使用及功能

下面这个网站总结挺全的:https://www.runoob.com/python/os-file-methods.html

2021-12-05 21:11:34 543

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除