自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 pyltp安装

pyltp安装,非常详细的过程哦~

2022-08-21 16:52:30 996 1

原创 矩阵与矩阵相乘python代码实现

矩阵与矩阵相乘python代码实现

2022-08-12 11:58:37 1586

原创 如何在csv文件中按行打乱数据?

# 先导入库import pandas as pdimport osfrom sklearn.utils import shuffledata = pd.read_csv('你的csv文件路径',sep=',')data = shuffle(data) # 打乱data.to_csv('存入新的csv文件路径', index=False, header=True) #index索引不出现,header表头出现...

2022-04-26 16:10:17 2671

原创 16.如何在csv文件中跳过第一行的python代码

我来了我来了,我带着问题回来了~宝们有没有在日常敲代码中发现索引值和数据对不上的问题,产生这个问题的原因是你加了header,它在计算机数据识别中占了一行位置,那么我们应该如何给它变回来呢?我之前尝试过header=None,index=0,还有巴拉巴拉一大堆都不好使,这里我给大家看一行代码,你只需要在我框框的指定位置添加,名字什么自己对应上就可以完美解决~就是这里next(reader),别看它不起眼,但是真的很好用,前后你们那个名称自己对应一下,一定要改成自己的,OK啦就这样~..

2021-06-10 18:16:07 833 3

转载 15.关于sklearn.datasets.base导包报错问题的解决

链接:https://blog.csdn.net/weixin_42675552/article/details/115308533

2021-05-29 19:38:48 306

原创 13.如何一秒钟合并/剔重/筛选数据/统计分组的神器,真的很溜~

今天菜鸟本人在做数据分析的时候想把之前保存的txt文件中的某一列拿出来进行分词处理,但是报错提示无法进行小写转化,因为我的数据是这样的,看图:而我想只用其中一列,再就是txt导入数据的时候也报错,说我一行有好多逗号,无法拆分。。。今天我发现了一个神器,可以自动切割数据,剔重,那我还敲个der的去重代码呀,有这个一秒搞定,快来看看~Data.olllo数据助手下载:http://olllo.top使用步骤:1.百度云或者网页下载都可以,下载好了是压缩包的形式2.

2021-05-24 11:13:35 1493 2

转载 12.jupyter notebook中导入其他ipynb文件如何轻松搞定?

今天上午成功的完成了数据的初步处理,下面要进行下一块任务了,我应该如何将文件1的内容复制到文件2中呢?你肯定想问直接往下写不就好了吗?但是每次打开notebook要运行几百次代码真的很心累,这就不得不让我寻求一种简单调用文件内容的好方法了~我想解决的问题:将文件1的内容完全复制到文件2中,注意:不是copy而是利用几行代码就可以调过去,不占地方而且方便我后续工作解决方法:两行代码搞定:%%capture%run "./1.数据读取.ipynb"讲解如下:1.照着复制就好

2021-05-21 14:59:36 2812 1

转载 11.ValueError: could not convert string to float解决方法

今天敲代码的时候遇到一个问题,ValueError: could not convert string to float尝试了好多方法最后完美解决,快来看看~一开始我写的代码是这个:txt = np.loadtxt("pitsB_drop.txt")后来就发生了报错,图片我忘记截图了,后来运行成功后没有了报错内容,害。。。修改后的是这样:data.to_csv("pitsB_drop.txt",sep = ',',header = None)解析:我的数据是经过处理后得到的,前面没.

2021-05-21 08:38:15 5738

原创 10.pandas DataFrame 中去重后如何重新定义连续的index

今天在做数据清洗的时候遇到一个小问题,就是pandas DataFrame 中去重后index不连续,那么我们应该如何写代码让他变得连续呢?一起跟我学一下~如图:如我注释所写,去重后实际有931条,但是索引值最后还是963,那么对于这种数据量比较大的,我们不能手动一个个改,那么应该怎么操作呢?一行就搞定:pd_pitsA_Subnew = pd_pitsA_Sub_.reset_index(drop=True)pd_pitsA_Subnew这是我的两行代码,主要就是第一行。第二

2021-05-18 09:31:54 926

转载 8.关于删除操作中axis=0和axis=1的理解(Python版)

其实这个问题作为用了python语言一年多的小菜鸡,有时候还会比较懵,搞着搞着就分不清了,今天专门查了一下大佬们的文章做个记录,都跟我一起学呀~先上图:讲解:1.简单的来记就是axis=0代表往跨行(down),而axis=1代表跨列(across)2.换句话说:使用0值表示沿着每一列或行标签\索引值向下执行方法 使用1值表示沿着每一行或者列标签模向执行对应的方法3.另外记住,Pandas保持了Numpy对关键字axis的用法,用法在Numpy库的词汇表当中有过解释:轴用来为

2021-05-04 11:58:30 2212

原创 【求助帖】scapy目前最新版本3.0.6和en_core_web_sm(英文模型2.2.5版本)无法兼容,应该如何解决?

跪求各路大佬帮帮小菜鸟,昨天查了好几个小时还没有解决,也尝试了几乎所有方法。我的问题如下:scapy版本3.0.6en_core_web_sm版本2.2.5在下载英文模型是要和scapy的版本对应上的,不然会不兼容。我尝过的方法:1.卸载scapy重新安装2.2.5版本显示报错2.官网下载en_core_web_sm版本发现2.2.5已经是最近3.根据报错提示改了meta.json里面的版本,默认>=2.2.2我现在写了区间>=3.0.6,<3.1.0但是.

2021-05-03 09:35:42 323

转载 7.pip install -U spacy显示超时应该如何解决?(换源大法好,嗖嗖滴,快到飞起~)

我今天要下载spacy工具包出现了问题,抓耳挠腮鸡头白咧~问题如下:pip install -U spacy在Prompt以管理员身份执行发现问题,1.速度和乌龟一样 2.下载超时直接满屏报错解决问题如下(上干货):1、win+R调出快速打开窗口,输入只有我们知道的暗号%APPDATA%2、在弹出的C:xxx\AppData\Roaming文件夹下创建一个名为pip的文件夹3、在pip文件夹下创建文本文件,命名为pip,修改后缀为.in4、将如下内容添加到pip.

2021-05-02 18:03:42 283 2

原创 6.ModuleNotFoundError: No module named ‘pip‘ 并且 No module named ‘ensurepip‘

我今天在Anaconda中执行命令pip install -U spacy安装工具包时候提示我pip需要更新,我一顿操作猛如虎直接pip干崩溃了。再操作就说No module named ‘pip‘哭唧唧~解决方案:python -m ensurepipsudo easy_install pip这样做大多数都可以解决,但是我是特例,第一行执行完了不好使,报错No module named ‘ensurepip‘,查了好多大佬文章依旧没解决,最后我发现这么做是可以的,如下:eas.

2021-05-02 17:01:08 2832 2

原创 5.re.match()和re.search()的使用和区别(Python版)

昨天是我第一天学正则表达式,遇到了一点问题没解决,今天回过头来想不断试代码,其实很简单,跟我一起学~基础知识:图片讲解:1.一般会写是以什么模式去进行match和search的搜索2.match:从头开始匹配,匹配一个对象,如果开头是pattern的模式,找到了就返回,没有找到就None,不再继续进行下去 search:从头开始匹配,匹配一个对象,如果开头没有符合的往后匹配,直到找到一个为止,匹配到最后没有找到就None3.group得到匹配结果注意:1.match搜..

2021-05-01 17:39:49 323

原创 4.正则表达式中关于\b的理解(Python版)

今天在做数据清洗的时候看到\b有点晕乎乎的,参考了一下大佬们的文章虽然讲的很好但是字太多了,今天我来说一个简化版本,保证你们神清气爽~基础知识:\w:单词字符A-Z a-z 0-9\W:^\w\b:匹配\w和\W之间的\B:^\b好了,我知道你们已经晕了嘿嘿嘿,开始说人话~例子讲解:我们要将类似于Co的字母去掉(这里就是一些乱码,没有实际含义,让数据变的干净一些方便后面分析)咱们主要讲解这里:\b\w{1,2}\b拆解:\b代表边界,单词边界指的就是单

2021-05-01 16:15:17 2711 1

原创 3.stopwords里面的‘english’格式没有,报错了怎么办?

继续针对于第二篇进行更新,刚才我继续写代码又发现有点小问题,我再记录一下嘿嘿嘿~报错信息如下:如何解决,超级简单的呀:import nltknltk.download()运行一下在Corpora里面下拉找到stopwords发现是红色,状态是过时了;绿色代表安装成功了操作:左下角Download-->Refresh一下就好了如图所示:耶耶耶,它成功了,兄弟们继续干呀~...

2021-05-01 15:16:38 413

原创 2.nltk下载语料库(一直提示连接失败/内核nltk直接挂了)

我捣鼓了一小时,参考了CSDN上面大佬们的经验才整出来,真的很好用,感谢大佬们~报错信息是这样:先是挣扎了一下在下载,后来直接挂掉,我问老师老师说挂VPN,结果还是GG,找了很多大佬的帖子才解决这个问题。开整:链接:https://pan.baidu.com/s/10OKV_h-ecNNTRMrdUgdKnw提取码:jzln复制这段内容后打开百度网盘手机App,操作更方便哦--来自百度网盘超级会员V4的分享这个是语料包的数据,你们要先云盘下载下来,跟着我做~...

2021-05-01 12:13:13 514

转载 1.python使用nltk库中的download()下载无法使用

简单记录下这个问题,记性不好方便我再有问题回头找嘿嘿嘿~方法取自于一个博主,我只是搬运工。出现问题页面如下:如何解决:原来的:https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml改的:http://www.nltk.org/nltk_data/点击右面Refresh即可~...

2021-05-01 11:34:47 226

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除