今天加油鸭�-CSDN博客

原创 pyltp安装

pyltp安装，非常详细的过程哦~

2022-08-21 16:52:30 1200

原创矩阵与矩阵相乘python代码实现

矩阵与矩阵相乘python代码实现

2022-08-12 11:58:37 1836

# 先导入库import pandas as pdimport osfrom sklearn.utils import shuffledata = pd.read_csv('你的csv文件路径',sep=',')data = shuffle(data) # 打乱data.to_csv('存入新的csv文件路径', index=False, header=True) #index索引不出现，header表头出现...

2022-04-26 16:10:17 3062

原创 16.如何在csv文件中跳过第一行的python代码

我来了我来了，我带着问题回来了~宝们有没有在日常敲代码中发现索引值和数据对不上的问题，产生这个问题的原因是你加了header，它在计算机数据识别中占了一行位置，那么我们应该如何给它变回来呢？我之前尝试过header=None,index=0，还有巴拉巴拉一大堆都不好使，这里我给大家看一行代码，你只需要在我框框的指定位置添加，名字什么自己对应上就可以完美解决~就是这里next(reader)，别看它不起眼，但是真的很好用，前后你们那个名称自己对应一下，一定要改成自己的，OK啦就这样~..

2021-06-10 18:16:07 963 3

转载 15.关于sklearn.datasets.base导包报错问题的解决

链接：https://blog.csdn.net/weixin_42675552/article/details/115308533

2021-05-29 19:38:48 385

原创 13.如何一秒钟合并/剔重/筛选数据/统计分组的神器，真的很溜~

今天菜鸟本人在做数据分析的时候想把之前保存的txt文件中的某一列拿出来进行分词处理，但是报错提示无法进行小写转化，因为我的数据是这样的，看图：而我想只用其中一列，再就是txt导入数据的时候也报错，说我一行有好多逗号，无法拆分。。。今天我发现了一个神器，可以自动切割数据，剔重，那我还敲个der的去重代码呀，有这个一秒搞定，快来看看~Data.olllo数据助手下载：http://olllo.top使用步骤：1.百度云或者网页下载都可以，下载好了是压缩包的形式2.

2021-05-24 11:13:35 1673 2

转载 12.jupyter notebook中导入其他ipynb文件如何轻松搞定？

今天上午成功的完成了数据的初步处理，下面要进行下一块任务了，我应该如何将文件1的内容复制到文件2中呢？你肯定想问直接往下写不就好了吗？但是每次打开notebook要运行几百次代码真的很心累，这就不得不让我寻求一种简单调用文件内容的好方法了~我想解决的问题：将文件1的内容完全复制到文件2中，注意：不是copy而是利用几行代码就可以调过去，不占地方而且方便我后续工作解决方法：两行代码搞定：%%capture%run "./1.数据读取.ipynb"讲解如下：1.照着复制就好

2021-05-21 14:59:36 3174 1

转载 11.ValueError: could not convert string to float解决方法

今天敲代码的时候遇到一个问题，ValueError: could not convert string to float尝试了好多方法最后完美解决，快来看看~一开始我写的代码是这个：txt = np.loadtxt("pitsB_drop.txt")后来就发生了报错，图片我忘记截图了，后来运行成功后没有了报错内容，害。。。修改后的是这样：data.to_csv("pitsB_drop.txt",sep = ',',header = None)解析：我的数据是经过处理后得到的，前面没.

2021-05-21 08:38:15 5975

原创 10.pandas DataFrame 中去重后如何重新定义连续的index

今天在做数据清洗的时候遇到一个小问题，就是pandas DataFrame 中去重后index不连续，那么我们应该如何写代码让他变得连续呢？一起跟我学一下~如图：如我注释所写，去重后实际有931条，但是索引值最后还是963，那么对于这种数据量比较大的，我们不能手动一个个改，那么应该怎么操作呢？一行就搞定：pd_pitsA_Subnew = pd_pitsA_Sub_.reset_index(drop=True)pd_pitsA_Subnew这是我的两行代码，主要就是第一行。第二

2021-05-18 09:31:54 1090

转载 8.关于删除操作中axis=0和axis=1的理解（Python版）

其实这个问题作为用了python语言一年多的小菜鸡，有时候还会比较懵，搞着搞着就分不清了，今天专门查了一下大佬们的文章做个记录，都跟我一起学呀~先上图：讲解：1.简单的来记就是axis=0代表往跨行（down)，而axis=1代表跨列（across)2.换句话说:使用0值表示沿着每一列或行标签\索引值向下执行方法使用1值表示沿着每一行或者列标签模向执行对应的方法3.另外记住，Pandas保持了Numpy对关键字axis的用法，用法在Numpy库的词汇表当中有过解释：轴用来为

2021-05-04 11:58:30 2538

原创【求助帖】scapy目前最新版本3.0.6和en_core_web_sm（英文模型2.2.5版本）无法兼容，应该如何解决？

跪求各路大佬帮帮小菜鸟，昨天查了好几个小时还没有解决，也尝试了几乎所有方法。我的问题如下：scapy版本3.0.6en_core_web_sm版本2.2.5在下载英文模型是要和scapy的版本对应上的，不然会不兼容。我尝过的方法：1.卸载scapy重新安装2.2.5版本显示报错2.官网下载en_core_web_sm版本发现2.2.5已经是最近3.根据报错提示改了meta.json里面的版本，默认>=2.2.2我现在写了区间>=3.0.6，<3.1.0但是.

2021-05-03 09:35:42 437

转载 7.pip install -U spacy显示超时应该如何解决？（换源大法好，嗖嗖滴，快到飞起~）

我今天要下载spacy工具包出现了问题，抓耳挠腮鸡头白咧~问题如下：pip install -U spacy在Prompt以管理员身份执行发现问题，1.速度和乌龟一样 2.下载超时直接满屏报错解决问题如下（上干货）：1、win+R调出快速打开窗口，输入只有我们知道的暗号%APPDATA%2、在弹出的C:xxx\AppData\Roaming文件夹下创建一个名为pip的文件夹3、在pip文件夹下创建文本文件，命名为pip，修改后缀为.in4、将如下内容添加到pip.

2021-05-02 18:03:42 466 2

原创 6.ModuleNotFoundError: No module named ‘pip‘ 并且 No module named ‘ensurepip‘

我今天在Anaconda中执行命令pip install -U spacy安装工具包时候提示我pip需要更新，我一顿操作猛如虎直接pip干崩溃了。再操作就说No module named ‘pip‘哭唧唧~解决方案：python -m ensurepipsudo easy_install pip这样做大多数都可以解决，但是我是特例，第一行执行完了不好使，报错No module named ‘ensurepip‘，查了好多大佬文章依旧没解决，最后我发现这么做是可以的，如下：eas.

2021-05-02 17:01:08 3053 2

原创 5.re.match()和re.search()的使用和区别（Python版）

昨天是我第一天学正则表达式，遇到了一点问题没解决，今天回过头来想不断试代码，其实很简单，跟我一起学~基础知识：图片讲解：1.一般会写是以什么模式去进行match和search的搜索2.match：从头开始匹配，匹配一个对象，如果开头是pattern的模式，找到了就返回，没有找到就None，不再继续进行下去 search：从头开始匹配，匹配一个对象，如果开头没有符合的往后匹配，直到找到一个为止，匹配到最后没有找到就None3.group得到匹配结果注意：1.match搜..

2021-05-01 17:39:49 475

原创 4.正则表达式中关于\b的理解（Python版）

今天在做数据清洗的时候看到\b有点晕乎乎的，参考了一下大佬们的文章虽然讲的很好但是字太多了，今天我来说一个简化版本，保证你们神清气爽~基础知识：\w:单词字符A-Z a-z 0-9\W:^\w\b:匹配\w和\W之间的\B:^\b好了，我知道你们已经晕了嘿嘿嘿，开始说人话~例子讲解：我们要将类似于Co的字母去掉（这里就是一些乱码，没有实际含义，让数据变的干净一些方便后面分析）咱们主要讲解这里：\b\w{1,2}\b拆解：\b代表边界，单词边界指的就是单

2021-05-01 16:15:17 2869 1

原创 3.stopwords里面的‘english’格式没有，报错了怎么办？

继续针对于第二篇进行更新，刚才我继续写代码又发现有点小问题，我再记录一下嘿嘿嘿~报错信息如下：如何解决，超级简单的呀：import nltknltk.download()运行一下在Corpora里面下拉找到stopwords发现是红色，状态是过时了；绿色代表安装成功了操作：左下角Download-->Refresh一下就好了如图所示：耶耶耶，它成功了，兄弟们继续干呀~...

2021-05-01 15:16:38 518

原创 2.nltk下载语料库（一直提示连接失败/内核nltk直接挂了）

我捣鼓了一小时，参考了CSDN上面大佬们的经验才整出来，真的很好用，感谢大佬们~报错信息是这样：先是挣扎了一下在下载，后来直接挂掉，我问老师老师说挂VPN，结果还是GG，找了很多大佬的帖子才解决这个问题。开整：链接：https://pan.baidu.com/s/10OKV_h-ecNNTRMrdUgdKnw提取码：jzln复制这段内容后打开百度网盘手机App，操作更方便哦--来自百度网盘超级会员V4的分享这个是语料包的数据，你们要先云盘下载下来，跟着我做~...

2021-05-01 12:13:13 691

转载 1.python使用nltk库中的download()下载无法使用

简单记录下这个问题，记性不好方便我再有问题回头找嘿嘿嘿~方法取自于一个博主，我只是搬运工。出现问题页面如下：如何解决：原来的：https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml改的：http://www.nltk.org/nltk_data/点击右面Refresh即可~...

2021-05-01 11:34:47 279

weixin_44037569的博客