词一丶-CSDN博客

原创 python_谷歌开源BERT模型文本分类出现的相关报错记录

主要为了记录python使用Pycharm进行BERT文本分类任务前期一些相关的报错记录及个人成功解决方案

2023-01-19 15:44:30 2312 4

原创 ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 96 from C head

换了一个镜像节点 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gensim。选择合适的版本，cp**指python的版本，python3.9就下载cp39的版本。win+R -> cmd -> pip install +下载包所在的位置。猜测是当前numpy版本较低，网上一般建议升级numpy版本。由于pip直接安装gensim库过慢、容易报错。或是推荐卸载当前numpy重新下载。gensim库的没有正确安装。我的python是3.8。

2023-01-19 15:39:54 7933 3

原创 pip下载第三方库的默认安装路径

Win+R -> cmd -> pip show numpy -> pip show 第三方库

2022-12-18 15:22:17 548

原创 Seaborn库的基本绘图操作

python中seaborn库是基于Matplotlib库的第三方绘图库，用于可视化技术展示数据，现摘录一些基本的绘图函数，具体参数看官方文档

2022-09-25 01:07:30 12079 1

原创 hadoop、ZooKeeper、hbase集群安装史上最全流程（亲测有效）

配置hadoop集群、ZooKeeper集群、hbase数据库，master、s1、s2、

2022-05-09 18:45:35 2985

原创 ssh: Could not resolve hostname guard.: Name or service not known

记录一下安装hbase，正确配置hbase的配置文件后，在hbase/bin目录下命令**./start-hbase.sh**启动hbase服务出现报错ssh: Could not resolve hostname slave1: Name or service not known lost connet百度后看了很多解决办法，无非就是防火墙、主机名+ip在某个文件有错误仔细排查后，发现是从教室copy回来的虚拟机+hadoop，一直默认以为master的主机名是master命令vim /etc/

2022-05-02 22:52:14 19030 4

原创忘记hadoop安装路径，忘记hadoop根目录怎么进入根目录启动hadoop

有时候很久没用VMware虚拟机了，Linux操作系统如果不是刻意去用，基本上没什么机会去使用更别提计算机小白了，Windows系统都没弄懂，又出来一个Linux系统某天我打开目录，忘记自己安装的hadoop目录在那个文件夹下，又没有去弄脚本来控制集群启动关闭...

2022-05-02 16:01:03 8121

原创 OSError: Failed to open file b‘C:\\Users\\xe8\x94\xa1\xe8\x99\x9a\...\AppData\Local\Temp\scipy-xxxx

关于我在做简单的线性回归分析（案例——广告投放费用预测销售额）时发生**“OSError: Failed to open file b’C:\Users\xe8\x94\xa1\xe8\x99\x9a…\AppData\Local\Temp\scipy-xxxx”**报错原因：路径中包含中文 ——很有可能是用户名中文导致的解决：修改计算机环境变量中的Temp文件夹路径——可直接新建一个Temp文件夹在其他盘右键点击计算机 -> 属性 -> 高级系统设置 -> 环境变量把里面的T

2022-04-27 11:38:38 18991 2

原创 Python在Jupyter上使用HMM进行中文分词，将新闻文本分词后提取其中的高频词

通过使用python实现基于HMM的中文分词工具jieba的分词模式来进行提取新闻文本中的高频词

2022-04-26 16:01:07 3991 4

原创 python通过pycharm连接sqlite数据库步骤

#1、导入Python sqlite数据库模块# import sqlite3#2、建立数据库连接，返回Connec对象# con=sqlite3.connect("db/test.db")#数据库路径：可以是绝对路径，也可以是相对路径# db/test.db# C:/Users/PycharmProjects/pythonProject/db/test.db#3、创建游标对象# cur = con.cursor()#连接到数据库后，需要打开游标cursor，通过cursor执行sql

2022-04-10 22:22:55 6597

原创【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——门牌制作

题目# 小蓝要为一条街的住户制作门牌号。## 这条街一共有 2020 位住户，门牌号从 1 到 2020 编号。## 小蓝制作门牌的方法是先制作 0 到 9 这几个数字字符，最后根据需要将字符粘贴到门牌上，例如门牌 1017 需要依次粘贴字符 1、0、1、7，即需要 1 个字符 0，2 个字符 1，1 个字符 7。## 请问要制作所有的 1 到 2020 号门牌，总共需要多少个字符 2？解析最简单的循环遍历+字符串count()方法来寻找字符出现次数代码b = 0 #出现次数预定义

2022-04-10 22:19:08 733

原创【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——跑步锻炼

题目# 小蓝每天都锻炼身体。# 正常情况下，小蓝每天跑1千米。如果某天是周一或者月初（1日），为了激励自己，小蓝要跑2千米。如果同时是周一或月初，小蓝也是跑2千米。# 小蓝跑步已经坚持了很长时间，从2000年1月1日周六（含）到2020年10月1日周四（含）。请问这段时间小蓝总共跑步多少千米？解析大佬（小蓝刷题） ——2020年第十一届蓝桥杯省赛Python组（真题+解析+代码）：跑步锻炼知识点1、 calendar.weekday(year,month,day)返回给定日期的日期码。0（

2022-04-10 22:13:41 845

原创【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——成绩统计

题目# 题目描述# 小蓝给学生们组织了一场考试，卷面总分为 100 分，每个学生的得分都是一个 0 到 100 的整数。## 如果得分至少是 60 分，则称为及格。如果得分至少为 85 分，则称为优秀。## 请计算及格率和优秀率，用百分数表示，百分号前的部分四舍五入保留整数。## 输入描述# 输入的第一行包含一个整数n，表示考试人数。## 接下来 n 行，每行包含一个 0 至 100 的整数，表示一个学生的得分。## 输出描述# 输出两行，每行一个百分数，分别表示及格率和优秀率

2022-04-09 18:44:43 211

原创【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——单词分析

题目# 输入描述# 输入一行包含一个单词，单词只由小写英文字母组成。## 对于所有的评测用例，输入的单词长度不超过 1000。## 输出描述# 输出两行，第一行包含一个英文字母，表示单词中出现得最多的字母是哪个。如果有多个字母出现的次数相等，输出字典序最小的那个。## 第二行包含一个整数，表示出现得最多的那个字母在单词中出现的次数。## 输入输出样例# 示例 1# 输入# lanqiao# 输出# a# 2# 示例 2# 输入# longlonglongistool

2022-04-09 18:38:02 317

原创【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——2020

题目小蓝有一个数字矩阵，里面只包含数字 0 和 2。小蓝很喜欢 2020，他想找到这个数字矩阵中有多少个 2020 。小蓝只关注三种构成 2020 的方式：• 同一行里面连续四个字符从左到右构成 2020。• 同一列里面连续四个字符从上到下构成 2020。• 在一条从左上到右下的斜线上连续四个字符，从左上到右下构成 2020。例如，对于下面的矩阵：2 2 0 0 0 00 0 0 0 0 00 0 2 2 0 20 0 0 0 0 00 0 0 0 2 20 0 2 0 2 0一共

2022-04-09 18:23:22 219

原创 HDFS基础命令

通过vi在Linux本地创建三个文本文件：txt1.txt、txt2.txt、txt3.txt。文件里面随意输入些内容。命令如下：vi txt1.txtvi txt2.txtvi txt3.txt(1)列出子目录或子文件列出 HDFS 当前用户家目录下的文件及文件夹(前提：家目录已经存在，否则报错) , 命令为：hdfs dfs –ls如果报错，请看解决办法https://blog.csdn.net/weixin_45970532/article/details/123676781?

2022-03-23 10:10:10 6055

原创 ls: Call From master.hadoop.com/192.168.137.140 to master.hadoop.com:8020 failed on connection excep

记录一下自己煞笔的高光时刻原错误为ls: Call From master.hadoop.com/192.168.137.140 to master.hadoop.com:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused实际需要的结果截图如下

2022-03-23 08:55:59 4100 2

原创 python 如何将多个一维numpy数组合并成二维numpy数组

如两个np.array数组a = np.array([1,2,3,4,5])b = np.array([6,7,8,9,10])得到一个二维数组[[1,6],[2,7],[3,8],[4,9],[5, 10]]解答可以使用zipnp.array(list(zip(a,b)))array([[ 1, 6], [ 2, 7], [ 3, 8], [ 4, 9], [ 5, 10]])另当题目需要输入多个一维数组，输出一个二维数组时s1 =

2022-03-18 21:28:27 15570 1

原创深度学习从入门到精通（Deep Learning）python 期中考试答案复盘

一、选择题1、梯度下降算法的正确步骤是（） DA计算预测值和真实值之间误差B迭代更新，直到找到最佳权重C把输入传入网络，得到输出值D初始化随机权重和偏置E对每一个产生误差的神经元，改变相应的权重值以较小误差A、 abcde B、edcba C、cbaed D、dcaeb2、下面哪个激活函数可以实现max（0，x）的功能（） BA、 Sigmoid B、ReLU C、softmax D、Tanh3、下面说法不正确的是（） CA、神经元它本质是一条直线，或者

2021-11-11 18:05:26 2521 1

原创 python使用正则表达式暴力爬取豆瓣电影top250并将爬取内容保存为本地CSV文件——从浏览器获取headers头信息

记录一下学习爬虫的代码案例代码出处https://www.bilibili.com/video/BV1i54y1h75W?p=24#拿到页面源代码 requests#通过re来提取想要的有效信息 reimport requestsimport reimport csvurl = "https://movie.douban.com/top250"headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64.

2021-09-10 21:21:49 2138

原创 python“人工智障AI女友”——tcp实现局域网中进行主机间的发送、接受消息，Socket的客户端和服务器

首先，这个是我的python编程课程上的习题用于python初学者的学习以及自己复习用途大佬请轻点吐槽（拜谢）代码运行截图如下代码我已经放上来了，有需要者自取，互相学习客户端的代码import sockethost='127.0.0.1' #服务端IPport=8888 #服务端端口address=(host,port) #服务端IP包try: #创建socket soc_client=socket.socket(socket.AF_INET,socke

2021-07-21 01:42:57 582 1

原创 AttributeError: partially initialized module ‘pandas‘ has no attribute ‘Series‘ (most likely due to

记录一下自己的傻逼时刻AttributeError: partially initialized module ‘pandas’ has no attribute ‘Series’ (most likely due to a circular import)1、我已经是确定导入了pandas库了2、错误翻译过来的结果就是AttributeError:部分初始化的模块’pandas’没有属性’Series’(很可能是由于循环导入)于是我看了一下我的库，看到了什么这不扯犊子嘛...

2021-06-18 21:59:52 13791 33

weixin_45970532的博客