自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (1)
  • 收藏
  • 关注

原创 python_谷歌开源BERT模型文本分类出现的相关报错记录

主要为了记录python使用Pycharm进行BERT文本分类任务前期一些相关的报错记录及个人成功解决方案

2023-01-19 15:44:30 2046 4

原创 ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 96 from C head

换了一个镜像节点 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gensim。选择合适的版本,cp**指python的版本,python3.9就下载cp39的版本。win+R -> cmd -> pip install +下载包所在的位置。猜测是当前numpy版本较低,网上一般建议升级numpy版本。由于pip直接安装gensim库过慢、容易报错。或是推荐卸载当前numpy重新下载。gensim库的没有正确安装。我的python是3.8。

2023-01-19 15:39:54 7514 3

原创 pip下载第三方库的默认安装路径

Win+R -> cmd -> pip show numpy -> pip show 第三方库

2022-12-18 15:22:17 442

原创 Seaborn库的基本绘图操作

python中seaborn库是基于Matplotlib库的第三方绘图库,用于可视化技术展示数据,现摘录一些基本的绘图函数,具体参数看官方文档

2022-09-25 01:07:30 11522 1

原创 hadoop、ZooKeeper、hbase集群安装史上最全流程(亲测有效)

配置hadoop集群、ZooKeeper集群、hbase数据库,master、s1、s2、

2022-05-09 18:45:35 2698

原创 ssh: Could not resolve hostname guard.: Name or service not known

记录一下安装hbase,正确配置hbase的配置文件后,在hbase/bin目录下命令**./start-hbase.sh**启动hbase服务出现报错ssh: Could not resolve hostname slave1: Name or service not known lost connet百度后看了很多解决办法,无非就是防火墙、主机名+ip在某个文件有错误仔细排查后,发现是从教室copy回来的虚拟机+hadoop,一直默认以为master的主机名是master命令vim /etc/

2022-05-02 22:52:14 18556 4

原创 忘记hadoop安装路径,忘记hadoop根目录怎么进入根目录启动hadoop

有时候很久没用VMware虚拟机了,Linux操作系统如果不是刻意去用,基本上没什么机会去使用更别提计算机小白了,Windows系统都没弄懂,又出来一个Linux系统某天我打开目录,忘记自己安装的hadoop目录在那个文件夹下,又没有去弄脚本来控制集群启动关闭...

2022-05-02 16:01:03 7421

原创 OSError: Failed to open file b‘C:\\Users\\xe8\x94\xa1\xe8\x99\x9a\...\AppData\Local\Temp\scipy-xxxx

关于我在做简单的线性回归分析(案例——广告投放费用预测销售额)时发生**“OSError: Failed to open file b’C:\Users\xe8\x94\xa1\xe8\x99\x9a…\AppData\Local\Temp\scipy-xxxx”**报错原因:路径中包含中文 ——很有可能是用户名中文导致的解决:修改计算机环境变量中的Temp文件夹路径——可直接新建一个Temp文件夹在其他盘右键点击计算机 -> 属性 -> 高级系统设置 -> 环境变量把里面的T

2022-04-27 11:38:38 3127 2

原创 Python在Jupyter上使用HMM进行中文分词,将新闻文本分词后提取其中的高频词

通过使用python实现基于HMM的中文分词工具jieba的分词模式来进行提取新闻文本中的高频词

2022-04-26 16:01:07 3568 4

原创 python通过pycharm连接sqlite数据库步骤

#1、导入Python sqlite数据库模块# import sqlite3#2、建立数据库连接,返回Connec对象# con=sqlite3.connect("db/test.db")#数据库路径:可以是绝对路径,也可以是相对路径# db/test.db# C:/Users/PycharmProjects/pythonProject/db/test.db#3、创建游标对象# cur = con.cursor()#连接到数据库后,需要打开游标cursor,通过cursor执行sql

2022-04-10 22:22:55 6210

原创 【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——门牌制作

题目# 小蓝要为一条街的住户制作门牌号。## 这条街一共有 2020 位住户,门牌号从 1 到 2020 编号。## 小蓝制作门牌的方法是先制作 0 到 9 这几个数字字符,最后根据需要将字符粘贴到门牌上,例如门牌 1017 需要依次粘贴字符 1、0、1、7,即需要 1 个字符 0,2 个字符 1,1 个字符 7。## 请问要制作所有的 1 到 2020 号门牌,总共需要多少个字符 2?解析最简单的循环遍历+字符串count()方法来寻找字符出现次数代码b = 0 #出现次数预定义

2022-04-10 22:19:08 622

原创 【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——跑步锻炼

题目# 小蓝每天都锻炼身体。# 正常情况下,小蓝每天跑1千米。如果某天是周一或者月初(1日),为了激励自己,小蓝要跑2千米。如果同时是周一或月初,小蓝也是跑2千米。# 小蓝跑步已经坚持了很长时间,从2000年1月1日周六(含)到2020年10月1日周四(含)。请问这段时间小蓝总共跑步多少千米?解析大佬(小蓝刷题) ——2020年第十一届蓝桥杯省赛Python组(真题+解析+代码):跑步锻炼知识点1、 calendar.weekday(year,month,day)返回给定日期的日期码。0(

2022-04-10 22:13:41 736

原创 【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——成绩统计

题目# 题目描述# 小蓝给学生们组织了一场考试,卷面总分为 100 分,每个学生的得分都是一个 0 到 100 的整数。## 如果得分至少是 60 分,则称为及格。如果得分至少为 85 分,则称为优秀。## 请计算及格率和优秀率,用百分数表示,百分号前的部分四舍五入保留整 数。## 输入描述# 输入的第一行包含一个整数n,表示考试人数。## 接下来 n 行,每行包含一个 0 至 100 的整数,表示一个学生的得分。## 输出描述# 输出两行,每行一个百分数,分别表示及格率和优秀率

2022-04-09 18:44:43 143

原创 【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——单词分析

题目# 输入描述# 输入一行包含一个单词,单词只由小写英文字母组成。## 对于所有的评测用例,输入的单词长度不超过 1000。## 输出描述# 输出两行,第一行包含一个英文字母,表示单词中出现得最多的字母是哪 个。如果有多个字母出现的次数相等,输出字典序最小的那个。## 第二行包含一个整数,表示出现得最多的那个字母在单词中出现的次数。## 输入输出样例# 示例 1# 输入# lanqiao# 输出# a# 2# 示例 2# 输入# longlonglongistool

2022-04-09 18:38:02 251

原创 【蓝桥】——2020年11届省赛Python组必会真题+解析+代码——2020

题目小蓝有一个数字矩阵,里面只包含数字 0 和 2。小蓝很喜欢 2020,他想找到这个数字矩阵中有多少个 2020 。 小蓝只关注三种构成 2020 的方式:• 同一行里面连续四个字符从左到右构成 2020。• 同一列里面连续四个字符从上到下构成 2020。• 在一条从左上到右下的斜线上连续四个字符,从左上到右下构成 2020。例如,对于下面的矩阵:2 2 0 0 0 00 0 0 0 0 00 0 2 2 0 20 0 0 0 0 00 0 0 0 2 20 0 2 0 2 0一共

2022-04-09 18:23:22 124

原创 HDFS基础命令

通过vi在Linux本地创建三个文本文件:txt1.txt、txt2.txt、txt3.txt。文件里面随意输入些内容。命令如下:vi txt1.txtvi txt2.txtvi txt3.txt(1)列出子目录或子文件列出 HDFS 当前用户家目录下的文件及文件夹(前提:家目录已经存在,否则报错) , 命令为:hdfs dfs –ls如果报错,请看解决办法https://blog.csdn.net/weixin_45970532/article/details/123676781?

2022-03-23 10:10:10 5808

原创 ls: Call From master.hadoop.com/192.168.137.140 to master.hadoop.com:8020 failed on connection excep

记录一下自己煞笔的高光时刻原错误为ls: Call From master.hadoop.com/192.168.137.140 to master.hadoop.com:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused实际需要的结果截图如下

2022-03-23 08:55:59 3875 2

原创 python 如何将多个一维numpy数组合并成二维numpy数组

如两个np.array数组a = np.array([1,2,3,4,5])b = np.array([6,7,8,9,10])得到一个二维数组[[1,6],[2,7],[3,8],[4,9],[5, 10]]解答可以使用zipnp.array(list(zip(a,b)))array([[ 1, 6], [ 2, 7], [ 3, 8], [ 4, 9], [ 5, 10]])另当题目需要输入多个一维数组,输出一个二维数组时s1 =

2022-03-18 21:28:27 15046 1

原创 深度学习从入门到精通(Deep Learning)python 期中考试答案复盘

一、 选择题1、 梯度下降算法的正确步骤是() DA计算预测值和真实值之间误差B迭代更新,直到找到最佳权重C把输入传入网络,得到输出值D初始化随机权重和偏置E对每一个产生误差的神经元,改变相应的权重值以较小误差A、 abcde B、edcba C、cbaed D、dcaeb2、 下面哪个激活函数可以实现max(0,x)的功能() BA、 Sigmoid B、ReLU C、softmax D、Tanh3、 下面说法不正确的是() CA、 神经元它本质是一条直线,或者

2021-11-11 18:05:26 2271 1

原创 python使用正则表达式暴力爬取豆瓣电影top250并将爬取内容保存为本地CSV文件——从浏览器获取headers头信息

记录一下学习爬虫的代码案例代码出处https://www.bilibili.com/video/BV1i54y1h75W?p=24#拿到页面源代码 requests#通过re来提取想要的有效信息 reimport requestsimport reimport csvurl = "https://movie.douban.com/top250"headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64.

2021-09-10 21:21:49 1929

原创 python“人工智障AI女友”——tcp实现局域网中进行主机间的发送、接受消息,Socket的客户端和服务器

首先,这个是我的python编程课程上的习题用于python初学者的学习以及自己复习用途大佬请轻点吐槽(拜谢)代码运行截图如下代码我已经放上来了,有需要者自取,互相学习客户端的代码import sockethost='127.0.0.1' #服务端IPport=8888 #服务端端口address=(host,port) #服务端IP包try: #创建socket soc_client=socket.socket(socket.AF_INET,socke

2021-07-21 01:42:57 469 1

原创 AttributeError: partially initialized module ‘pandas‘ has no attribute ‘Series‘ (most likely due to

记录一下自己的傻逼时刻AttributeError: partially initialized module ‘pandas’ has no attribute ‘Series’ (most likely due to a circular import)1、我已经是确定导入了pandas库了2、错误翻译过来的结果就是AttributeError:部分初始化的模块’pandas’没有属性’Series’(很可能是由于循环导入)于是我看了一下我的库,看到了什么这不扯犊子嘛...

2021-06-18 21:59:52 12704 32

使用HMM进行中文分词提取新闻文本中的高频词中的news.txt新闻文本

Python在Jupyter上使用HMM进行中文分词,将新闻文本分词后提取其中的高频词中的news.txt新闻文本

2022-04-26

使用HMM进行中文分词的train训练trainCorpus.txt文件

Python在Jupyter上使用HMM进行中文分词,将新闻文本分词后提取其中的高频词,HMM训练所需的trainCorpus.txt文件

2022-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除