- 博客(10)
- 资源 (4)
- 收藏
- 关注
原创 利用正则表达式以及re模块进行一些文本处理工作(应用说明)
本篇文章主要讲解一些基础的python正则表达式的应用,以及re模块中的几个方法,关于正则表达式和个函数的详细解释,参看链接:Python 正则表达式,这个网址讲述的非常清楚,我这篇文章只是为了更清晰的讲述一下它的应用。需要先掌握的几个函数为re.match()、re.dearch()、re.compile()、re.findall()、re.finditer()、内置函数replace()、strip(),在上边的链接里都有,我再赘述没有什么意义。 首先我们从一个问题...
2022-05-07 20:28:52 754
原创 从excel转换成的csv文件,放到pycharm中显示编码错误——彻底解决此类编码解码问题
一、问题分析1. 问题发现最近在进行一项研究,刚刚开始最初的数据预处理阶段。我的原始数据是存放在excel表格中的,我先把excel表格转换成csv文件,然后利用python代码进行预处理。当我想把csv文件放到pycharm目录下时,pycharm每次都会提示我编码错误,请求reload in 'GBK',如图所示。2.问题解释 出现这种情况,说明我的这个csv文件的解码方式错误,此时pycharm的解码方式用的是utf-8格式,这里建议我reload in GBK,意思...
2022-04-28 22:48:38 5144 2
原创 训练word2vec模型时碰到的两个问题:AttributeError和 UnicodeDecodeError,即属性错误和编码问题
一、属性错误1.报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 12.报错解析:3.解决办法:二、编码问题1.报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 12.报错解析:3.解决办法:......
2022-04-22 23:05:38 3986
原创 word2vec简介、原理、缺陷及应用。
一、什么是word2vec? word2vec及word to vector,翻译过来就是从单词到向量,它是将自然语言中的单词转化为向量的一种方法。为什么要把单词转化为向量呢?这是由于在进行自然语言处理时,我们有可能要比较两个短语或者语句的相似性,比较他们的语义信息,而让机器理解句子就比较困难,所以要转化成计算机能看懂的语言——数字,从而我们就能进行后面的一系列操作。这种方法更像是自然语言处理的一个前序工作、一个桥梁,有了这种方法,文本与后面的研究就被连接了起来。 它是一种语...
2022-04-22 22:37:36 14209
转载 PHP、JSP、ASP简介与区别
PHPPHP(Hypertext Preprocessor)是一种嵌入HTML页面中的脚本语言。它大量地借用C和Perl语言的语法, 并结合PHP自己的特性,使Web开发者能够快速地写出动态产生页面。PHP是完全免费的开源产品,不用花钱,Apache和MYSQL也是用样免费开源,在国外非常流行,PHP和MYSQL搭配使用,可以非常快速的搭建一套不错的动态网站系统,因此国外大多数主机系统都配有免费的APACHE+PHP+MYSQL。通常认为这种搭配的执行效率比IIS+ASP+ACCESS要高,而后者的使用
2022-04-21 21:21:17 3008
原创 python读取csv文件的几种方式(含实例说明)
一、使用pandas库举个例子:直接利用read_csv()方法读取,文=文本被转化成了dataframe格式。import pandas as pddf = pd.read_csv('../data_pro/audito_whole.csv')print(df)结果:二、使用csv库举个例子:先利用codecs.open方法读取文件audito_whole.csv,采用utf-8字符编码,再利用csv.DictReader()方法读取。这里可以换成python内置的open()方法,也
2022-04-21 21:19:43 170773 3
原创 关于pycharm中Debugger失败的问题,报错:Connection to Python debugger failed Interrupted function call: accept fa
这个问题的主要解决方法有两种,你如果遇到这个问题,可以依次尝试下面两个步骤。如果问题没有解决,再加油找找,然后分享出来,我来更新一下这篇文章;如果解决了,记得点个赞再走哦~**步骤一:**这也是网上流传的较多的一种方法,按照下边图片顺序进行操作即可啦。①②步骤二:如果上边的方法不行,你可以翻看一下你的python文件名里边有没有看起来比较敏感的、像关键词的,比如code、thread之类的,如果有,把它改成别的名字或者删掉就可以啦...
2021-09-22 19:51:15 4021 1
原创 JAVA中的printf用法
java沿用了C语言中的printf方法,其用法与C中的printf方法一致。下面通过几个例子来说明他的用法:(1)用于printf的转换符有如下(这里只列出了部分):%n 换行 相当于 \n%c 单个字符%d 十进制整数%u 无符号十进制数%f 十进制浮点数%o 八进制数%x 十六进制数%s 字符串%% 输出百分号转换符的类型要与打印的内容数据类型相同,如下例子中我要打印浮点数,就要使用%f double x = 1000.0 / 3.0; ...
2021-07-05 16:51:51 10972
原创 JAVA中的printf方法
java沿用了C语言中的printf方法,其用法与C中的printf方法一致。下面通过几个例子来说明他的用法:(1)用于printf的转换符有如下(这里只列出了部分):%n 换行 相当于 \n%c 单个字符%d 十进制整数%u 无符号十进制数%f 十进制浮点数%o 八进制数%x 十六进制数%s 字符串%% 输出百分号转换符的类型要与打印的内容数据类型相同,如下例子中我要打印浮点数,就要使用%fdouble x = 1000.0 / 3.0;System.out.
2021-07-05 16:50:11 6162
原创 charAt(int index)方法与codePointAt(int index)方法的用法
(1)charAt(int index)方法*****charAt(int index)方法返回给定位置的代码单元,例如下面代码中 String c = "??a"; System.out.println(c.charAt(0)); //返回英文问号 ? System.out.println(c.charAt(1)); //返回中文问号 ? System.out.println(c.charAt(2));...
2021-06-28 10:24:03 642
pyltp_binary-0.2.1.0-cp39-cp39-win_amd64.whl
2022-05-25
pyltp_binary-0.2.1.0-cp38-cp38-win_amd64.whl
2022-05-25
pyltp_binary-0.2.1.0-cp37-cp37m-win_amd64.whl
2022-05-25
pyltp_binary-0.2.1.0-cp36-cp36m-win_amd64.whl
2022-05-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人