写入sqlserver中文乱码_Jieba库=“结巴”中文分词:做最好的 Python 中文分词库

本文介绍了Python的Jieba库在中文分词方面的应用,包括数据可视化、关键词提取和词云图生成。同时,针对写入SQL Server出现的中文乱码问题进行了讨论,并提供了解决方案。
摘要由CSDN通过智能技术生成

1 说明:

=====

1.1 Jieba库,就是“结巴”中文分词:做最好的 Python 中文分词组件。

1.2 Jieba库的基本介绍,数据可视化wordcloud词云图和pyecharts柱状图。

1.3 写入和读取txt数据的方法复习。

4ca1e62a7f4c42b7f7dc0a47fcb70119.png

此刻不要jieba=结巴

2 准备:

=====

2.1 官网:

https://github.com/fxsjy/jiebahttps://pypi.org/project/jieba/

2.2 安装:

pip install jieba#本机安装sudo pip3.8 install -i https://mirrors.aliyun.com/pypi/simple jieba

2.3 环境:

华为笔记本电脑、深度deepin-linux操作系统、谷歌浏览器、python3.8和微软vscode编辑器。

===举例===

3 关键词提取:

==========

3.1 代码:

import jieba.analyse#张爱玲经典散文欣赏:爱#注意,复习字符串知识#如果是一行字符串,那么单引号、双引号、三引号均可以#如果多行显示,后面需要加,那么只能双引号和三引号,单引号不行。#同时,等号后面必须紧跟一个前引号test_text = '''有个村庄的小康之家的女孩子,生得美,有许多人来做媒,但都没有说成。那年她不过十五六岁吧,是春天的晚上,她立在后门口,手扶着桃树。她记得她穿的是一件月白的衫子。对门住的年轻人同她见过面,可是从来没有打过招呼的,他走了过来。离得不远,站定了,轻轻的说了一声:“噢,你也在这里吗?”她没有说什么,他也没有再说什么,站了一会,各自走开了。就这样就完了。后来这女人被亲眷拐子卖到他乡外县去作妻,又几次三番地被转卖,经过无数的惊险的风波,老了的时候她还记得从前那一回事,常常说起,在那
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值