- 博客(244)
- 资源 (15)
- 收藏
- 关注
原创 关键词提取案例
在电商行业中,用户评论是了解用户需求和产品反馈的重要数据来源。通过分析用户评论,可以提取出用户关注的关键词,从而帮助商家优化产品和服务。本案例将展示如何结合`pandas`数据清洗、`jieba`分词和`scikit-learn`关键词提取技术,处理和分析用户评论数据。
2025-03-21 09:32:41
1286
原创 pandas基础
import pandas as pd# 设置DataFrame显示的宽度pd.set_option('display.width', 800) # 设置最大宽度为800个字符pd.set_option('display.max_columns', 100) # 最大列数为100
2025-03-11 16:19:41
2265
原创 基于规则的分词
基于规则或词典的分词方法是一种较为机械的分词方法,其基本思想如下。将待分词语句中的字符串和词典逐个匹配。找到匹配的字符串则切分,不匹配则减去边缘的某些字符。从头再次匹配,直至匹配完毕或者没有找到词典的字符串而结束。基于规则分词主要方法如下。正向最大匹配法(Maximum Match Method,MM法)。逆向最大匹配法(Reverse Maximum Match Method,RMM法)。双向最大匹配法(Bi-direction Matching Method,BMM法)。
2025-03-04 09:40:16
3488
原创 python 正则表达式
函数,从字符串起始位置匹配正则表达式,返回 Match 对象(匹配失败返回 None)。字符串开始(例:^Hello 匹配行首Hello)r’^’ 字符串开始(例:^Hello 匹配行首Hello)匹配除换行外任意字符(例:a.c 匹配 abc)单词边界(例:\bcat\b 匹配独立单词cat)或操作(例:cat|dog 匹配cat或dog)匹配除换行外任意字符(例:a.c 匹配 abc) 一个。1次或多次(例:\d+ 匹配连续数字)0次或多次(例:a* 匹配 aa)空白字符(例:匹配空格、制表符)
2025-02-28 11:12:14
4879
原创 deepin 安装 kafka
kafka 有两种部署模式,分别是zookeeper模式和kraft模式zookeeper模式需要提前部署zookeeperkraft模式不需要部署zookeeper本案例将分别使用zookeepper模式和kraft模式部署kafka
2024-12-24 09:20:50
8041
原创 scala 编写 hdfs 工具类
scala 编写 hdfs 工具类scala 创建 删除 hdfs 文件或目录scala 上传 下载 hdfs 文件 scala 读取 写入 hdfs 文件
2024-12-05 10:20:15
7916
原创 scala math 匹配模式
在Scala语言中,模式匹配是一种强大的控制结构,它允许你以声明式的方式检查一个值是否符合某个模式,并根据匹配的结果执行不同的代码块。Scala的模式匹配类似于正则表达式,但更加通用,可以用于数据结构的匹配。
2024-12-02 10:23:46
8036
原创 deepin 安装 chrome 浏览器
最近好多小伙伴儿和我说 deepin 无法安装最新的谷歌浏览器其实是因为最新的 谷歌浏览器 其中的一个依赖需要提前安装
2024-11-27 07:43:46
8019
原创 Java 封装 Echart 数据转图表 工具类
ListToChart 为数据转换工具类,其中包含了行列转换 、饼图、堆叠图(柱状图和折线图)、堆叠求和、堆叠百分比等转发方法。转换后的数据格式为 [rowKeyList,dataList,aliasList]行列转换工具
2024-11-12 02:41:15
7991
原创 Java 处理 json 格式数据解析为 csv 格式
如果不使用 JSON 工具库,你可以手动解析 JSON 格式字符串并将其转换为 CSV 格式字符串。以下是一个简单示例,展示如何实现这一功能。
2024-11-09 09:30:17
7951
原创 Windows 使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程
在Windows中,你可以使用内置的netstat和taskkill命令来查找特定的端口并结束使用该端口的进程。如果taskkill命令失败,可能是因为你没有足够的权限来结束该进程,这时你可以以管理员身份运行命令提示符。在这个例子中,我们假设要查找的端口号是8080,netstat的输出中的进程ID是1234。使用netstat -ano | findstr "端口号"命令查找特定端口号的进程。注意:在实际操作中,你可能需要根据实际情况调整命令,例如端口号和进程ID。打开命令提示符(以管理员身份运行)。
2024-10-26 09:49:36
8023
原创 Vue3 + TypeScript + Vite + Echarts + DataV
Vue3 + TypeScript + Vite + Echarts + DataV
2024-10-09 21:42:46
7914
原创 设置cockpit自启动
The unit files have no installation config (WantedBy=, RequiredBy=, UpheldBy=,Also=, or Alias= settings in the [Install] section, and DefaultInstance= fortemplate units). This means they are not meant to be enabled or disabled using systemctl.
2024-07-24 08:27:20
8006
原创 解决VMware虚拟机在桥接模式下无法上网的问题
windows11系统自动启动了热点功能,开启热点可能会干扰虚拟机的桥接设置。方法一:windows11可以提供网络热点服务方法二:手动指定桥接的物理网卡
2024-07-16 12:12:30
8184
2
原创 华为欧拉 openEuler24.03 更新 阿里 yum源
[openeuler]name=openEulerbaseurl=https://mirrors.aliyun.com/openeuler/openEuler-24.03-LTS/OS/x86_64/enabled=1gpgcheck=0
2024-06-23 20:46:24
8371
原创 华为欧拉openEuler24.03在线安装MySQL8.4
超级用户的密码已设置并存储在错误日志文件中。–add-port=1935/tcp #添加端口,格式为:端口/通讯协议。–permanent #永久生效,没有此参数重启后失效。SSL 证书和密钥文件在数据目录中生成。创建了一个超级用户帐户。–zone #作用域。
2024-06-23 16:59:03
7938
finebi6.0 服务器版
2024-07-16
Javaweb Layui RBAC 项目 小金库
2022-06-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人