- 博客(16)
- 收藏
- 关注
原创 003_文本分析与挖掘(Kmeans算法对指定中文数据集聚类)
用Kmeans算法对指定中文数据集聚类:(1)使用jieba进行分词(2)去除停用词(3)构建特征向量(4)使用Kmeans算法进行聚类。
2024-04-13 16:34:41 479
原创 002_文本分析与挖掘(jieba库三种分词模式,SnowNLP的简答演示,去除停用词,提取关键词,构建特征向量)
jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。支持三种分词模式1、精确模式,试图将句子最精确地切开,适合文本分析;2、全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;3、搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
2024-04-09 16:05:04 1155
原创 001_Python(PyCharm,Anaconda,Jupyter更改工作目录)
PyCharm,Anaconda,Jupyter更改工作目录
2024-03-26 16:43:05 866 1
原创 010_Linux(IP,ping,wget,curl,nmap,netstat)
IP,ping,wget,curl,nmap,netstat,IP地址、主机名、域名、固定IP、下载文件、网络请求、端口
2024-03-16 23:15:49 1141 1
原创 009_Linux(软链接ln,查看日期时间date,修改时区,自动/手动校准时间ntp)
软链接ln,查看日期时间date,修改时区,自动/手动校准时间ntp
2024-03-14 21:36:52 498
原创 008_LInux(快捷键ctrl+c,ctrl+d,history,!,ctrl+r,ctrl+l,clear,安装软件yum,控制软件启动关闭systemctl)
快捷键ctrl+c,ctrl+d,history,!,ctrl+r,ctrl+l,clear,安装软件yum,控制软件启动关闭systemctl
2024-03-13 21:46:48 676
原创 006_LInux(su,sudo,groupadd,groupdel,useradd,userdel,id,usermod,getent passwd,getent group)
su,sudo,groupadd,groupdel,useradd,userdel,id,usermod,getent passwd,getent group
2024-03-11 17:06:41 788 1
原创 005_Linux(echo,反引号符`,重定向符>&>>,tail,vim编辑器)
echo,反引号符`、重定向符>&>>、tail、vim编辑器
2024-03-10 21:05:06 768 1
原创 003_Linux(touch,cat,more,cp,mv,rm)
1、mkdir 用于创建目录(文件夹)touch 用于创建文件2、cp 和 rm 都有 -r 选项,用于文件夹的复制和删除。
2024-03-08 16:40:15 824
原创 002_Linux(ls,cd,pwd,mkdir创建目录)
Windows系统可以拥有多个盘符,如C盘、D盘、E盘Linux没有盘符的概念,只有一个根目录 / ,所有文件在其下面。
2024-03-07 17:03:49 922
原创 001_Linux(VMware、CentOS、FinalShell下载安装)
这一趴进行了虚拟机软件VMware、CentOS操作系统、FinalShell辅助软件的下载与安装,完成了Linux学习的第一步……
2024-03-06 16:44:32 412
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人