Linux
小崔崔啊
生命在于运动,技术在于折腾
展开
-
Centos7最小安装化后安装图形界面
首先需要对系统进行更新yum -y upgrade然后安装桌面组件包 ,在命令行下输入下面的命令来安装 Gnome 包 yum groupinstall "GNOME Desktop" "Graphical Administration Tools" 查看和设置默认运行级别systemctl get-default systemctl set-...原创 2018-08-02 12:35:44 · 6610 阅读 · 0 评论 -
linux,vim常用命令
文件常用操作命令日常操作命令:pwd:查看当前所在工作目录date:当前系统的时间last:最近登陆历史记录su - : 切换为root用户rpm -qa | grep mysql:查看系统中是否安装了mysql包who :查看当前登陆用户w:查看当前系统信息和用户登录信息tar zxvf xxx.gz :解压 tarzcvf xx....原创 2018-07-06 22:48:12 · 191 阅读 · 0 评论 -
VM中Centos7扩容
1.首先虚拟机关机 —> 选中要扩容的虚拟机 —>编辑虚拟机设置 —> 硬盘 —> 扩展 —> 调整最大磁盘大小 —> 扩展 本教程是从20G扩展到80GCentos7内部分配 1.查看磁盘容量情况df -h2.操作分区表 fdisk /dev/sda3.重启虚拟机 reboot4.查看当前分区类型...原创 2018-08-17 10:41:24 · 7426 阅读 · 9 评论 -
学习笔记--NLP文本相似度之TF-IDF
余弦计算相似度度量相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,相似度的值越大说明个体差异越大。 文本相似度计算的处理流程是: (1)找出两篇文章的关键词; (2)每篇文章各取出若干个关键词,合并成一个集合,计算每篇文章对于这个集合中的词的词频 (3)生成两篇文章各自的词频向量; (4)计算两个向量的余弦...原创 2018-10-19 18:44:55 · 1256 阅读 · 0 评论 -
学习笔记--NLP文本相似度之LCS(最长公共子序列)
最长公共子序列一个序列S任意删除若干个字符得到的新序列T,则T叫做S的子序列两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列 例如: --字符串12455与245576的最长公共子序列为2455 --字符串acdfg与adfc的最长公共子序列为adf --字符串ABCBDAB与BDCABA的最长公共子序列为BCAB或B...原创 2018-10-19 18:45:12 · 5521 阅读 · 0 评论 -
在Ubuntu下安装Titan图数据库
Titan是一个分布式的图数据库,支持横向扩展,可容纳数千亿个节点和边。 Titan支持事务,并且可以支撑上千用户并发进行复杂图遍历操作。在这里使用Hbase存储数据,elasticsearch做索引。Titan包含下面这些特性: 弹性与线性扩展 分布式架构,可容错 支持多数据中心的高可用和热备 支持ACID和最终一致性 支持多种存储后端 ...原创 2019-03-25 13:21:21 · 428 阅读 · 0 评论