自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhao_crystal的博客

总结,升华,创新

  • 博客(222)
  • 资源 (1)
  • 收藏
  • 关注

原创 解压缩snappy格式数据

解压缩snappy格式数据

2023-02-02 23:09:28 495 1

转载 python int时间和字符串时间戳的转化

python int时间和字符串时间戳的转化

2022-12-09 00:01:36 2887

原创 linux 定时任务

linux 定时任务

2022-12-08 23:57:06 306

原创 【学习】kafka 接 hadoop

kafak 将数据批量写到hdfs

2022-12-08 23:54:50 475

原创 mysql

解决mysql查不到最新数据的办法

2022-12-08 23:18:34 251

转载 Spring 基础学习 在IDEA上使用Maven构建一个简单的Spring 项目(xml配置形式)

搭建一个简单的spring项目

2022-12-08 23:14:18 68

转载 windows 查看进程,杀死进程

windows查看进程,杀死进程

2022-12-08 23:05:31 153

原创 windows 使用VMware 从零搭建hadoop集群

windows 使用VMware 从零搭建hadoop集群

2022-11-27 11:29:21 772

原创 Mac 使用paralles 从零搭建hadoop集群

Mac 使用paralles 从零搭建hadoop集群

2022-11-27 10:49:52 1654

原创 java 问题解决

1.IntelliJ IDEA 如何创建一个普通的 Java 项目,及创建 Java 文件并运行2. java: -source1.5 不支持diamond运算符3. Error:java: Compilation failed: internal java compiler error4. java:lombok 不存在

2022-11-22 22:41:27 345

原创 生活小技巧

生活 护眼

2022-11-22 22:23:03 94

原创 python 打包成 exe

python 打包成 exe

2022-11-22 22:19:23 204

原创 linux 用户名和密码的处理

linux 用户名和密码处理

2022-11-22 22:10:38 1450

转载 python 获取当前目录路径和上级路径

python 获取当前目录路径和上级路径

2022-11-22 21:36:00 4254

原创 python 定时任务

"每隔1分钟执行一次任务" 最终实现方式。

2022-11-22 21:29:09 561

原创 pandas 操作

先根据第一列,然后再根据第二列进行排序。3. 根据某一列,计算分组情况。1. 根据多列依次进行排序。2. 根据某一列去重。

2022-11-22 21:21:53 318

转载 python 将字典字符串转换为字典对象的方法

python 将字典字符串转换为字典对象的方法

2022-11-11 01:01:25 1642

转载 python int ip 和 string ip的互换

python int ip 和 string ip的互换

2022-11-11 00:39:36 243

原创 Hadoop 集群搭建(docker版本)

Hadoop 集群搭建(docker版本)

2022-11-06 15:10:56 1025 5

原创 06 逻辑回归

逻辑回归

2022-10-30 22:45:19 265

转载 xcrun: error: invalid active developer path 错误

xcrun: error: invalid active developer path

2022-10-30 17:13:02 194

原创 推荐 系统

推荐系统

2022-09-19 22:09:46 234

转载 mac 安装java

Java从零开始(2)在 MacOS 上安装 Java - SegmentFault 思否在 MacOS 上安装 Java本小节我们将介绍如何在 MacOS 平台安装 Java 。1. 下载安装包我们首先打开Oracle官网的 JDK 下载地址,找到 Java SE 15 版块,点击 JDK...https://segmentfault.com/a/1190000040495961...

2022-09-18 20:13:21 83

原创 小白学算法

1.数据结构和算法动态可视化 (Chinese) - VisuAlgohttps://visualgo.net/zh

2022-09-18 20:12:01 87

原创 mac安装python 和 pip

1. 安装python32. 安装pip3(1)下载get-pip.py 文件curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py(2)安装pip3python3 get-pip.py

2022-09-18 20:10:37 366

原创 mac 安装jupyter notebook(无anaconda版)

mac 安装jupyter notebook, 不依赖anaconda

2022-09-12 21:50:23 734

原创 pytorch+GPU

pytorch + GPU的使用

2022-09-04 17:23:03 377

原创 python requirements

python requirements 的生成和使用

2022-07-04 16:03:45 1113

原创 mac 进入pycharm创建的虚拟环境

mac 进入pycharm创建的虚拟环境

2022-07-04 15:58:35 550

转载 Out-Of-Vocabulary(OOV)的理解

OOV 问题是NLP中常见的一个问题,其全称是Out-Of-Vocabulary,下面简要的说了一下OOV:怎么解决?下面说一下Bert中是怎么解决OOV问题,如果一个单词不在词表中,则按照subword的方式逐个拆分token,如果连逐个token都找不到,则直接分配为[unknown]...

2022-05-20 23:07:14 1895 1

转载 module ‘torchtext.data‘ has no attribute ‘Field‘

原因是新版本的 torchtext 已经没有Field这个函数了。参考下面的博客来进行修补吧?【进阶篇】全流程学习《20天掌握Pytorch实战》纪实 | Day03 | 文本数据建模流程范例_府学路18号车神的博客-CSDN博客https://blog.csdn.net/weixin_44333889/article/details/124186466遗留问题:是否可以用将代码转换到最新版本呢?待续啦...

2022-05-09 22:58:14 3716

转载 中文文本生成数据集整理

可以参考如下链接中文文本生成数据集整理-NLG - 知乎https://zhuanlan.zhihu.com/p/427156319

2022-05-08 21:43:14 1141

原创 shell 命令大全

1. 查看某个文件中特定字符串的个数查看的特定字符为“刘大耳”, 查看的文件为 cut_result.txtgrep -o "刘大耳" cut_result.txt | wc -l

2022-05-06 20:01:44 889

原创 linux 下进入root

(1)sudo 命令 这样输入当前管理员用户密码就可以得到超级用户的权限。但默认的情况下5分钟root权限就失效了。(2)sudo -i 通过这种方法输入当前管理员用户的密码就可以进到root用户。(3)如果想一直使用root权限,要通过su切换到root用户。那我们首先要重设置root用户的密码: sudo passwd root 这样就可以设置root用户的密码了。之后就可以自由的切换到root用户了 su 输入root用户的密码即可。当然,如果想从root用户切换回一般用户,则.

2022-05-02 18:05:22 5500

原创 mac安装homebrew 和 telnet

1. 安装 homebrew/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)"这时很可能会出现一个问题: 要么下载极其龟速,要么直接出现如下提示curl: (7) Failed to connect to raw.githubusercontent.com port 443: Connection refusedbrew 镜像安装脚本(亲测最

2022-05-02 18:02:51 294

原创 在Mac上通过ssh连接谷歌云上的服务器实例并使用SFTP方式上传文件

1. 在Mac上通过ssh连接谷歌云上的服务器实例(1)先从本地mac电脑中通过一段简单的命令获得钥匙ssh-keygen -t rsa -f ~/.ssh/google_sem_key(生成key的文件名) -C **(服务器的用户名) -b 2048执行命令会,会让你输入并确认密码,这里直接确认即可然后输入以下命令进入.ssh目录并用ls命令列出当前目录下的文件内容cat google_sem_key.pub你会找到一大串乱码,复制下来。(2)登录谷歌云账户,

2022-05-01 23:20:13 1349

原创 算法 资源

1.数据结构和算法动态可视化 (Chinese) - VisuAlgoVisuAlgo was conceptualised in 2011 by Dr Steven Halim as a tool to help his students better understand data structures and algorithms, by allowing them to learn the basics on their own and at their own pace. Together w

2022-04-30 14:54:06 222

原创 03中文分词

1. 为什么要分词1.1 中文分词的目的让机器更好的“理解”文章。1.2 英文天然分词,比中文更适合做相似度比对?No,英文中每个单词包含很多不同的意思。1.3 分词是越细越好吗?视情况而定搜索——>越细越好——>因为其比较注重召回推荐——>粗一点好——>因为其更注重精准度(精准推荐),粒度粗有利于“保留语义”2. 怎么分词里面涉及的一些算法:容易切分的:用字典匹配,动态规划,vterbi算法不容易切分的:隐马尔可夫模型2.

2022-04-11 23:59:06 1001

原创 02关键信息提取

1. Count Vector1.1什么是count vector计数向量/频数向量,一句话中的单词用其频数来表示,组成一个数字向量。比如:“He is a boy.,She is a girl, good girl.”语料库:[He, is, a, boy, She, girl, good]Count vector: [1, 1, 1, 1, 0, 0, 0] [0, 1, 1, 0, 1, 2, 1]1.2为什么要用count ve.........

2022-04-06 22:57:26 2959

原创 vim的使用

1. 配置vim显示行号1.1 临时显示行号ESC键退出编辑内容模式,输入“:set number”后按回车键注:文件关闭后,再打开是不会显示行号的1.2 用久显示行号修改配置文件:vim ~/.vimrc在打开的vimrc文件中最后一行输入:set number ,然后保存退出。再次用vim打开文件时,就会显示行号了。......

2022-04-03 14:42:19 2392

SVM的原理介绍以及代码的解析

SVM的原理介绍以及代码的解析

2021-08-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除