- 博客(4)
- 收藏
- 关注
原创 csv文件导入到hbase(ImportTsv具体使用)
预先告知⚠️:为之后方便使用 ImportTsv 命令导入数据(其中参数 -Dimporttsv.columns 定义如何将csv列映射到hbase表,例如csv中的school列映射到basic_info列族下的shcool行限定符:school -> basic_info:school),需要为csv文件添加一列 HBASE_ROW_KEY 作为复合行键,为每一行生成唯一的行键。如果字段值内容没有逗号,则无需引号。3.单元格内数据全部都被英文分号连接,如图,只占一个单元格,需要分割。
2025-06-04 19:12:12
1157
原创 tesserocr 安装失败(换成镜像文件安装方式)
博主在跟着《Python 3 网络爬虫开发实战》(崔庆才著)第一章中 1.3.4 安装 tesserocr 的时候出现了问题。首先明白了 Tesseract OCR 是一个开源的文字识别(Optical Character Recognition,光学字符识别)引擎,它可以识别多种格式的图像文件中的文字。tesserocr 是 Python 的一个 OCR 识别库,其实是对 tesseract 做的一层 Python API 封装,对Tesseract OCR 进行调用,核心是 tesseract。
2025-04-04 20:49:50
1180
原创 不论什么操作都显示,CondaValueError: Malformed version string ‘~‘: invalid character(s).
感觉是镜像地址的问题,无法用命令修改,打开environment.yml,将清华镜像的。清华大学镜像源(Tuna镜像源)同时支持。协议,因为它提供了更安全的连接。连接有问题,可以尝试切换到。看看是否能解决问题。通常情况下,推荐使用。
2025-03-21 20:13:20
2550
原创 Anaconda下载之后只有Anaconda Prompt,无法activate环境
本人只是个菜鸡,尝试学习pytorch的时候被安装下载所苦恼,甚至驱动都重装了几次了,只是想达到兼容。这个问题之前已经遇到过一次了,这次又遇到,却忘记怎么处理了,所以突然想写一篇文章把这个问题的解决方案记录下来,方便以后也希望能帮助到遇到类似情况的小伙伴。
2025-03-20 20:34:31
539
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人