![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
个人学习记录
Cocktail_py
这个作者很懒,什么都没留下…
展开
-
python jieba中文文本切割成句子
当遇到以下异常时降低jieba版本,改为jieba==0.40即可。原创 2024-06-19 14:01:19 · 150 阅读 · 0 评论 -
解决SELENIUM自动化上传图片或文件出现WINDOWS窗口问题
【代码】自动化选择指定文件上传。原创 2024-05-24 18:08:51 · 144 阅读 · 0 评论 -
windows安装c环境
解压后放到window环境变量路径。原创 2023-09-23 21:13:44 · 181 阅读 · 0 评论 -
sqlite基本操作
【代码】sqlite基本操作。原创 2023-09-07 20:48:36 · 65 阅读 · 0 评论 -
pip设置阿里云源
【代码】pip设置阿里云源。原创 2023-09-01 19:53:29 · 315 阅读 · 0 评论 -
Hyper实现git bash在windows环境下多tab窗口显示
下载链接:https://gitforwindows.org/把shell:后面改成git bash的路径,保存文档并关闭。使用如图快捷键或点New Tab,即可呈现文章开头的效果。下载链接:官网 https://hyper.is/1.电脑上安装有git bash。原创 2023-08-04 15:43:56 · 1171 阅读 · 0 评论 -
pdfminer读取PDF文本内容
【代码】pdfminer读取PDF文本内容。原创 2023-08-01 19:25:09 · 1136 阅读 · 0 评论 -
@钉钉机器人自动回复消息
为了方便开发和测试,机器人正式发布前,我们可以先在钉钉机器人开发管理后台点击版本管理与调试->调试,系统会自动帮我们创建一个调试群。登录「钉钉开发者后台」,选择「应用开发」——「企业内部开发」—— 「机器人」配置钉钉机器人post数据的接口,即web运行开放的端口,设置相应的ip白名单(可以设置当前pc端所在机器出口ip):这里必须先执行步骤四才能配置成功。原创 2023-02-15 17:48:12 · 2922 阅读 · 1 评论 -
AttributeError: module ‘dns.rdtypes‘ has no attribute ‘ANY‘
AttributeError: module 'dns.rdtypes' has no attribute 'ANY'原创 2023-02-03 10:18:44 · 1866 阅读 · 0 评论 -
Python 图片转换(Image Conversion) (JPG ⇄ PNG/JPG ⇄ WEBP)
这里我们将使用 PIL(Python Imaging Library)或 pillow 库,它在 Python 中广泛用于图像处理,Python Imaging Library 中最重要的类是在Image同名模块中定义的类。您可以通过多种方式创建此类的实例;通过从文件加载图像、处理其他图像或从头开始创建图像。原创 2023-01-06 16:49:10 · 2440 阅读 · 0 评论 -
windows安装Scala环境
1.确定已经安装了java环境java -version2.下载安装包https://www.scala-lang.org/download/3.配置scala路径cmd --> sysdm.cplSCALA_HOMED:\ProgramFiles(x86)\scala//追加PATH路径%SCALA_HOME%\bin4.进入Scala交互C:\Users\Ma...原创 2019-10-26 19:40:07 · 307 阅读 · 1 评论 -
python 163邮箱读取
参考:https://www.cnblogs.com/testlearn/p/14548396.html原创 2022-11-10 17:52:15 · 2278 阅读 · 0 评论 -
可视化gitlab工具TortoiseGit 配置SSH key 并关联gitlab
一.TortoiseGit PuTTYgen: 生成密钥保存私钥到本地用户目录二.gitlab: 添加私钥三.TortoiseGit Pageant: 添加私钥参考:https://blog.csdn.net/yjianlu/article/details/123541833转载 2022-05-30 20:16:30 · 942 阅读 · 0 评论 -
python asyncio queue
asyncio 队列被设计成与 queue 模块类似。尽管asyncio队列不是线程安全的,但是他们是被设计专用于async/await 代码。 注意asyncio 的队列没有timeout 形参import asyncio, random, timeasync def rnd_sleep(t): # sleep for T seconds on average awai...原创 2019-09-17 14:21:56 · 1615 阅读 · 0 评论 -
python 判断pdf文件是否可用
# -*- coding: utf-8 -*-# @Time : 2021/12/28 16:52# @Author : Cocktail_pyimport PyPDF2filename = 'pdffilename.pdf'try: PyPDF2.PdfFileReader(open(filename, "rb"))except PyPDF2.utils.PdfReadError: print("Invalid PDF file")except OSError:原创 2022-01-13 17:54:34 · 1168 阅读 · 0 评论 -
PYTHON生成日期维度表 公历转农历
# -*- coding: utf-8 -*-# @Time : 2021/12/31 10:58# @Author : Cocktail_pyimport pandas as pdimport datetimeclass Lunar(object): # ****************************************************************************** # 下面为阴历计算所需的数据,为节省存储空间,所以采转载 2021-12-31 11:26:57 · 553 阅读 · 1 评论 -
OpenNRE关系提取
1.安装OpenNREgit clone https://github.com/thunlp/OpenNRE.gitcd OpenNRE/pip3 install torchpip3 install transformerspip3 install pytestpip3 install scikit-learnpip3 install scipypip3 install nltkpython3 setup.py install2.基本使用import opennremode原创 2021-09-16 16:21:28 · 712 阅读 · 0 评论 -
分类任务与激活函数
分类任务可分为:二分类,多分类,多标签分类1.分类任务二分类多分类多标签分类2.建模上的区别3.代码实现# 激活函数练习# sigmoidimport numpy as np# 输入的数字越小 越靠近0,数字越大越靠近1def sigmoid(x): return 1.0 / (1 + np.exp(-x))print(sigmoid(0.1))# 画图import matplotlib.pyplot as pltsigmoid_input.原创 2021-08-24 19:46:44 · 1189 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘pip‘
python -m ensurepippython -m pip install --upgrade pip解决ModuleNotFoundError: No module named 'pip’问题转载 2021-06-27 17:03:47 · 271 阅读 · 0 评论 -
UnicodeEncodeError: ‘utf-8‘ codec can‘t encode characters in position 36-41: surrogates not allowed
address = "\u261d\ufe0f\u261d\ufe0f\u261d\ufe0f\u261d\ufe0f\u0432\u0441\u0435 \u0442\u043e\u0432\u0430\u0440\u044b \u043d\u0430 \u0441\u0430\u0439\u0442\u0435 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438\ud83d\udcf1\ud83d\udcbb\ud83d\udda5\n\u4fc4\u7f5原创 2021-06-02 16:07:05 · 1157 阅读 · 0 评论 -
TypeError: Object of type Span is not JSON serializable
# 使用pytextrank生成提取相应的关键词数据,通过json序列化返回数据给调用方时抛出了"TypeError: Object of type Span is not JSON serializable"异常import jsonjson.dumps([{'p.rank': '0.2500', 'p.count': 1, 'p.text': 'hello word', 'p.chunks': [hello word]}])解决思路class DictEncoder(json.JSONEnc原创 2021-01-28 17:17:18 · 5142 阅读 · 0 评论 -
python项目 如何发布项目到pypi 让用户使用pip安装
传统的项目文件每次上传都需要进行一次git拉取下来再进行安装,在朋友的指导下决定将相应的python项目发布到pypi上让用户使用pip直接安装一.项目结构参考二.具体步骤参考1.注册用户https://pypi.org/account/register/2.安装twine依赖pip install twine3.创建setup.py文件# -*- coding: utf-8 -*-# @Time : 2020/10/12 9:10# @Author : from s.原创 2020-10-20 19:52:55 · 3350 阅读 · 0 评论 -
FastAPI 解决 "There was an error parsing the body"
在使用flask处理一些接口高并发的问题时候,发现响应没那么快,之后在网上了解到了FastAPI这个框架.在使用flask的post请求的原接口切换到fastapi接口的时候遇到"There was an error parsing the body"问题,有以下两种处理方案pip install uvicornpip install fastapipip install python-...原创 2020-04-30 18:16:55 · 4169 阅读 · 2 评论 -
Session与Cookies
Session在服务端,也就是网站的服务器,用来保存用户的Session信息;Cookies在客户端,也可以理解为浏览器端.浏览器在下次访问网页时会自动附带上Cookies发送给服务器,服务器通过识别Cookies并鉴定出是哪个用户,判断是否是登录状态,进而返回对应的响应.Session,称为会话,是指有始有终的一系列动作/消息.关闭浏览器不会导致Session被删除,Session在服务端...原创 2020-04-19 10:55:58 · 253 阅读 · 0 评论 -
HTTP基本原理
一.HTTP和HTTPSHTTP的全称是Hyper Text Transfer Protocol,中文名叫作超文本传输协议,HTTP协议是用于从网络传输超文本数据到本地浏览器的传送协议,它能保证高效而准确地传送超文本文文档.HTTPS 的全称是 Hyper Text Transfer Protocol over Secure Socket Layer,即 HTTP 下加入 SSL 层.HTT...原创 2020-04-14 22:07:40 · 415 阅读 · 0 评论 -
利用shell脚本清除docker已经退出的容器, 没有在使用的docker镜像以及docker容器中程序产生的日志
docker程序在跑了一段时间之后,发现服务器的磁盘不够了,分享一份shell脚本#!/bin/bash# 清理容器中运行的程序产生的日志baseDir=/var/lib/docker/containersdir=$(ls -l $baseDir |awk '/^d/ {print $NF}')for i in $dirdo newDir=$baseDir/$i for y ...原创 2020-01-06 19:43:26 · 641 阅读 · 0 评论 -
nltk 同义词替换 单词拼写校正 制作伪原创文章
一.基于贝叶斯单词拼写校正# -*- coding: utf-8 -*-# @Time : 2019/11/26 10:13# @Author :# @FileName: word_check.pyimport osimport reimport collections# import requests# url = "http://norvig.com/big.t...原创 2019-12-09 22:39:47 · 1613 阅读 · 0 评论 -
了解ODS、DW和DM概念
在和数据架构师聊天的时候,提到了ODS.当时对这个概念并不是很了解,需要深入学习一下一.ODS、DW和DM概念ODS: 操作性数据;DW: 数据仓库;DM: 数据集市;ODS的数据是"实时值",而数据仓库的数据却是"历史值",一般ODS中储存的数据不超过一个月,而数据仓库为10年或更多.DSS(decision-support system)决策支持系统:用于支持管理决策的系统。...原创 2019-12-05 06:21:03 · 1203 阅读 · 0 评论 -
Windows安装PyTorch
# -*- coding: utf-8 -*-# @Time : 2019/11/26 14:46# @Author :import torchimport torchvision# pip install torchvision==0.2.1# pip3 install http://download.pytorch.org/whl/cpu/torch-0.4.1-cp3...原创 2019-12-03 18:38:45 · 130 阅读 · 0 评论 -
张一鸣, 9 年前重点在做这两件事
普通人张一鸣舵舟研究字节跳动的动机,源自于2016年,我在前东家时拜访张一鸣为起点。字节跳动的总部,进去之后首先是一个巨大的食堂。时间已经过去很长了,拜访张一鸣的过程和结果已经记得不是很详细了,但张一鸣的个人特色,给我留下了深刻的印象。他话不多,看上去没有普通创业者的激昂(事实上,应该也是激昂的)。他像一个数学成绩还不错的同学而已,阵仗不大,不觉得有多高高在上。在吃完饭上电梯的时候,他助理同学说:...转载 2019-11-03 22:01:40 · 749 阅读 · 0 评论 -
Spring Boot入门以及Maven安装 windows环境
1.Maven的安装与配置详解Maven 在windows下的安装步骤详解// 浏览器中输入http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.6.1/binaries/apache-maven-3.6.1-bin.zip设置环境变量cmd --> sysdm.cpl//新建MAVEN_HOME(如图)//...原创 2019-10-05 21:37:08 · 329 阅读 · 0 评论 -
使用uWSGI和Nginx部署一个简单的Flask项目
使用Nginx对Flask服务进行负载均衡,提高Flask程序性能部署首先准备一个flask程序,名字f_show_api.py# -*- coding: utf-8 -*-# @Time : 2019/9/18 9:45# @Author :import loggingimport timefrom flask import Flask, requestapp ...原创 2019-09-28 13:33:02 · 263 阅读 · 0 评论 -
python 处理document文档 保留原样式
document文档格式、线段、图片、页眉页脚等都不变# -*- coding: utf-8 -*-# @Time : 2019/5/6 11:46# @Author :"""# 利用python-docx替换文章中的内容pip install python-docx# 格式、线段、图片、页眉页脚等都不变# python-docx 在处理超链接的问题时,可以参考一下链...原创 2019-09-22 11:01:21 · 6545 阅读 · 3 评论