自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习中常用的几种距离——欧式、余弦等

(1)二维空间的距离公式(三维空间的在这个基础上类推):A(x,y),B(x,y)两点之间的欧式距离为:(2)n维空间的距离公式A(x,x,…,x)和B(x,x,…,x。

2024-05-14 10:24:23 386

原创 python中一些莫名其妙的异常

Python中容易忽略的小异常。

2024-05-07 14:05:16 362

转载 Navicat 12下载、安装(win10、11均可,包含Navicat 16)

2、License, Product and Language确保License为Enterprise,Products为Premium,Languages为Simplified Chinese(简体中文,其它语言版本请自选);点击patch,选择Navicat Premium 12 安装目录下的exe,此时出现如下弹窗,提示navicat.exe - x64 -> Cracked.下载后解压缩,Navicat Premium 12安装就不多介绍了,如图。1、首先以管理员身份运行上图中第一个执行文件。

2024-05-06 17:02:47 481

原创 LLM预备知识——概念、技术基础篇

(1)条件随机场(CRF)设X、Y为随机变量,P(Y|X)是在给定X的条件下Y的条件概率分布。若随机变量Y构成一个由*无向图G=(V,E)*表示的马尔科夫随机场,即P(Yv|X,Ywv|X,Yw,w~v)对任意定点v成立,则称条件概率分布P(Y|X)为条件随机场。其中:w~v表示在图G=(V,E)中与顶点v有边连接的所有定点w;w≠v表示除定点v以外的所有顶点;Yv与Yw为顶点v与w对应的随机变量。马尔科夫随机场:具有马尔科夫性的随机场;

2024-01-16 11:28:47 1138

原创 机器学习中常用的几种函数——激活函数、损失函数

sigmoid等激活函数、loss损失函数

2024-01-02 17:16:24 1647

原创 信息系统项目管理师(北京)——拿证实践总结

软考经验总结(文章标签中连“软考”这个选项都没有,什么鬼)

2023-08-28 16:29:06 356

原创 LLM预备知识、工具篇——LLM+LangChain+web UI的架构解析

LLM(fastchat)+Langchain+Gradio/Streamlit各种框架基础点

2023-08-24 17:26:28 7755

原创 gitlab用法教程

【注意:(1)如仓库里有文件夹里没有的文件(有别的人更新过文件/夹)需在git push前先;

2023-04-21 17:47:07 1020

原创 linux上使用libreoffice对文件类型转换

使用libreoffice在linux完成文件格式转换

2023-03-24 11:49:35 1345 1

原创 paddlenlp调用ERNIE、使用ERNIEKIT

paddle and paddlenlp

2022-12-28 16:45:12 1406 5

原创 samba一般安装(Ubuntu)

samba在线安装与配置或者3、查看samba版本和状态结果:具体更新内容同博客Ubuntu离线安装samba与配置(.tar方式安装)

2022-12-06 15:47:48 1551

原创 Ubuntu离线安装samba与配置(.tar方式安装)

samba离线安装与配置

2022-07-28 17:17:54 8454 2

原创 知识图谱中“三元组”抽取——Python中模型总结实战(基于TensorFlow2.5)

目录一、pyhanlp二、stanfordnlp三、pyltp一、pyhanlp【基于java的,安装使用前必须先安装java环境】二、stanfordnlp【官方GitHub介绍:https://stanfordnlp.github.io/stanfordnlp/training.html】1、安装:pip 安装 pip install stanfordnlp --proxy 111.666.88.688:8082、简单使用 import stanfordnlp三、pyltp【学习

2022-07-08 10:55:14 11589 9

原创 爬虫实践——selenium、bs4

目录一、浏览器的一般设置二、打开网页并获取网页源码的方式三、HTML解析1、BeautifulSoup2、Selenium的webdriver加入触发动作四、反爬虫操作from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport urllib.parseimport urllib.requestfrom bs4 import Bea

2022-06-22 17:05:32 350

原创 github实践(基于win10)

全文即摘要

2022-06-16 16:35:59 292

原创 Python与多进程、多线程——multiprocessing、threading、async/await

1、multiprocessing模块1)使用进程池pool:pool( )类:指定进程池中同时执行的进程数为8,当一个进程执行完毕后,如果还有新进程等待执行,则会将其添加进去。pool.apply_async( ):为非阻塞,即不用等待当前运行的子进程执行完毕(各子进程并行执行,且主进程与子进程之间、各子进程之间都不会互相等待),随时根据系统调度来进行进程切换。pool.apply( ):阻塞型,各子进程需依次执行,主进程会被阻塞直到函数执行结束【多进程执行过程中,子进程出错时,将直接跳出,执

2022-04-21 10:12:37 1253

原创 数据处理日常小技巧——Excel等

一、Excel中的简单数据处理技巧1、转化Excel单元格中文本形式的数字为数值型(单元格左上角有个绿色三角形):问题数据如下:方法一:选中对应列,分列,直接点完成。方法二:选中左上角第一个问题单元格,Ctrl+Shift+end选中所有的单元格,点击左上角(有的时候在右上角)的“黄色叹号”,选中“转换为数字”...

2022-02-21 11:28:13 251

原创 (词/位置)向量训练实战——Word2vector、Glove、Doc2vector、position_embedding

1、基于gensim(版本:3.8.3)的Word2vector进行token2id,方便后续利用word2vector进行embeddingimport pprintimport gensimfrom gensim.models.word2vec import Word2Vecfrom gensim.corpora.dictionary import Dictionarysentense='按我的理解,优化过程的第一步其实就是求梯度。这个过程就是根据输入的损失函数,提取其中的变量,进行梯度下降

2022-01-21 10:01:25 2799

原创 Python3中的异常处理

目录try……exceptassertraise:sys.exit():try……except例子:(有except则程序处理异常后不会终止,否则,遇到异常后仅执行finally就退出程序)注意:在try语句中出发异常之前的语句会执行并生效:assertassert:断言 用来测试表达式,其返回值为假,就会触发异常。raise:该语句之后的代码将不会执行,但是当raise处于try中时,try之后的语句不执行,会执行except中语句。触发raise语句的结果:sys.exi

2021-08-17 11:27:31 1378

原创 pytorch(版本1.9.0+cpu)学习实践

目录一、一些基本操作一、一些基本操作# 随机初始化一个tensorrand_num=torch.rand(2,3) print(rand_num) # tensor([[0.8485, 0.8955, 0.6221],[0.7218, 0.6770, 0.5296]])# 直接使用数据构建一个tensortensor_fromLis=torch.tensor([[2,3],[5,6],[4,4]]) print(tensor_fromLis) # tensor([[2, 3],[5, 6]

2021-07-23 09:58:51 2525

原创 数据库操作——mongoDB、MySQL、KBase、Neo4j

MongoDB、mysql、Neo4j、postgreSQL-vector操作实践手册

2021-07-16 10:23:05 1576

原创 Python中的排列组合

itertools模块1、permutations:排列,考虑顺序>>> from itertools import permutations>>> rc=permutations(['a','b','c'],3)>>> list(rc)[('a', 'b', 'c'), ('a', 'c', 'b'), ('b', 'a', 'c'), ('b', 'c', 'a'), ('c', 'a', 'b'), ('c', 'b', 'a')]2

2021-06-29 11:13:32 280

原创 Python中的参数——位置参数、关键字参数

*argms:位置参数*argms收集所有未匹配的位置参数组成一个tuple对象,局部变量args指向此tuple对象def my_test(*argms): print(argms)if __name__=='__main__': dd=['ab','bc','cb'] my_test(*dd) # *参数用于解包tuple对象的每个元素,作为一个一个的位置参数传入到函数中,结果类似于my_test('ab','bc','cb') my_test(dd) my

2021-06-21 11:06:50 260

原创 linux(Ubuntu)的shell命令实践总结(含conda)

一、crontab命令crond 是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务 工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。crontab:由于使用者自己也可以设置计划任务,所以, Linux 系统也提供了使用者控制计划任务的命令 :crontab 命令示例:(在crontab文件中添加定时自动关机任务)① 在root账号

2021-05-28 09:15:48 3173 1

原创 scikit-learn与机器学习实践

目录数据集划分特征生成模型训练与测试模型评估模型保存与加载数据集划分from sklearn.model_selection import train_test_split, cross_val_score, cross_validate, KFoldX_train, X_test, y_train, y_test = train_test_split (x, y, train_size, text_size, random_state, stratify, shuffle)'''参数:x:数据集

2021-05-20 11:02:04 177

原创 Python的数据类型str、set、list、dict、tuple、Array、DataFrame等整理

目录杂记排序问题:strSet:ZipListTupledictArray:Dataframe杂记1)iterable类型在切片时,没有越界问题。2)判断数据类型使用:isinstance(code, float) #判断code是否为float类型3)浮点数问题:保留小数点后两位:format(loadedAvg_sheet1, '.2f') #对loadedAvg_sheet1保留小数点后两位排序问题:sorted(agrs1,key=)1)实现通过lis的第三个元素进行升序排序

2021-05-19 11:02:22 2304

原创 Python小模块大功能——typing模块、argparse模块、time模块、文件/路径操作模块

模块typing常用类型int,long,float: 整型,长整形,浮点型bool,str: 布尔型,字符串类型List, Tuple, Dict, Set,Sequence:列表,元组,字典, 集合Iterable,Iterator:可迭代类型,迭代器类型Generator:生成器类型使用示例:from typing import Listdef findMedianSortedArrays( nums1: List[int], nums2: List[int]) -> floa

2021-05-11 10:06:55 1192

原创 requests模块的post实战

1、post json数据:添加header、cookie必须在headers中添加 {‘Content-Type’: ‘application/json’}url = 'https://xxxx/xxxxx/Auto' header={'Content-Type': 'application/json'} response = requests.post(url, data=json_str, headers=header)json = response.json()text = respon

2021-04-22 16:58:53 230

原创 tkinter模块生成消息弹窗

tkinter模块 是Python 的标准 GUI 库1)提示框生成包括各种提示框:消息提示框(showinfo())、错误(showerror())、警告(showwarning())等,以消息提示框为例:# Python3import tkinterimport tkinter.messageboxtop = tkinter.Tk()top.withdraw() # ****实现主窗口隐藏(即隐藏带tk标题的空白窗口)top.update() # *********需要update

2021-03-10 15:28:45 2683 1

原创 Python操作SQL中json格式的问题

1、json中的引号必须使用双引号(在mysql中双引号和单引号可以互换,但不可混合使用,需成对出现。)mysql支持存储json格式数据,但是写入时引号必须使用双引号,否则出现下述错误:pymysql.err.OperationalError: (3140, ‘Invalid JSON text: “Missing a name for object member.” at position 1 in value for column ‘reviews_2020_copy1.s_index_tes

2021-02-19 10:08:58 4554

原创 TensorFlow2(版本2.5.0)学习笔记(含keras_bert、W2V)

1、设置CPU/GPU运行环境:指定使用CPU:import tensorflow as tftf.debugging.set_log_device_placement (True) # 设置输出运算所在的设备cpus = tf.config.list_physical_devices ('CPU') # 获取当前设备的 CPU 列表tf.config.set_visible_devices (cpus) # 设置TensorFlow的可见设备范围为cpu2、tf定义变量

2021-02-03 14:20:26 4402 3

原创 模拟windows键盘、鼠标等操作模块:pywin32

以下操作可以模拟对鼠标键盘的一系列顺序操作。1、 将内容复制到剪切板:# 将字符串text复制到剪切板win32clipboard.OpenClipboard()win32clipboard.EmptyClipboard()win32clipboard.SetClipboardText('text')win32clipboard.CloseClipboard()2、 鼠标定位当前页面位置win32api.SetCursorPos([200,370]) #数值[水平位置,垂直位置]3、

2021-01-21 13:39:12 4552 7

转载 服务器远程虚拟控制台设置

Dell服务器远程虚拟控制台设置:转载

2021-01-06 10:40:46 672

原创 爬虫中的“句柄无效”错误和selenium.common.exceptions.ElementClickInterceptedException

1.使用selenium爬虫报错:OSError: [WinError 6] 句柄无效原因:多次爬虫后没有成功关闭chromedriver.exe,导致后台含有多个chromedriver.exe 进程。解决: 爬虫程序结束后使用driver.quit()2.使用selenium爬虫时,find到的元素在click时报错:selenium.common.exceptions.ElementClickInterceptedException具体错误信息:selenium.common.excepti

2020-12-30 17:07:39 791 6

原创 Python 中的 修饰符(@classmethod,@property)

Python类中,@ classmethod 修饰符对应的函数不需要实例化,不需要 self 参数,但第一个参数需要是表示自身类的 cls 参数,以用来调用类的属性,类的方法,实例化对象等。但是在类的其他函数中调用时依然需要用self,如下类:class ToMysql: def __init__(self, sql_host, sql_user, sql_passwd,sql_db_name): self.sql_connect=pymysql.connect(host=sql

2020-12-22 16:32:43 2039

原创 Python环境及模块安装、调用等问题——环境设置、导出、pip安装模块等

使用pip安装Python模块时,出现Fatal error in launcher:问题:解决:使用pip时前面加入python -m pip install model_name如:

2020-12-21 10:00:01 3733 2

原创 可爱又幸运的柴柴第一篇博客

说在前面的话(俗称序)这是我的第一篇博客,我打算开始好好学习Python以及机器学习、深度学习了,分享才能进步。一起监督、一起进步啊。顺便记录一下最近的工作心得~最近一直在mysql、kbase和Excel文件之间往返,虽然中间学到了一些数据获取、数据处理统计和存储的知识,但是还是觉得空缺了一些啥。说实话,我不是很喜欢最近一直忙碌的工作内容,正好看公众号的时候接触了一个新词“CRUD BOY”,不想一直做一个“crud girl”,呜呜呜……,希望多接触一些算法和模型。从昨天开始现在的工作内容终于告

2020-12-18 08:29:45 126 2

词向量训练实战-相对位置编码原作

词向量训练实战-相对位置编码原作

2023-12-19

LLM预备知识-attention is all you need

LLM预备知识-attention is all you need

2023-12-11

软考高项经验分享-做题集+论文素材集(本人23年于北京已过)

两次软考高项经验总结,包括自己整理的上下午做题集和论文素材。

2023-09-06

超详细23年软考笔记(本人于北京已过)

记录了软考高级的全部重点内容: 包括信息、信息系统、信息系统管理、项目的各种基础知识; 还有五大过程组+十大知识领域; 除此之外,还包括各种法律法规的考点总结,项目管理、项目变更管理、项目配置管理、合同管理、知识管理、项目集管理、项目组合管理等等。

2023-08-28

samba的rpm离线安装文件

解压后用于离线安装,使用rpm安装命令。

2022-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除