自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 DataFrame的各种实用操作

摘要:强大的pandas库,函数功能繁多,其中的Dataframe更是有百般神通,基本能满足数据处理的绝大部分要求,值得一学。总结一下的Dataframe的插入、删除重复数据等功能 。基础创建dataframeimport pandas as pd df = pd.DataFrame([ [1, 2,'河南','郑州','豫'], [4, 5,'河北','石家庄','冀'],

2020-12-02 13:45:12 1049

原创 sklearn中的MultiLabelBinarizer函数详解--构造多标签数据的Label

摘要:多标签分类任务中,总要构造模型输入数据-多标签的Label,MultiLabelBinarizer函数提供了许多的方便,轮子不造也是要学一学的。 In [3]: from sklearn.preprocessing import MultiLabelBinarizer ...: mlb = MultiLabelBinarizer(classes = [2,3,4,5,6,1]) # 注意这里加了classes参数 ...: mlb.fit_transform([(1, 2),.

2020-09-23 13:32:27 5162

原创 算法第一步:数据集分割

摘要:对于算法工程师,拿到数据经常要做的事,就是将数据分割成训练集或测试集便于使用,今天就总结下一般分割数据集的几种方法。①数据格式Dataframe,数据分割import randomdata = pd.read_csv("./dataNN.csv",error_bad_lines=False)data = np.array(data)random.shuffle(data)#随机打乱#取前90%为训练集alldata = [d[0] for d in data]df1=data[

2020-09-14 17:22:01 1117

原创 动态规划类型总结,GO!

摘要:动态规划是一个经典算法问题,其实解题也是有一定技巧跟规律的,总结一下,GO!

2020-08-10 10:31:54 193

原创 Python中的命令参数解析模块argparse

摘要:argparse命令行参数解析模块,简单记下常见的基本操作一般用argparse解析命令行参数,总是以下几行代码,也基本够用三个步骤:创建ArgumentParser() 对象、添加参数、解析参数import argparseparser = argparse.ArgumentParser() # 创建ArgumentParser() parser.add_argument("x", help="横坐标",type=int) # 添加参数parser.add_argumen.

2020-08-09 15:53:07 147

原创 每一个程序员都逃不过的正则

摘要:正则表达式,人人必备啊,别问,冲!import re text = 'assa(312fsfds)das'# 匹配括号内的数字pat = re.compile(r'[(](\d*)[)]')repat = re.findall(pat, text)

2020-06-18 17:09:30 213

原创 关于TF-IDF

摘要:TF-IDF是一个简单而又十分实用的统计算法。TF-IDF:TF*IDFTF=

2020-06-10 20:01:02 311

原创 dict的几种形式及dict添加值的几种方式

摘要:普通字典,有序字典,dict添加键值对,添加普通dictdict = {'A':'a'}# 添加值dict[B]='b'顺序dict:即字典中存储顺序能保持跟添加时的顺序一致import collectionsdict={}dict = collections.OrderDict() # 普通字典转化为有顺序字典d1['a']='A'd1['b']='B'd1['c']='C'for k,v in d1.items(): print k,v# 结果跟.

2020-06-05 19:49:28 3091

原创 数据分析:SQL常用操作

摘要:SQL作为工作常用的基本技能,不论是算法还是后端都得从数据库取数据,这项基本技能简单通用但一定得熟,总结一些有特点的SQL操作如下。(1)SQL语句的语法顺序:SELECT[DISTINCT] FROMJOINONWHEREGROUP BYHAVINGUNIONORDER BYLIMIT(2)SQL执行顺序FROM:将数据从硬盘加载到数据缓冲区,方便对接下来的数据进行操作。WHERE:从基表或视图中选择满足条件...

2020-06-04 09:49:57 282

原创 命名实体识别(NER)(二):BERT+CRF模型训练

摘要:上篇介绍了数据的标注过程,接下来就是模型的训练了,本文采用BERT+CRF模型进行训练。wait~

2020-05-28 11:47:55 9234 1

原创 命名实体识别(一), 训练数据的序列标注-详细实现

摘要:最近有一笔任务,命名实体识别数据太少,需要自己标注数据,于是从头将NER过程走了一遍,序列标注及NER模型训练。wait~

2020-05-27 20:39:41 6500 6

原创 中文写入出现乱码

摘要:中文数据写入txt出现乱码及解决json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)问题解决:1.首先打开写入文本时添加encoding=‘utf8’进行转码2.写入时将ascii码关闭with open('./test.txt', 'w', encoding='utf8') as f: f.write(json.dumps(dict_data, ensure_ascii=Fa.

2020-05-27 13:08:05 192

原创 JSON,dict,list,tuple写入txt文件及读取

摘要:1.json写入txt及读取import jsonjson1 = open('C:/s/test.txt', encoding='utf8').read() # 读取json格式数据# 这步很重要,一定要用loads载入json数据,这样的j1才为dict类型j1 = json.loads(json1)2.字典写入txtdic = {'姓名':'张三', '性别':'男'}with open('./test.txt', 'w', encoding='utf-8').

2020-05-26 20:04:06 1737

原创 正则表达式

1. ^ 的用法用法一:限定开头[^A]会匹配"An e"中的A,但是不会匹配"ab A"中的A用法二:(否)取反当 ^ 出现在一个字符集合模式的第一个字符时,表取否例子:re。findall(‘[^a-z\s]’,"my 3 sisters") == "3" 表示匹配不是(a到z和空白字符)的字符2. * 的用法...

2020-05-21 17:06:42 159

原创 Linux基本操作大全

1.修改文件名/文件夹名修改文件夹:mv oldFileName newFileNam修改 mv aaa.txt abc.txt2移动文件(1)将/usr/udt中的所有文件移到当前目录(用”.”表示)中:$ mv /usr/udt/* .(2)把当前目录的一个子目录里的文件移动到另一个子目录里 mv 文件名/* 另一个目录(3)移动当前文件夹下的所有文件到上一级目录 mv * ../...

2020-05-19 13:14:24 495

原创 2020计划

2020年鼠年大吉,毕业出来工作的第一年,先给列一个新年计划,打卡记录:列计划三要素:1.具体的,2.实际可执行的,3.量化的希望明年来看的时候是带着骄傲#_#.以上是由Xmind绘制(不得不说这个还是挺好用的,简洁好看)...

2020-01-13 15:24:54 158

原创 深度学习中常见的激活函数

深度学习中有四个常见的激活函数,总是记了会忘,忘了就混了,哎,记录一下。

2019-12-16 15:53:20 270

原创 Anaconda创建、激活、删除虚拟环境

Anaconda是一个很好用的python环境管理工具,也可以方便下载各种python包,及环境管理一般做不同的项目习惯用不同的环境,不想在一个环境里安装各种包,显得很繁杂(而且不同的项目对python包的版本还有规定,不兼容),这时候就需要用到虚拟环境了记录下常见的conda几个虚拟环境指令,方便查用创建虚拟环境:# 创建一个干净的python环境(指定python版本,env...

2019-12-16 11:31:11 264

转载 python 字典 .get

如果dict_instance没有关键字key,则加入关键字key所对应的value,并设置它的值为default关键字参数所对应的值(默认为None)如果dict_instance有关键字key,则返回关键字key所对应的value。...

2019-07-09 14:59:47 117

原创 剑指Offer-牛客网-python

二叉搜索树的第k个结点:# 因为二叉搜索树,故中序遍历后,结果为排序好的Listclass Solution: # 返回对应节点TreeNode def KthNode(self, pRoot, k): # write code here if not pRoot: return None self.r...

2019-06-22 21:42:44 146

转载 二叉树四种遍历方法

1.前序遍历:先访问根节点,前序遍历左子树,前序遍历右子树【中->左->右】2.中序遍历:中序遍历左子树->根节点->中序遍历右子树【从根节点开始(注意并不是先访问根节点)【左中右】】3.后序遍历:从左到右先叶子后节点的方式遍历访问左右子树,最后访问根节点。【逆时针【左右中】】4.层序遍历:一层层滴不多说了...

2019-04-24 20:29:58 1202

转载 李弘毅 机器学习课贴士

课程结构PDF及video对应:https://blog.csdn.net/soulmeetliang/article/details/77461607

2019-04-23 14:08:20 129

原创 目标检测测试视频合集

转自https://blog.csdn.net/ding977921830/article/details/52422641http://www.changedetection.net/http://arma.sourceforge.net/shadows/有各种类型视频,如动态背景,阴影检测,摄像头抖动等。...

2018-11-15 13:21:58 12250 1

转载 python 多重继承之拓扑排序

python 多重继承之拓扑排序https://kevinguo.me/2018/01/19/python-topological-sorting/

2018-04-23 21:20:46 199

转载 cvGoodFeaturesToTrack()寻找角点

函数cvGoodFeaturesToTrack():void cvGoodFeaturesToTrack( const CvArr* image, CvArr* eig_image, CvArr* temp_image, CvPoint2D32f* corners, int* corner_count, ...

2018-04-18 14:09:56 806

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除