![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习
ninnyyan
自强
展开
-
Markdown基本语法
下面是markdown的一些常用的例子,左边是在markdown中写的内容,右边是效果。下面也是用图中的内容显示出来的效果,csdn是自带markdown写作模式的。Markdown基本语法二级标题三级标题加粗斜体高亮删除线\单行代码\ 引用表格: Name Academy score Harry Potter...原创 2018-04-09 16:04:58 · 198 阅读 · 0 评论 -
【opencv】 摄像头拍摄视频
使用笔记本自带的摄像头录制视频并保存来源:opencv documentationcap = cv2.VideoCapture(0)# Define the codec and create VideoWriter objectfourcc = cv2.VideoWriter_fourcc(*'XVID')out = cv2.VideoWriter('output.avi',fourc...转载 2018-12-17 14:56:08 · 417 阅读 · 0 评论 -
fasttext学习:从文本名称分辨性别
通过sklearn建立分辨性别的模型后,再使用fasttext做同样的事情,对比两个模型的效果。 用sklearn建模的博客链接在此处:链接fasttext是由facebook出品的一个用于文档识别的模型。属于Neural Network的范畴。1.Theory这篇论文介绍了fasttext模型的思想。Bag of Tricks for Efficient Text Classi...原创 2018-07-05 16:02:48 · 2009 阅读 · 1 评论 -
【Python】python实现树结构
树是我们常见的一种一对多的数据结构。最近为了处理一些事情,写了一颗三层的树。每层的子节点数目均不确定,动态添加。 为了方便管理,写成了嵌套树。“`第一层树,创建树时必须指定根结点,不支持创建空树整颗树存储在tree_dict中,key为root,value为children_dictchildren_dict中存储所有的子节点,个数不确定,动态添加class ...原创 2018-07-11 14:40:11 · 8479 阅读 · 0 评论 -
数据处理:用pandas处理大型csv文件
在训练机器学习模型的过程中,源数据常常不符合我们的要求。大量繁杂的数据,需要按照我们的需求进行过滤。拿到我们想要的数据格式,并建立能够反映数据间逻辑结构的数据表达形式。 最近就拿到一个小任务,需要处理70多万条数据。我们在处理csv文件时,经常使用pandas,可以帮助处理较大的csv文件。pandas 中处理CSV 文件的函数主要为read_csv() 和to_csv()这两个,其中r...原创 2018-07-11 14:09:04 · 14807 阅读 · 1 评论 -
sklearn学习:性别分辨模型2: 优化和评估
上一篇博客中,写到训练了一个分辨性别的模型。用自己分类的数据进行模型训练时,准确率达到90%以上。 但是用另一个训练数据集,准确率只有80%多一点。因此在优化和评估方面做了一些工作。1.优化1.清理数据把所有预测错误的数据全部找出来进行观察,发现有些数据并不是目标特征数据,这里使用的是商品的brand,但数据集中存在不是brand的信息,因此要进行剔除。等等类似的工作。2.优...原创 2018-06-06 16:53:49 · 969 阅读 · 0 评论 -
【Python】十进制转二进制
base = [str(x) for x in range(10)] + [ chr(x) for x in range(ord('A'),ord('A')+6)]def dec2bin(string_num): num = int(string_num) mid = [] while True: if num == 0: break ...转载 2018-06-06 16:27:59 · 13765 阅读 · 0 评论 -
sklearn学习:训练一个分辨性别的模型
最近在学习sklearn,动手实现了一个根据名称分辨性别的模型。 感觉还是蛮有趣的。 这个是参考的链接(英文),Working with Text Data仿照这个教程上的步骤一步步建立自己的模型。Version11.准备训练数据将csv中的record读入,使用pandas。为了在文本文档上执行机器学习,我们首先需要将文本内容转换为数字特征向量。 可以将名称分为单词袋(...原创 2018-06-06 14:27:13 · 1875 阅读 · 0 评论 -
sklearn学习:roc_auc曲线和 metrics.roc_auc_score
1.概念ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣。AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。使用AUC值作为评价标准是因为很多时候...翻译 2018-06-06 11:33:57 · 31424 阅读 · 0 评论 -
如何找到python pip包的安装路径 mac
如何找到python pip包的安装路径 mac今天遇到一个问题,要找到pip安装的包的路径,之前一般都是用pip list这些命令看看有哪些安装包,但不清楚安装路径在哪里。查了好久居然没查到。后来知道了这个方法。如图,我用的是python3, 所以在当前目录下运行python3,然后import要查看路径的包,再输入包的名称,即可查看安装路径了...原创 2018-05-28 17:38:43 · 31249 阅读 · 2 评论 -
sklearn学习:train_test_split
train_test_split 是sklearn中一个用来随机分割train,test数据集的工具sklearn.model_selection.train_test_split(*arrays, **options)[source]需要注意的参数包括,1. test_sizetest_size的参数类型可能有多种: 如果为float型,需要介于0.0到1.0之间,表示要分...原创 2018-06-04 14:43:08 · 1339 阅读 · 0 评论 -
【Python】Numpy:如何找到list中的np.nan值
这个问题源于在训练机器学习的一个模型时,使用训练数据时提示prepare的数据中存在np.nan报错信息如下L: ValueError: np.nan is an invalid document, expected byte or unicode string. 刚开始不知道为什么会有这个,后来发现是list中存在nan值下面是找到nan值的方法: 简单找到:import nu...原创 2018-06-04 11:12:15 · 34994 阅读 · 0 评论 -
【Python】string和bytes数据类型之间的转换
一个很简单的问题,但是曾经因为这个很闹心了一会,把简单的解决方案记录在这里,方便日后查看。string = 'adidas NMD_XR1 Shoes - Grey | adidas UK'print('type of string: ',type(string))# string to bytesnew = string.encode(encoding='unicode-escape'...原创 2018-06-04 10:47:38 · 1723 阅读 · 0 评论 -
TCP套接字编程(nltk语句分割)
实现了一个使用TCP相互通信的服务器和客户端程序。该服务器提供了分配服务部分的语音标签,从客户端接收的句子,并将结果返回给客户端。该客户端读取存储在一个文本文件,然后发送句子到服务器的英语句子。收到结果后,应打印到标准输出。代码如下:server.pyimport socketimport sysimport nltkimport sslimport json...原创 2018-05-03 13:25:23 · 257 阅读 · 0 评论 -
[RuntimeError]: Unable to open dlib/shape_predictor_68_face_landmarks.dat --dlib.shape_predictor()
代码:import dlibpredictor = dlib.shape_predictor("/home/lyz/openface-master/demos/web/../../models/dlib/shape_predictor_68_face_landmarks.dat")dlib.shape_predictor()仅依赖于该dat文件的路径,与其他无关因此当出现该问题之后,可以...原创 2019-06-24 11:25:56 · 21763 阅读 · 18 评论