Python
文章平均质量分 62
larry233
字节跳动数据库内核研发
本科专研图形学,自学无果,硕士转攻NLP,调参三年,中SCI,后学数据库,偶有所得,自撰一bug,卒。
展开
-
Python快速入门学习笔记(二)
注:本学习笔记参考了廖雪峰老师的Python学习教程,教程地址为:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000使用dict和setdictdict(字典)是Python的内置类型,在其他高级语言中称为map,使用键-值(key-value)存储,具有极快的查找速度。dict的实现原创 2016-06-25 23:32:12 · 332 阅读 · 0 评论 -
Python快速入门学习笔记(一)
本篇文章适合有其他高级语言基础的人群阅读 使用的Python版本为python2.7 使用的编辑器为Sublime Text3世界始于Hello World:print 'Hello world' #打印Hello World,Python中#号表示注释raw_input()函数时系统提供给用户的函数,可以让用户输入字符串,并保存到一个变量中。 如 name = raw_inpu原创 2016-06-25 11:39:13 · 385 阅读 · 0 评论 -
Windows7下为Anaconda添加环境变量
之前在自己电脑上安装过Anaconda,但是当时用的是Python2.7的版本,今天实验室配备好电脑后打算在新电脑上安装使用Python3.6的版本,安装时有个选项可以将Anaconda的环境变量直接添加到电脑中,但是该选项默认没有被勾选且提示说不推荐勾选,理由是勾选之后以后重新安装或卸载会比较麻烦,我一时脑抽就信了该提示没有勾选,结果安装好后输入“conda list”果然提示说“conda不是...原创 2018-07-17 21:21:35 · 22299 阅读 · 11 评论 -
Kaggle入门:使用SVC进行手写数字识别
摘要准备数据调整参数,训练模型得出结果总结摘要本文所使用的数据集来自Kaggle上经典的Digit Recognizer项目。该项目最早是用传统的机器学习方法做的,例如SVC,决策树等,之后随即森林RandomForest的出现显著提升了模型的性能,其后XGBoost以其出色的表现一度制霸kaggle上的诸多项目,这种情形一直持续到神经网络被发掘出来之后,例如...原创 2018-08-16 15:19:57 · 1249 阅读 · 0 评论 -
解决UnicodeDecodeError: 'utf8' codec can't decode byte 0x9c
问题这是在参照Yoon Kim的github实现论文Convolutional Neural Networks for Sentence Classification时遇到的问题。代码中使用的是经过处理的MR数据集。 原代码以二进制形式读取文件,代码形如:with open(file, 'rb') as f: for raw_line in f: ...原创 2018-09-14 15:28:24 · 25194 阅读 · 0 评论 -
Python3跳过第一行读取文件内容
读取csv或tsv格式的文件时,经常需要读取跳过文件头,直接读取文件内容,假定我们要读取的文件格式如下:data.tsvidscorereview15.0This is a good product23.0Not so bad我们只需读取文件数据而无需文件头信息,那么最简单的方法就是打开文件后在循环中判断是否为第一行,是第一行则跳过:with ope...原创 2018-09-30 11:10:23 · 31576 阅读 · 10 评论