自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 python获取当前文件路径

python获取当前路径import os,sys使用sys.path[0]、sys.argv[0]、os.getcwd()、os.path.abspath(file)、os.path.realpath(file)sys.path是Python会去寻找模块的搜索路径列表,sys.path[0]和sys.argv[0]是一回事因为Python会自动把sys.argv[0]加入sys.path。...

2019-08-08 15:06:38 804 2

原创 网易主观题-答案记录

根据要求对文本进行分类(1)分类主要是运用机器学习或着深度学习技术根据不同类别数据的定义将数据分到不同的类别中。它可以解决人工标记数据的繁琐,也可以在信息检索、精确推荐等领域为社会带来便利。(2)数据获取-》数据预处理-》特征工程-》数据集划分-》模型选择-》模型评估(3)模型选择。文本分类较少使用传统的机器学习算法,因为需要人工从文本中提取特征,一方面人工提取到的特征较少,另一方面人工提取...

2019-08-02 20:32:04 400

原创 Pycharm Unittests模式解决

看了很多篇博客,都是说出现这种情况的原因是什么,即程序中出现了以test()或者_test()的函数命名,但是提出的解决方案本人都试了,没有用…也可能是我姿势不对…自己捯饬发现了解决方案。记录一下。首先通过这个进入Configurations,如果你的是Unittests的话,此时应该是这样的(…忘记截图了,就当已经看到了~)然后通过右上角的“-”将“Python”下的文件全部删除不要...

2019-07-20 20:41:00 804

转载 6种分词工具的效率、效果对比

转自:https://www.jianshu.com/p/575fd73ce379六种分词器使用建议:对命名实体识别要求较高的可以选择HanLP,根据说明其训练的语料比较多,载入了很多实体库,通过测试在实体边界的识别上有一定的优势。中科院的分词,是学术界比较权威的,对比来看哈工大的分词器也具有比较高的优势。同时这两款分词器的安装虽然不难,但比较jieba的安装显得繁琐一点,代码迁移性会相对弱一点...

2019-07-05 09:50:10 4305

转载 一文理解KMP-BM-Sundy

转自大神https://blog.csdn.net/v_july_v/article/details/7041827引言    本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP,思路混乱导致写也写得混乱。所以一直想找机会重新写下KMP,但苦于一直以来对KMP的理解始终不够,故才迟迟没有修改本文。然近期因开了个算法班,班上专门讲解数据结构、面试、算法...

2019-06-30 10:56:57 150

转载 unbuntu pip 无法安装包的问题 需要使用sudo权限

参考:https://blog.csdn.net/ignoreyou/article/details/81079304更新软件源sudo apt-get update1、安装pipsudo apt-get install python-dev python-pip2、安装制定版本的tensorflow例如安装1.3版本sudo pip install tensorflow==1....

2019-06-05 15:09:57 791

转载 pandans.read_csv()和.to_csv()方法中的encoding参数问题

参考:https://www.cnblogs.com/maoguy/p/6807941.html在含有中文编码的情况下,to_csv()方法的encoding参数默认为"gbk",而read_csv()方法的encoding参数默认为"utf-8",所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。所以以我自己...

2019-06-05 10:39:03 4895

原创 实战python3中的正则表达式

python中的正则表达式(re模块)基本语法讲解链接:https://www.cnblogs.com/tina-python/p/5508402.html实战经验1、所有中文的unicode码的范围是[\u4e00-\u9fa5];2、findall()时,正则表达式中每一层()包含的那些所能匹配到的元素会被放在一个通道,即一个tuple中;3、正则表达式写的不合适,可能会因为文本中...

2018-11-23 11:05:25 104

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除