![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
编程语言以及工具
lanyuelvyun
互金公司风控算法工程师
展开
-
jupyter notebook —— linux 为远程登录 jupyter notebook 设置密码
linux 为远程登录 jupyter notebook 设置密码原创 2022-04-06 17:05:57 · 1319 阅读 · 0 评论 -
jupyterLab 如何修改字体大小
1、打开jupyterLab,左键单击【Settings】,选择【Advanced Settings Editor】2、在上一步弹出来的页面中,左键单击【Notebook】,然后在右侧的【User Overrides】中进行增删改,这个地方就是自定义字体设置的地方。参考代码如下:{ // Notebook // @jupyterlab/notebook-extension:tracker // Notebook settings. // **************原创 2022-03-02 10:58:24 · 14165 阅读 · 0 评论 -
hive-sql —— 新建空表,并上传数据(本地文件数据、HDFS文件数据)
一般建表的时候要建外部表,这样一不小心删除的话,还能够恢复。1、自己设计表结构,然后上传文件到该表中1.1 新建表,并将本地csv文件上传到该表中(Linux命令行模式下)准备本地文件,一般都是csv文件。1、注意记下该文件的分隔符;2、记下该文件字段名称和字段类型,以及字段顺序!!;3、注意该文件是否有表头,如果有,在下面进行载入空表的时候,表头也会被当做数据传入表中。如果不需要,就把表头去掉,但是注意记下字段顺序;建表写好建表的sql文件,假设命名为create_table.sql,原创 2021-10-25 15:39:50 · 2318 阅读 · 0 评论 -
pandas 小技巧——如何生成pmml模型文件
# 生成pmmlfrom lightgbm.sklearn import LGBMClassifierfrom sklearn2pmml import sklearn2pmmlfrom sklearn2pmml.pipeline import PMMLPipeline# 首先,使用某一种算法训练完成得到一个模型main_model = LGBMClassifier()# 将训练好的model包装成pmml格式pipeline = PMMLPipeline([("classifier", ma原创 2021-05-11 14:38:33 · 813 阅读 · 2 评论 -
pandas 小技巧——如何删除行或者列、根据条件删除指定行或者列
使用df.dropDataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=‘raise’)1、labels:要删除的标签,一个或者多个(以list形式);2、axis:指定哪一个轴,=0删除行,=1删除列;3、columns:指定某一列或者多列(以list形式);4、level:索引等级,针对多重索引的情况;5、inplaces:是否替换原来的datafram原创 2021-05-10 20:22:24 · 49356 阅读 · 1 评论 -
pandas 小技巧——pd.read_csv读取没有表头的csv文件、并加上指定表头
我们在读取csv文件的时候,有的时候可能没有表头,或者想换一个表头,该怎么操作?df = pd.read_csv('data.csv', sep='\t',header=None, names=['var_code','var_name','var_desc'])```原创 2021-04-14 17:09:31 · 16118 阅读 · 0 评论 -
pandas 小技巧——dataframe、series如何删除指定列中有空值的行+如何删除多列都为空的行
dataframe、series如何删除指定列中有空值的行+如何删除多列都为空的行原创 2020-12-30 16:44:12 · 8681 阅读 · 2 评论 -
pandas 小技巧——如何将多个df保存在一个Excel的不同sheet里
如何将多个df保存在一个Excel的不同sheet里原创 2020-11-26 16:22:00 · 1971 阅读 · 0 评论 -
pandas 小技巧——修改Series的index名称
1、修改series的index名称2、合并两个series,并对列名进行重命名原创 2019-10-23 19:46:13 · 11288 阅读 · 0 评论 -
pandas 小技巧——空值判断:对整个Series/Dataframe判断+对单独值判断
空值判断:对整个Series/Dataframe判断+对单独值判断原创 2019-10-23 19:44:20 · 18259 阅读 · 1 评论 -
pandas 小技巧——用指定列的“非空值”值去填充另一列的“空值”
举例:有df如下>import numpy as np>df = pd.DataFrame({"name":["apple", "pear", "pig", "dog", "cat"], "number_1":[1,np.nan,3,np.nan,5], "number_2":[np.nan, 2,3,4,5]})>print(df) name number_1...原创 2019-07-29 15:01:41 · 15364 阅读 · 3 评论 -
python 小知识——strftime()和strptime() 日期获取、格式转换和计算
python 小知识——strftime()和strptime() 日期获取、格式转换和计算原创 2019-07-05 12:16:18 · 9241 阅读 · 0 评论 -
win10的pycharm更新pip出错
我在pycharm的Terminal中,更新pip的时候,出现了以下错误: 原因:可能与最近的Windows 10更新有关。我的版本如下:在cmd中输入msinfo32,回车,可以看到版本信息。 解决办法:直接运行cmd,输入python -m pip install -U pip,就可正常升级pip了。 PS:查到的另外一个解决办法是安装win_unicode_consol...原创 2018-05-15 18:06:29 · 1822 阅读 · 0 评论 -
win10安装jupyter notebook详细步骤+修改工作路径
1、安装:我电脑里python2.7和Python3.4都安装了,在用pip安装jupyter的时候,要指明安装的是哪一版。在cmd中输入。cmd -python27 -m pip install jupyter notebook``2、运行并打开:安装完成之后,在cmd输入jupyter notebook这一步是运行jupyter notebook,如果安装成功,就会在浏览器中成功...原创 2019-06-24 17:35:51 · 19206 阅读 · 1 评论 -
PyCharm v2017 1.5 更改背景颜色、菜单栏字体和大小、代码部分字体大小、自动生成开头的默认代码段
1、工具:PyCharm2017.1.5版;windows平台2、更改背景颜色。打开PyCharm,点击file->Setting->Appearance&Behavior->Appearance在右边的Theme 处选择 Darcula,此时背景颜色就变成了深色。3、更改菜单栏字体和大小(注意:这只是适用于菜单栏)。还是在上面的界面,选中 Theme ...原创 2017-07-19 15:28:44 · 29465 阅读 · 6 评论 -
python 创建并解析XML
建议使用python库中的xml.etree.ElementTree,参考自用 ElementTree 在 Python 中解析 XML(1 )创建XML文件# coding=utf-8try: import xml.etree.cElementTree as ETexcept ImportError: import xml.etree.ElementTree as ETimp原创 2017-08-29 11:56:41 · 936 阅读 · 0 评论 -
python 去除txt文本中的空格、数字、特定字母等
使用场景:需要去除txt文本中的空格、数字、特定字母等。需要修改的txt文本叫做:train.txt 修改之后保存成:train_output.txt# ecoding=utf-8ifn = r"train.txt"ofn = r"train_output.txt"infile = open(ifn,'rb')outfile = open(ofn,'wb')for each...原创 2017-08-09 14:50:54 · 26839 阅读 · 21 评论 -
win7 64位 安装pygame
1、所用Python的版本要和pygame版本一致,我这里Python是win7 64位 2.7 ,所以安装的pygame也得是win7 64位的。2、要用pip进行安装,所以必须要有pip插件,没有就先安装pip。3、下载whl文件。pygame官网上是没有win7 64位的pygame版本的,都是32位的。64位的版本要在这儿pygame‑1.9.3‑cp27‑cp27m‑win_am...原创 2017-08-08 16:18:06 · 2405 阅读 · 0 评论 -
python opencv minAreaRect 生成最小外接矩形
1、方法:使用python opencv返回点集cnt的最小外接矩形,所用函数为 cv2.minAreaRect(cnt) ,cnt是点集数组或向量(里面存放的是点的坐标),并且这个点集中的元素不定个数。2、举例说明:画一个任意四边形(任意多边形都可以)的最小外接矩形,那么点集cnt 存放的就是该四边形的4个顶点坐标(点集里面有4个点)cnt = np.array([[x1,y...原创 2017-08-03 11:05:33 · 133698 阅读 · 22 评论 -
python2.7 小知识——操作中文名文件乱码等编码问题
python2.7 小知识——操作中文名文件乱码等编码问题原创 2019-07-08 17:07:44 · 2792 阅读 · 0 评论 -
pandas 小技巧——set_index()和reset_index()
set_index()和reset_index()的使用介绍原创 2019-07-05 11:27:57 · 5548 阅读 · 0 评论 -
pandas 小技巧——使用时候的“坑”
1、使用字典创建df的时候,如果字典的key只有一个value会报错2、python中字符串的最后一个字符是斜杠会导致出错3、空值判断原创 2019-07-02 11:14:01 · 366 阅读 · 0 评论