自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

三妹的博客

同名公众号:程序媛三妹,请来指教~ 一个希望不断进化的姑娘~

  • 博客(310)
  • 资源 (2)
  • 收藏
  • 关注

原创 写在入职一周年

一、工作二、技术三、CSDN四、生活

2020-07-26 21:37:53 1830 6

原创 微软大佬的校招面试总结

校招面试总结这篇文章是我校招时的回顾和总结,主要是程序员面试相关的整体心得和体会。用六个字总结就是 “早准备,多尝试”。自身情况先说一下自己的情况,本硕都在同一所T2分段985的计算机专业。研究生的时候做了两个深度学习相关的应用以及几个偏工程的项目,没有发上特别好的论文。研二的时候去美国交流了一年,感觉自控制力还是稍稍差点,见识涨了不少,但是研究和学习上还欠缺了一些。9月初回国,没有实习经历...

2020-02-16 22:35:45 6321 5

原创 三妹的2019

我的 2019 大事件是从学生转到职场。不仅身份改变,所处城市、接触的人和事都发生变化,因此整个人可能都不一样了。本篇总结分为以下几个方面:Table of Contents一、工作二、技术三、我与 CSDN四、思想五、看书六、看剧七、网课八、个人影响力一、工作幸运地入职一家小央企,现在已顺利拿到北京户口,很是感恩。虽然违约金很高,但毕竟我也不是打算...

2020-01-07 20:16:58 565 8

原创 自用 VScode 插件推荐

推荐几个常年在我 VSCODE 中存在的好用插件~ 希望能帮到你们啦~1、Highlight String Code这个插件可以在大多数高级编程语言中高亮 SQL,HTML,CSS,JS等,特别适合我这种需要在 Python 文件中写 SQL 的同学~ 以往我在 Python 中写 SQL 的话就会变成一片黄色。。。但是这个插件能自动识别出 Python 脚本中的SQL 部分进行关键字高亮...

2019-10-15 19:54:31 7001

原创 工作中遇到的Excel 奇技淫巧

(今天尝试使用csv 格式的数据复制粘贴进来之后还不是文本格式,但 txt 格式 的文档粘贴进来就没问题,之后细研究)。1、长数字即使整列设置为文本格式,也是双击一个单元,变一个单元展示情况。解决方法:在复制进来数据之前,就先设置好此列为文本格式。

2024-01-03 19:58:04 424

原创 pandas分批读取CSV并分批处理数据

算法工程师要面对的一大主要矛盾:不够用的服务器内存和巨大的训练集数据量之间的矛盾。如果使用pandas处理CSV数据,会先把整个CSV加载到内存之后再处理,所以如果你的CSV文件巨大(其实也不一定非常大,我的数据集只有4、50个G,可惜当时服务器内存只有60多个G了),就要想其他方法了。我之前都是把CSV文件手动切分成10个小文件,再逐个处理。现在觉着这方法太傻了啊。其实pandas 读取CSV文件的函数 read_csv() 中自带两个参数就可以解决:nrows=skiprows=

2022-05-22 10:44:16 2583 1

原创 Linux kill了我的程序,咋回事呢

三妹终于在睡前跑通了程序,美美去睡觉,想着第二天就可以看到结果,我还真是个节约时间小能手,结果第二天一看服务器,啥结果也没有,log也没写出来,程序就莫名其妙结束了,连个报错都不给我。所以我查了网上的几个方法,如何知道Linux kill了哪些程序。以下为三妹亲测的方法和结果:1、egrep -i 'killed process' /var/log/messages或egrep -i -r 'killed process' /var/log提示 Permission denied

2022-05-20 12:05:34 565

原创 几行代码分析TensorFlow训练模型耗时

三妹最近被领导质疑了,他说我模型训练时间太久:你看人家XXX公司,千万级的数量级几个小时就训练好了,你这个快40个小时了,必须得优化,你先看看训练模型时间都花在哪了吧。经过一顿尝试,我要记录一下我觉得最简单高效的方法。目录一、工具二、结果展示三、Show Code四、经验一、工具timeline二、结果展示图片来源:tensorflow性能调优实践 - 简书图片来源:使用TensorFlow训练WDL模型性能问题定位与调优 - 美团技术团队(P..

2022-05-17 15:21:57 2321

原创 Mac切换普通conda和miniforge conda命令

Mac M1芯片已经不支持普通的 conda 虚拟环境安装 TensorFlow了,给配置过程加大了好几个复杂度,悲伤。。如果你有安装问题,请移步我另一篇文章。本篇文章是讲终于求爷爷告奶奶安装完成之后,你的 Mac 里有了原来普通的 conda(一般是Inter) 和 Miniforge conda,那么怎么切换它们呢?1、首先,你需要了解你的两个 conda 的存放路径,输入命令:conda info --envs给你们看看我的展示结果:简单解释一下:我有两个 minif

2022-05-17 14:44:36 2504

原创 pip/conda install加速方法

一、前提shadowsocks代理二、pippip install --proxy http://user:password@proxyserver:portorpip install --proxy http://127.0.0.1:7890# 上条命令中http根据配置的代理调整三、conda$ export http_proxy=http://username:password@proxy:port$ export https_proxy=https://use

2022-05-17 12:23:07 625

原创 Excel如何按行间隔配置背景颜色

三妹看同事发的Excel表格按行间隔的颜色巨好看,而且在数据密密麻麻的时候也给区分行数降低了难度(比如,我现在看的是绿色这一行,那我往后扫很多列的时候不会窜到白色行)。然后我上网找了几个教程,发现他们 Excel 的版本跟我不一样,几乎等于没找到教程,好在我通过蛛丝马迹找到了方法,分享给你们呀。首先,我的 Excel 版本是:下面开始操作:1、首先选中你想要上色的数据,选中条件格式2、新建规则3、点击新建规则后出现下边这个页面:但是,这个时候,我看的教..

2022-04-23 21:12:11 2039

原创 Conda 修改连接镜像

1、修改连接镜像conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config --add channels https://mirrors.tuna.tsinghua.edu.c

2022-03-04 17:59:08 802

原创 Conda 卸载包报错:PackagesNotFoundError: The following packages are missing from the target environment:

一、完整报错二、解决方法使用pip 卸载pip uninstall tensorflow注意,pip 要使用该虚拟环境下的pip以上,问题解决~

2022-02-15 15:17:54 10332 6

原创 Linux Ctrl r 快速查询历史命令并查找符合条件的多条命令

一、问题我知道 Ctrl r 可以输入关键字查找我输入的历史命令,但是当我以为上下剪头是符合该关键字的其他命令时,现实告诉我这是不对的。上下剪头表示的是符合关键字条件的命令的上下条命令,不一定是啥了。二、解决方法如果想找符合筛选条件的多条命令:1、输入 Ctrl r2、输入关键字,如 scp3、继续按 Ctrl r,直到找到你想要的命令为止。以上,问题解决~...

2022-02-15 12:00:14 1891

原创 python 手动清除内存gc

import gcgc.collect()清除内存,尽量避免主动调用gc.collect()除非当你new出一个大对象,使用完毕后希望立刻回收,释放内存。python里gc.collect()命令可以回收没有被使用的空间,但是这个命令还会返回一个数值,是清除掉的垃圾变量的个数。...

2022-02-06 22:11:06 6279

原创 Linux screen 常用命令(超好用)

1、新建screen -R yi2、退出screen Ctrl a d3、看现有screen 环境screen -list举例:There is a screen on:95828.yi (Detached)1 Socket in /var/run/screen/S-xxx4、删除screen -XS 95828 quit5、强制进入某screen 环境screen -D -r yi补充:用 screen -ls, 显

2022-02-06 21:25:35 1756

原创 虎年壁纸,一定有你喜欢的那一张

妈呀,CSDN为啥不支持多图上传。。。我的收藏倾情相授

2022-02-02 09:46:21 352

原创 Maxcompute修改列名

修改列名及注释修改非分区表或分区表的列名或注释。命令格式 alter table <table_name> change column <old_col_name> <new_col_name> <column_type> comment '<col_comment>'; 参数说明 table_name:必填。需要修改列名以及注释的表名称。 old_col_name:必填。需要修改的列名称。old_col_name必须是已存

2022-01-25 16:07:39 2723

原创 Linux tee 命令执行Python脚本不好使

1、啥是 tee 命令?如果你想把运行的内容同时显示在终端和重定向到文本里,那么就可以使用 tee 命令来实现2、遇到问题为啥我执行 Python 脚本的时候就不行呢?首先我确定我的Python脚本没问题,不加 tee 命令的时候也能重定向到文本中,所以我断定是 tee 命令我没用对。3、解决方法加个 -u完整命令如下:python -u example.py | tee > results.txt以上,问题解决~...

2022-01-21 15:58:53 1564

原创 Linux Tensorflow安装报错 Cannot uninstall wrapt

安装 Tensorflow 过程中遇到这个问题解决方法:pip install wrapt --ignore-installed再继续安装 TensorFlow 即可

2022-01-21 15:50:20 1771

原创 linux 文件夹内容太多,如何显示看不到的上半部分

方法一:显示开始的20行内容ls | head -n 20方法二:ls | more会直接显示一屏,之后按回车键会不断展示新内容,缺点是往下滚动得太慢了。。。方法三:将内容重定向到文本里,例如ls -l > test.txt之后编辑文本看你想要的内容。...

2022-01-21 15:47:17 4680

原创 pip 的国内镜像(下载超级快)

pip国内的一些镜像阿里云Simple Index 中国科技大学Simple Index 豆瓣(douban)Simple Index 清华大学Simple Index 中国科学技术大学Simple Index提示:若担心安全问题请使用HTTPS加密源修改源方法:临时使用:Linux Mac Windows 通用命令可以在使用pip的时候在后面加上-i参数,指定pip 源pip install scrapy -i https://pypi.tuna.tsingh...

2022-01-21 11:41:15 6204

原创 MaxCompute查看分区表某个分区生成时间

查看分区信息查看某个分区表具体的分区的信息。命令格式 desc <table_name> partition (<pt_spec>); 参数说明 table_name:必填。待查看分区信息的分区表名称。 pt_spec:必填。待查看的分区信息。格式为partition_col1=col1_value1, partition_col2=col2_value1...。对于有多级分区的表,必须指明全部的分区值。 使用示例 --查询分区表sale_detai

2022-01-17 20:19:19 1214

原创 conda快速安装graphviz画出决策树

命令:conda install python-graphviz 比之前的方法简单太多:pip install graphviz/ brew install graphviz 安装Graphviz2.38 可行性包 add ...\Graphviz2.38\bin to PATH

2022-01-05 20:11:07 1043

原创 清华大学开源软件镜像站链接

pypi | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

2021-10-21 16:10:15 570

原创 配置服务器:Linux 使用 conda 我所遇到的所有坑

熟悉三妹的小伙伴可能知道,三妹最近跳槽到了互联网,成为了 BAT 中的一个小小程序媛,因此 Mac 呀、服务器呀都是新的,如同一张白纸要被我配置成我喜欢的样子。坦白说,我是相当不喜欢配置服务器环境的,坑太多。但是,作为21世纪新时代程序媛,天不怕地不怕,坚决不能被 bug 打倒。服务器基本上都是一个套路,大家共用一个服务器,但是每个人都有自己的路径,只能在有权限的路径下为所欲为,当然了,配置的东西也只限于自己用。所以,本文记录了我配置服务器过程中,遇到的所有坑以及我如何最终填上坑的。

2021-10-21 15:50:28 7047 3

原创 git 新建本地分支、远程分支并关联push代码

1、查看本地、远程所有分支git branch -a2、新建本地分支git branch newbranch // 新建本地分支git checkout newbranch // 切换到新建的分支// 合并上述两个命令如下git branch -b newbranch3、新建同名远程分支git push origin newbranch:newbranch //创建了一个远程分支名字叫 newbranch4、关联本地分支、远程分支git push --set

2021-10-18 11:38:03 875

原创 如何不使用 ndarray 默认的科学计数法格式

在程序的开头加上两句话:import numpy as npnp.set_printoptions(suppress=True)

2021-10-18 11:01:12 841

原创 Python typeError: a bytes-like object is required, not ‘str’ Solution

目录一、需求二、报错三、解决方法一、需求调接口解析其中 dis 字段。二、报错Python Typeerror a bytes-like object is required not ‘str’这句话的意思是“类型错误:需要类似字节的对象,而不是字符串”。三、解决方法在需要解析的字段前 加上 b原代码:if 'dis' in response: dis = response.split('<dis>')[1]现代码:if b

2021-10-01 11:49:38 254

原创 最简单 pandas 多进程 方法 pandarallel

虽然 Python 有自己专门实现多进程多线程的包,可是用于 pandas 中却不是很好用,其实 pandas 有自己实现多进程的包,超级好用。一、初次见面pandarallel 包GitHub - nalepae/pandarallel at v1.5.2A simple and efficient tool to parallelize Pandas operations on all availableCPUs - GitHub - nalepae/pandarallel at v1.5.

2021-10-01 10:04:56 3907

原创 Mac 查 Python路径

which python如果想查具体版本的Python路径的话,把版本也写在后边:which python3.8以下为转载内容,与君共享啦:Mac系统自带python路径为/System/Library/Frameworks/Python.framework/Version 这里可能会有多个python版本,里面Current存放系统当前python版本,进入Current/bin,在终端输入./python --version即可查看系统当前python版本(注:若使用python -.

2021-09-28 15:02:35 4866 2

原创 如何在Mac Finder中查找/Usr 路径?

一、问题不知道你们是否和我一样,有时候需要查找 /Usr 路径下的文件夹,但是直接在 Finder 中找不到这个路径,咋办呢?二、解决方法其实这是因为 /Usr 路径被隐藏了,只需要一句命令即可解决:在Finder 中点击快捷键 Cmd+Shift+G在弹出的目录中填写/Usr/bin 就可以了。Mac的这个bin目录,是一个已经包含在环境变量里的目录,程序放在里面或者链接到里面就可以在终端里直接执行。以上,问题解决...

2021-09-28 11:55:49 4330

原创 pandas读excel类型文件报错: xlrd.biffh.XLRDError: Excel xlsx file; not supported

一、问题pandas 读取 Excel 文件(.xlsx)时报错如下:raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')xlrd.biffh.XLRDError: Excel xlsx file; not supported二、报错原因xlrd 版本过低,只支持读取 .xls 文件三、解决方案1、方法一先卸载低版本的 xlrd,然后安装新版本:pip uninstall xlr.

2021-09-27 19:33:15 7807

原创 2021 程序媛跳槽记:百度阿里字节等各大厂面经篇

跳槽系列文章:程序媛三妹:2021 程序媛跳槽记:必刷LeetCode算法题(附解题报告)程序媛三妹:2021 程序媛跳槽记:学习计划篇(已收获字节等offer)三妹我粗略地算了一下,前前后后面试差不多两个月,总共将近 30 场面试吧,挑点典型的面试题记下来。公司目录: 中国人寿 美图秀秀 MOKA 美团 贝壳 小马智行 阿里 字节 百度 一、中国人寿一面:1、项目相关1)用

2021-09-24 21:36:29 510

原创 如何关闭Word自带的首个字母大写功能

三妹的 Word 版本是:该版本自动打开了句首字母大写功能,但是我因为要记录一些代码相关的东西,根本不需要自动大写,大写之后反而不是我的代码了,所以急需把它关掉。步骤如下:1、找到菜单栏中的 ”工具“,里面有自动更正选项。2、自动更正中第三行 :“句首字母大写”,前面的对号取消掉。以上,问题解决~...

2021-09-16 17:22:50 4132

原创 微软招人啦

虽然三妹本人很菜,可是小伙伴们都很强,最近有个微软的小伙伴希望三妹帮忙发个他们的招聘信息,你们知道的,我这么慷慨热心的人,怎会拒绝呢?所以不管你是校招还是想换工作的社招同学,如果你厌倦了内卷 996,想要一个 work life balance 是生活;又或者你对外企也有一份执念想亲自体验,统统看过来啦。以下是正式内容哦:微软 Azure Machine Learning 团队开始招聘啦。我们团队主要负责 Azure 机器学习平台的建设和维护,涵盖了前端、后端开发到深度学习框架、分布式存储、

2021-08-29 19:46:33 264

原创 2021 程序媛跳槽记:学习计划篇

坦白说,我这个人不算聪明,基础也不咋样,这次跳槽我一开始是很没信心的,甚至想把这次尝试当做试水,如果受打击太多,就再修炼半年,明年过完年参加金三银四的跳槽旺季。好在幸运了拿到了几个大厂的 offer ,比如美团啊,字节啊,阿里啊等等,所以我觉得像我这样的菜鸡都能做到,那大家也可以。我把这次跳槽计划命名为:牛宝宝计划。一、战略方针有的人适合突击战,有得人适合持久战,我属于后者。我自认为自己的耐力还可以,所以我一开始就告诉自己:我的基础薄弱,也没有大厂经历,这次跳槽不要急于求成,找到自己的问题抓

2021-08-07 22:52:12 2145 7

原创 2021 程序媛跳槽记:必刷LeetCode算法题(附解题报告)

废话少说,分享我近期为了跳槽刷的题目和解题报告,有些真的是面试原题(感谢上天赐予我的幸运),有些是面试时考到的我没答太好后来补上的,希望刷此题的人都能 offer 多多啦~P.S. 这是我跳槽记系列的第一篇,后续还会有我的真实面经、学习计划以及踩坑经历,互联网人就是这样互帮互助~以下是正经分享:我自己整理的是相当费劲,我决定之后每次跳槽都要照着这个笔记刷一遍。。。虽然我只刷了 七、八十道题,但我真的是反复刷,因为忘得也确实太快了,给

2021-08-07 22:47:42 383 2

原创 在线绘图网站文图使用教程

之前三妹推荐过五个好用的工具(传送门:),其中提到了文图,它支持在线绘图,只要把数据复制粘贴过去,就能得到几乎所有常见的类型图。本篇就是文图的使用教程。四、特殊情况处理如果你指定了列名,却没有传数据,文图也会把正常的列画图,未输入的数据列也会用灰色提示:上图中我用黄色框出来的部分表示我有三列指定了列名却没传数据,分别用方框、三角、菱形表示每个数据点。...

2021-05-12 21:15:01 2993

原创 Mac免密登录服务器下载文件+Mac设置定时任务

一、需求三妹我想在本机(Mac)上设置个定时任务,为什么不在服务器上设置呢,因为有好多用于分析的 Python 包服务器上没有,而我还没有服务器的装包权限,总之我觉得配置两块定时:一部分在服务器上读取 hive 表生成 CSV 文件,一部分在本机,每天去服务器拉取数据。二、问题拆解1、免密登录服务器既然是想要设置定时任务来完成每天去服务器读取数据,肯定不是我人工每天到时间了去输入密码才能下载数据吧。所以第一步要解决的问题就是免密登录服务器。所谓的免密登录,就是要让服务器信任你的机器,

2021-02-26 10:27:34 618

python-louvain-readthedocs-io-en-latest.pdf

用Python包实现对图(Graph) 的社区性质的分析,判断图是否可划分不同社区等等

2021-02-16

Delay_causality_network_in_air_transport_systems.pdf

Delay_causality_network_in_air_transport_systems.pdf

2020-12-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除