自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

三妹的博客

同名公众号:程序媛三妹,请来指教~ 一个希望不断进化的姑娘~

  • 博客(29)
  • 资源 (2)
  • 收藏
  • 关注

原创 自用 VScode 插件推荐

推荐几个常年在我 VSCODE 中存在的好用插件~ 希望能帮到你们啦~1、Highlight String Code这个插件可以在大多数高级编程语言中高亮 SQL,HTML,CSS,JS等,特别适合我这种需要在 Python 文件中写 SQL 的同学~ 以往我在 Python 中写 SQL 的话就会变成一片黄色。。。但是这个插件能自动识别出 Python 脚本中的SQL 部分进行关键字高亮...

2019-10-15 19:54:31 6974

原创 第一个 1024 程序员节

今年是我入职第一年,所以今天是我过得第一个正经程序员节。我想把它叫做格子衫节,因为不知什么时候开始格子衫和程序员就这样不离不弃。今天特意穿了男友的格子衫来上班,应应节气(其实是因为公司说穿格子衫有礼物哈哈暴露了)在 CSDN 上开始写博客一个多月,看到太多大佬的博客文章自愧不如,也越来越自责为什么加入 CSDN 六年了我都没有好好记录技术,如果一开始就走正路现在也应该访问量好多万,没准...

2019-10-24 13:22:16 175

原创 Python return 语法那些坑

刚刚行政部门同事来问 Python 里 return 的用法,说他自己敲代码的时候跟网课讲得不太一样,问我为什么,我整理之后记录如下。(BTW,连行政同学都在学 Python了,这是要抢饭碗啊啊)情况一、1、三个颜色的分别是三个输出,r = fun() 首先 执行 fun(),执行的过程中 print 了 test,然后返回值给 r;2、由于 r = fun() 整个语句是没...

2019-10-22 21:01:41 5977

原创 CSDN 申请博客专家方法及链接

申请链接为:http://blog.csdn.net/experts/rule.html以上是申请博客专家链接及申请资格,虽然还远达不到标准,Mark 一下,作为激励,加油三妹~

2019-10-22 11:00:44 536 5

原创 我喜欢的话(4)

我一直相信,如果你爱上一个人,你一定会越来越爱他,就像你发现一处藏宝之地,越往深挖,越有惊喜,你就越舍不得离开。—— 摘录知乎回答陈幺鸡...

2019-10-21 14:14:36 323

原创 正则实现 20190723 20190724 20190725 改为 2019-07-23 2019-07-24 2019-07-25

一、需求CSV 文件中时间的初始表示为20190723, 20190724, 20190725,(注意带有逗号)类型,将其格式化为2019-07-23, 2019-07-24, 2019-07-25,二、使用工具VSCODE三、正则实现CTRL + F 跳出替换功能:查找部分填写:2019072([345]),替换部分填写:2019-07-2$1,...

2019-10-21 13:24:09 184

原创 Pandas pd.merge() 报错:ValueError: You are trying to merge on int64 and object columns.

1、需求:df1 和 df2 按照 A, B 两列进行合并,假设 df1 为 A B C 三列,df2 为 A B D 三列,将其中A B 相同的列 merge 为 A B C D 四列。outfile = pd.merge(df1, df2, how='left', on=['A','B'])2、用 pandas 合并两个 CSV 文件时,报错信息如下:ValueError...

2019-10-21 13:15:20 12048

原创 Oracle 数据库表中截取 两个 | 之间的内容,substr() instr()

一、需求Oracle 数据库表中截取 两个 | 之间的内容二、使用函数1、substr()  格式1:substr(string string, int a, int b);  格式2:substr(string string, int a) ;解释: 格式1: 1、string 需要截取的字符串 2、a 截取字符串的开始位置(注:...

2019-10-20 15:42:29 12102

原创 Pandas 合并多个 (300多个) Excel 文件,并输出为 CSV 文件

爬虫同事帮忙爬了个网站信息,网站上有300多页,每页生成一个 Excel 文件,为方便处理,我需要合并成一个 all.csv 文件。不废话,上代码:import pandas as pdimport osdef process_data(): folder_path = r'/Users/example' # 要拼接的文件夹及其完整路径,注意不要...

2019-10-20 15:20:58 2127 5

原创 报错:pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 7, saw 2

Pandas 合并 CSV 文件时报错如下:pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 7, saw 21、报错原因中间字符串有错误,因为 read.csv 默认分隔符是“,”,比如前面都是一行没有“,”,后面突然出现一行有“,”,这时这行数据就会变成两列,前面...

2019-10-20 15:01:07 37184 15

原创 MacBook中如何删除.DS_Store文件?

进入要删除的.DS_Store文件的目录下,执行如下命令:sudo find ./ -name ".DS_Store" -depth -exec rm {} \; 但是注意:最好不要删除.DS_Store文件。

2019-10-20 14:53:30 666

原创 Foxmail 设置自动落款签名

刚来到公司,组里前辈就建议用 Foxmail 收发邮件,今天刚刚在 Foxmail 上设置如何自动添加落款签名。由于跟百度搜索到的方法不太一样,可能根据电脑版本不同 Foxmail 设置方法不同,所以记录在博客中,供大家参考~公司配的电脑是MacBook Pro,Foxmail 图标如下。下面进入主题。1、没有找到专门设置的位置,但是可以从如下位置进入设置落款界面:就是最...

2019-10-20 09:26:46 3589

原创 HIVE: create table 与 create external table 区别

内部表与外部表的不同创建外部表需要添加 external 字段。而内部表不需要。 删除外部表时,HDFS中的数据文件不会一起被删除。而删除内部表时,表数据及HDFS中的数据文件都会被删除。...

2019-10-16 13:35:18 9275

原创 linux 命令 ls 与 ls -lrt 的区别

ls-lrt 表示按修改时间倒序列出当前工作目录下的文件。ls-l表示按名称顺序正序列出当前工作目录下的文件。1、ls 表示列出当前目录下的文件。后面的 -lrt 是这个命令的一些选项补充。-lrt 实际上是代表了 "-l -r -t" 这三个选项集合。2、-l -r -t1)-l 表示开启长列表输出,打开了就会输出文件权限、引用计数、所有者、所属组、文件大小、修改日期和文件名...

2019-10-15 20:16:59 32577 5

原创 导入hive表Error: Error while compiling statement: FAILED: SemanticException No files matching path file

将 CSV 文件导入 hive 表时报错:0: jdbc:hive2://10.5.145.113:10000> load data local inpath '/DATA/hdfs/example.csv' into table db.example_table;Error: Error while compiling statement: FAILED: SemanticExce...

2019-10-15 13:26:51 14681 3

原创 Pandas 使用 Lambda 例子及注意事项

# 注意 函数 formula() 一定要有返回值,否则下面 apply 函数不起作用def formula(x): if x in slidetime_dict: return slidetime_dict[x] else: return 15 df['slidetime'] = df.apply(lambda row: formula(r...

2019-10-14 20:55:24 3373

原创 vscode 登出(退出)Linux 服务器命令

1、 ctrl + d2、输入 exit

2019-10-14 10:28:47 4883

原创 Pandas 报错 TypeError: ‘Series‘ objects are mutable, thus they cannot be hashed

一、需求根据原始 CSV 文件的列 A 的值,添加一列 B。二、尝试 11. 将 A 列与 B 列对应的值写入字典 dict,A 列为 key,B 列为 value。2. 将 CSV 文件处理为 DataFrame。3.import pandas as pd# 如果 df['A']存在于 dict_a 中,则取 value,值,否则使用默认值 15dict_a =...

2019-10-12 09:47:23 34229 1

原创 Oracle 表导入 Hive 表

一、需求需要的数据在两个不同 Oracle 数据库中, 且其中一个数据库中的内容有一份一模一样的存在 hive 表中。二、解决办法将另一个 Oracle 表存入 hive 表中。具体实现:1. 将 Oracle 数据导出 CSV 文件:oracle_example.csv,并上传至服务器 /DATA 路径下;2. 先根据原始 Oracle 表结构在 hive 中建立一个新表...

2019-10-11 17:08:44 961

原创 我喜欢的话(3)

“我一点不漂亮,可能你也一样;我从没考过第一名,可能你也一样;我唱歌走音,画画不及格,800米中长跑没达过标,可能你也一样;我曾经加班没有加班费、替老板背黑锅,可能你也一样;我曾被男朋友骗钱还被他甩了,可能你也一样;我减肥从未成功、吃素无法坚持,可能你也一样;那么,我到今天还没被打倒,可能你也一样。”——燕公子...

2019-10-11 14:21:18 158

原创 我喜欢的话(2)

如果快乐很难,那我祝你平安。

2019-10-11 13:25:40 130

原创 我喜欢的话(1)

世上有很多的事,这很多的事与你无关;世上有很多的成功,这很多的成功与你无关;世上有很多的捷径,这很多的捷径也与你无关。—— 摘自《大飞码字》...

2019-10-11 13:23:32 137

原创 Python 查找两个大文件中不同内容

一、需求查找两个大文件中不同内容。二、解决方法将两个文件中某一列作为主键(类似数据库概念,用主键表示唯一性),分别放入集合 set 中去重。假设有两个集合 set1 和 set2:set1 = (1,2,3,4,5)set2 = (1,2,3,6)则 set1 中有但是 set2 中没有的数据是:result = set1 - set2# 输出结果为 4,5...

2019-10-11 11:07:06 963

原创 Oracle SQL 求两个时间差

一、需求三个字段分别表示时间,字段 info 格式为:"2019-10-10 05:13",字段 mydate 格式为:"2019-10-10",字段 mytime格式为 :"03:24"。二、解决想求这两个时间的差,首先要把 mytime 带上日期,与 mydate 字段拼接,其次将 info 与 拼接后的字段做差。三、代码实现Oracle SQL语法中两个时间不能直接做...

2019-10-10 19:59:55 2709

原创 Oracle 统计某个字段下不同值的个数

Pandas 中自带函数 value_counts() 可以统计出某一列中不同值的个数,若想在 Oracle 表里实现类似功能,需要自己手动写 SQL。假设 ISDELAY 字段有两个值,分别是 yes 和 no, 我们想统计其数量,SQL语句如下:selectcount(CASEWHEN ISDELAY IN 'yes'THEN '1'END) 延误数量,count(CA...

2019-10-10 16:17:31 8490 3

原创 《活得淋漓》书摘(一)

1. 咱得尊重各种活法,咱不能预设自己代表了光明、正确、全知全能,避免拿自己认为对的标准体系套在别人身上,更避免指指点点。2. 外人就是那些说几句体恤话,拍拍肩膀散去的人们。3. 即使失败,我们也要印证过的失败,而不是猜想。4. 好的机遇与你的勇敢环环相扣彼此催生。5. 在工作中忘记性别,在生活中把它想起来。6. 与其后悔,不如总结那些特别正确的选择如何产生,然后在未来复制他们...

2019-10-09 22:27:11 181

原创 Pandas: startswith()函数实现拆分文件

一、需求将一个CSV文件中按照 NUMBER 列分成两个 CSV 文件,一个文件中 NUMBER 列以 AB 开头,剩下的为另一个 CSV 文件。二、实现代码import pandas as pddata = pd.read_csv('example.csv',header = 0)df = pd.DataFrame(data)# print(df)df['bool']...

2019-10-09 09:35:15 3502

原创 Pandas 比较日期差异

一、需求两列数据A, B 分别表示两个时间,已用函数 pd.to_datetime() 做标准化时间处理,A - B 求两列的差值后,发现结果是 0 days 或 -1 days,如图所示:要求:挑选出 > 0 days的部分,其余不处理。二、解决办法主要思想是通过加一列 bool 列来判断 delay 列是否是 > 0 days,如果是,标记为True,否则...

2019-10-08 16:00:55 8746

原创 Pandas: count() 与 value_counts() 对比

1. Series.value_counts(self,normalize=False,sort=True,ascending=False,bins=None,dropna=True)返回一个包含所有值及其数量的 Series。且为降序输出,即数量最多的第一行输出。参数含义如下:Parameters: normalize:boolean, default ...

2019-10-08 10:40:27 14260

python-louvain-readthedocs-io-en-latest.pdf

用Python包实现对图(Graph) 的社区性质的分析,判断图是否可划分不同社区等等

2021-02-16

Delay_causality_network_in_air_transport_systems.pdf

Delay_causality_network_in_air_transport_systems.pdf

2020-12-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除