- 博客(23)
- 收藏
- 关注
原创 pandas库使用小结
最近学习数据分析,经常使用到pandas,写个blog加深一下印象文档地址官方文档简书用作范例的数据库文件:链接: https://pan.baidu.com/s/1Cz9PwQuw1SrZhtQ-iuXg1g 提取码: jmnx1. DataFrame的增删改查1. 1 增1. 1. 1读取文件pandas支持多种读取方式,如sql, csv等函数名称参数备注...
2020-02-22 22:51:16 473
原创 1001 Battle Over Cities - Hard Version (35分)
https://pintia.cn/problem-sets/994805148990160896/problems/994805156657348608思路:存储边的信息。遍历屏蔽每个城市后保持连通所需要的花费;输出注意:如果是已经修好的,花费就为0,这样可以不用去分别处理通/不通的道路如果屏蔽某个城市后为非连通了,那么就说明这个城市是不可或缺的;代码中用“已经连接了的边的数...
2020-02-17 20:57:46 224
原创 python excel库使用汇总
给自己mark一下以防忘记,碰到情况了就更新1. 在excel后追加内容import xlrdimport xlwtfrom xlutils.copy import copy# 先读入文件workbook = xlrd.open_workbook(<path>)# 获取当前文件的行数row = workbook.sheet_by_index(0)# row = w...
2020-01-24 15:19:47 567
原创 L1-064 估值一亿的AI核心代码 (20分)
在公众号上看到这道题于是手痒想试试,结果不出意料,没解出来。我的解题思路如下:按行输入内容处理首尾空格处理大小写和多余空格处理词语替换这里最麻烦的是在于词语替换,麻烦的点在于如何判断是否是独立的词语。我的判断条件是这样的:判断左边:要么在字符串最左边,要么左边就不能有英文字符;判断右边:要么在字符串最右边,要么右边就不能有英文字符;最后有两个点通不过,不知为何,欢迎大佬们...
2020-01-21 14:21:24 462
原创 【求助】CSDN模拟登陆失败
今天闲来无事想要温习一下爬虫的内容,于是尝试模拟登陆CSDN然后批量修改我写的blog名称,结果一来就卡住了。我尝试了两种方式登陆,分别是chromedriver配合selenium模拟登陆和用requests直接登陆,先上selenium模拟登陆的代码:selenium 模拟登陆# 初始化browser = webdriver.Chrome()# 打开网页login_url = '...
2020-01-14 21:35:41 302
原创 BeautifulSoup库使用
作用将html文本解析,方便快速定位使用解析后的数据安装直接搜索beautifulsoup4进行安装,还要安装lxml便于解析快速范例#main.pyimport lxmlimport requestsfrom bs4 import BeautifulSoupheaders = { 'User-Agent': 'Mozilla/5.0 (Macintosh; I...
2020-01-09 23:32:03 199
原创 1050 String Subtraction (20 分)——xxxxxxxxxl
思路:想来这道题也没人来看,就不写思路了AC CODE:#include <iostream>#include <string>#include <map>using namespace std;const int maxn = 1010;map<char,bool> mp;string s1,s2;int main() { ...
2020-01-05 13:51:44 995
原创 1040 Longest Symmetric String (25 分)——xxxxxxxxxl
算法核心:动态规划(但PAT考纲里面是没有动态规划的)状态方程:dp[i][j]表示是i到j是不是回文字符串;初始化条件:每个自己都是自己的回文串;状态转移方程:判断i到j是不是回文字符串,就看i+1到j-1是不是回文字符串以及首尾是否相等;if(dp[i+1][j-1] && s[i]==s[j]){ ans = L; dp[i][j] = true;}...
2020-01-05 13:50:57 357
原创 1019 General Palindromic Number (20 分)
注意事项:不能用字符串来做,因为这道题要求一个数字作为一个整体输出,比如15就必须输出15,不能输出成1 5;水题AC CODE:#include <iostream>#include <vector>using namespace std;int n,radix;bool flag = true;int main() { cin >>...
2020-01-05 13:49:52 187
原创 1018 Public Bike Management (30 分)
思路:Dijkstra+DFSAC CODE:#include <iostream>#include <vector>using namespace std;const int maxn = 1010;const int INF = 0x3fffff;int G[maxn][maxn];bool vis[maxn] = {false};int d[max...
2020-01-05 13:49:16 215
原创 1017 Queueing at Bank (25 分)
注意事项:题意要求“只有来晚了的人不能被服务”,但是如果等待导致超时是可以被服务的,这是最后一个测试点过不了的原因;所有到的比较早的客人都需要等到8点钟不用先将每个窗口填满,在查找最早结束窗口时候,可以以第1个窗口作为标的,这样可以节约代码行;这道题可以不用队列,用数组来做;思路:结构体GUEST存储客人的到达时间和操作时间;WINDOW数组存放窗口的结束时间;在录入数据的时候,处理...
2020-01-05 13:48:50 263
原创 1016 Phone Bills (25 分)
算法核心:每小时对应一个费率,统计在一段时间内的费用;拆成秒的模式,在每一个时间段逐项相加;(由于这道题和小时相关,所以不拆成秒数相加的形式可能更好做)个人觉得当时的做法挺麻烦的,以后有时间了再优化吧AC CODE:#include <iostream>#include <algorithm>#include <utility>#include ...
2020-01-05 13:48:12 118
原创 1014 Waiting in Line (30 分)——xxxxxxxxxl
算法核心:队列模拟思路一:设置两个结构体,分别存储窗口数据和客人数据;挨着模拟即可ps:这种模拟题还有好几道类似的,都很折磨人,当时做的时候做了好久,还没拿全分;AC CODE:#include <iostream>#include <algorithm>#include <queue>using namespace std;const ...
2020-01-05 13:47:03 1258
原创 1013 Battle Over Cities (25 分)——xxxxxxxxxl
思路:依次判断抹去某个点后的连通个数;ps. 判断连通个数也可以用并查集,时间复杂度上应该会更好一点,我在后面的题目中有用并查集统计过连通个数AC CODE:#include <iostream>using namespace std;const int maxn = 1010;const int INF = 0x3fffff;int G[maxn][maxn];...
2020-01-05 13:42:34 289
原创 1012 The Best Rank (25 分)——xxxxxxxxxl
思路:将数据存入数组;按条件排序赋值排名即可;AC CODE:#include <iostream>#include <algorithm>using namespace std;const int maxn = 2020;struct PER{ double grade[4]; int rank[4]; int id;}per...
2020-01-05 13:40:44 1223
原创 1004 Counting Leaves (30 分)——xxxxxxxxxl
思路:DFS遍历图,然后统计叶子节点的个数AC CODE:#include <iostream>#include <vector>#include <algorithm>using namespace std;const int maxn = 510;struct Node{ int v; vector<int> ...
2020-01-05 13:38:40 328
原创 1003 Emergency (25 分)
思路一:Dijkstra判断路径和点权和;思路二:这是后来学习bellman算法的时候的改写,但是PAT好像Dijkstra就够了Bellman算法;(AC CODE2)注意事项:路径的更新要注意两点(见代码标记处)如果是第二标准,路径的更新要放在判断之外;如果是第二标准,路径的更新是 +=,不是 +1;Bellman算法1. 计算num[maxn],需要set...
2020-01-05 13:35:55 142
原创 1002 A+B for Polynomials (25 分)——xxxxxxxxxl
注意事项知识点:双针法的灵活运用;多项式加法乘法的运算;多项式的两种表示方法思路一:获取输入的多项式并且存储;双针法(或者用priority_queue来做),依次取两个多项式间,次方更高的那个录入结果;思路二(better):用一个数组存放多项式的系数,数组的下标就是多项式的指数;(这种方法倾向于指数较小的情况,用空间换时间)每次录入的时候就加和其系数;思路...
2020-01-05 13:32:23 1944
原创 说在前面的话
说在前面的话有感于考PAT过程中,参考了无数大神的代码,深有所得,感恩大神的奉献,故将自己平常做题记录在有道上的笔记也在这里放出来供大家参考借鉴。本系列的文章记录了我从0基础开始学习数据结构的过程,中间部分题目有二刷,但有些题目是早期所写,所以可能代码风格会有所不同,并且有的代码会比较落后,请多包涵文章目录个人在做有道笔记的时候根据个人做题的感觉将其分为了以下几个目录不熟悉的算法超时...
2020-01-05 13:23:39 129
原创 7-44 基于词频的文件相似度 (30 分)
7-44 基于词频的文件相似度 (30 分)实现一种简单原始的文件相似度计算,即以两文件的公共词汇占总词汇的比例来定义相似度。为简化问题,这里不考虑中文(因为分词太难了),只考虑长度不小于3、且不超过10的英文单词,长度超过10的只考虑前10个字母。输入格式:输入首先给出正整数N(≤100),为文件总数。随后按以下格式给出每个文件的内容:首先给出文件正文,最后在一行中只给出一个字符#,表示文...
2019-11-09 00:15:53 852 1
原创 PAT 1109(超简单双向队列解法)
PAT 1109双向队列很简单,就多一个前加后加和前删后删的区别直接上代码:#include <cstdio>#include <algorithm>#include <queue>#include <iostream>using namespace std;int N,K,cnt;struct person{ strin...
2019-03-23 14:37:11 280
空空如也
有一个网站通过抓包找不到数据
2022-12-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人