自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 分割字符串

将字符串末尾的方括号内容删除,然后将表格中的中英文字符串分割成两个列表的函数。字符串主要有以下几种形式:‘zzacv/你在干啥’, ‘xccd 啦啦啦’, ‘nkin(我们)’, ‘ndjp/几乎[中国]’, ‘xxxx’, ‘文艺汇演’, ’ '…def brand_split(s): if s == None: return [None, None] s ...

2018-12-29 09:36:59 136

原创 SQL错题记录

1、Show the name and population in millions for the countries of the continent ‘South America’. Divide the population by 1000000 to get population in millions.SELECT name, population/1000000 FROM worl...

2018-12-14 10:53:46 440

原创 链表

单链表#先定义一个节点class Node(object): def __init__(self, value, next=None): self.value = value self.next = next#定义链表class LinkedList(object): def __init__(self, maxsize): self.ma...

2018-12-11 22:50:47 142

原创 二叉树

#定义二叉树节点class BinTreeNode(object): def __init__(self, data=None, left=None, right=None): self.data, self.left, self.right = data, left, rightclass BinTree(object): def __init__(self, ...

2018-12-10 21:51:05 105

原创 链表II

3、反转链表反转一个单链表。示例:输入:1 -> 2 -> 3 -> 4 -> 5 -> NULL输出:5 -> 4 -> 3 -> 2 -> 1 -> NULL解法1:迭代思路:从前往后遍历链表,定义3个指针分别指向相邻的三个节点,反转前两个节点,即让第二个节点指向第一个节点。然后一次往后移动指针,直到第二个节点为空结束...

2018-12-03 15:59:39 115

原创 链表

1、删除链表中的节点请编写一个函数,使其可以删除某个链表中给定的(非末尾)节点,你将只被给定要求被删除的节点。现有一个链表–head=[4, 5, 1, 9],它可以表示为:4 -> 5 -> 1 -> 9示例:输入:head = [4, 5, 1, 9], node = 5输出:[4, 1, 9]说明:链表至少包含两个节点链表中所有节点的值都是唯一的给定...

2018-12-02 21:00:19 116

原创 字符串——9、最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串""。示例1:输入:["flower", "flow", "flight"]输出:"fl"示例2:输入:["dog", "racecar", "car"]输出:""说明:所有输入只包含小写字母a-z。思路:比较逐个字母ASCII码

2018-12-02 20:20:29 165

原创 字符串——8、报数

报数序列是一个整数序列,按照其中的整数的顺序进行报数,得到下一个数。其前5项如下:1. 12. 113. 214. 12115. 111221理解:1被读作"1个1",即11;11被读作"2个1",即21;21被读作"1个2","1个2",即1211;1211被读作"1个1","1个2","2个1&

2018-12-02 19:23:36 143 1

原创 字符串——7、实现strStr()

实现strStr()函数。给定一个haystack字符串和一个needle字符串,在haystack字符串中找出needle字符串中出现的第一个位置(从0开始)。如果不存在,则返回-1。示例1:输入:haystack = 'hello', needle = 'll'输出:2示例2:输入:haystack = 'aaaaa', needle = 'bba'输出:-1说明:当nee...

2018-12-02 17:11:12 109

原创 数据挖掘过程及机器学习十大算法

1、数据探索主要基于pandas库,利用常见的:.head()、.value_counts()、.describe()、isnull()、.unique()等函数以及通过matplotlib作图对数据进行理解和探索。2、特征工程主要是通过从日期中提取年月日、季节、weekday,对年龄进行分段,计算相关特征之间的差值,根据用户id进行分组,从而统计一些特征变量的次数、平均值、标准差等,以及通...

2018-12-02 16:32:08 776

原创 字符串——6、字符串转换整数(atoi)

请你来实现一个 atoi 函数,使其能将字符串转换成整数。首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽...

2018-12-01 08:49:01 156

原创 字符串——5、有效的回文字符串

给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,可忽略字母的大小写。说明:我们将空字符串定义为有效的回文串。示例1:输入: "A man, a plan, a canal:Panama"返回:true示例2:输入: "race a car"返回: false方法1:思路:用str.isalnum()检测字符串是不是由字母和数字组成,删掉多余的空格,再判断是否是否与...

2018-11-30 11:23:52 244

原创 字符串——4、有效的字母异位词

给定两个字符串s和t,编写一个函数来判断t是否是s的一个字母异位词。示例1:输入: s = "anagram", t = "nagaram"输出: true示例2:输入: s = "rat", t = "car"输出: false说明:假设字符串只包含小写字母。思路:采用set,遍历set,比较每个字符出现的次数,若出现不等则返回false,否则返回true。class ...

2018-11-29 15:08:36 129

原创 字符串——3、字符串中的第一个唯一字符

给定一个字符串,找到它的第一个不重复的字符,并返回它的索引。如果不存在,则返回-1。示例:s = "leetcode"返回 0.s = "loveleetcode",返回 2.注意:可以假定该字符串只包含小写字母。方法1:思路:采用字典计数法,用collections.Counter()方法统计字符出现的次数,若只出现一次,返回其对应的索引,否则返回-1。class So...

2018-11-29 14:47:52 123

原创 字符串——2、整数反转

给出一个32位的有符号整数,将这个整数中每位上的数字进行反转。注意:假设我们的环境只能存储32位有符号整数,其数值范围是[-231, 231-1 ]。根据这个假设,如果反转后的整数溢出,则返回0。示例1:输入: 123输出: 321示例2:输入: -123输出: -321示例3:输入: 120输出: 21解法1:思路:建立一个列表,将数字转换成字符串存入列表;...

2018-11-29 10:39:00 242

原创 字符串——1、反转字符串

编写一个函数,其作用是将输入的字符串反转过来。示例1:输入: "hello"输出: "olleh"示例2:输入: "A man, a plan, a canal: Panama"输出: "amanaP :lanac a ,nalp a ,nam A"class Solution: def reverseString(self, s): return s[::-1...

2018-11-29 09:29:29 127

原创 数组——11、旋转图像

给定一个 n × n 的二维矩阵表示一个图像。将图像顺时针旋转 90 度。说明:你必须在原地旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。示例1:给定 matrix = [ [1,2,3], [4,5,6], [7,8,9]],原地旋转输入矩阵,使其变为:[ [7,4,1], [8,5,2], [9,6,3]]示例...

2018-11-29 08:58:38 106

原创 数组——10、有效的数独

判断一个9x9的数独是否有效。根据以下规则,验证已经填入的数字是否有效。数字1-9在每一行只能出现一次;数字1-9在每一列只能出现一次;数字1-9在每一个以促使线分隔3x3宫内只能出现一次。数独部分空格内已填入了数字,空格用“.”表示:示例:输入:[ ["5","3",".",".","7",".",".",".","

2018-11-28 21:44:20 284

原创 数组——9、两数之和

给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的两个整数。假设每个输入只对应一种答案,且同样的元素不能被重复利用。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回[0, 1]。思路:对数值nums[x]求差值,把差值n存进字典里作为字典的键,索引x作...

2018-11-28 17:57:44 334

原创 数组——8、移动零

给定一个数组nums, 编写一个函数将所有0移动到数组的末尾,同时保持非零元素的相对顺序。示例:输入:[0, 1, 0, 3, 12]输出:[1, 3, 12, 0, 0]说明:必须在原数组上操作,不能拷贝额外的数组。尽量减少操作次数。方法1:思路:遍历列表,查找不为0的元素,按索引重新存进数组中,当找到k个不为0的元素后,将后面全部补充为0。class Solutio...

2018-11-28 15:31:59 134

原创 数组——7、加一

给定一个非负整数组成的非空数组,在该数的基础上加一,返回一个新的数组。最高位数字存放在数组的首位,数组中每个元素只存储一个数字。可以假设除了整数0之外,这个整数不会以零开头。示例1:输入:[1, 2, 3]输出:[1, 2, 4]解释:输入数组表示数字 123。示例2:输入: [9, 9]输出: [1, 0, 0]解释:输入数组表示数字 99。思路:将数组元素转换成数字...

2018-11-27 14:40:41 133

原创 数组——6、两个数组的交集II

给定一个数组,编写一个函数来计算它们的交集。示例:输入:nums1 = [1, 2, 2, 1], nums2 = [2, 2]输出:[2, 2]说明:输出结果中每个元素出现的次数应与元素在两个数组中出现的次数一致;可以不考虑输出结果的顺序。思路:判断短列表中的元素是否在长列表中,若在,则添加到心底列表中,同时长列表删除相应元素,避免重复。class Solution:...

2018-11-27 11:04:55 110

原创 数组——5、只出现一次的数字

给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。示例1:输入:[2, 2, 1]输出:1示例2:输入:[4, 1, 2, 1, 2]输出:4> 思路:对数组中所有数字采用异或运算,相同数字的异或结果为0,最后得到的就是不重复的数字。```python3class Solution: def singleNum...

2018-11-27 10:47:02 81

原创 数组——4、存在重复

给定一个整数数组,判断是否存在重复元素。如果有任何值在数组中出现至少两次,函数返回true。如果数组中每个元素都不相同,则返回false。示例1:输入: [1, 2, 3, 1]输出: true示例2:输入: [1, 2, 3, 4]输出:false方法1:排序,和前一个比较,若重复,则返回True,否则False。class Solution: def contain...

2018-11-27 08:35:47 104

原创 数组——2、买卖股票的最佳时机II

给定一个数组,它的第i个元素是一支给定股票第i天的价格。设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一只股票)。注意:你不能同时参与多笔交易(必须在再次购买前出售掉之前的股票)。示例1:输入: [7, 1, 5, 3, 6, 4]输出: 7解释:在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出, 这笔交易所能获得...

2018-11-26 21:30:40 145

原创 数组——从排序数组中删除重复项

给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在原地修改输入数组并在使用O(1)额外空间的条件下完成。示例1:给定数组 nums = [1,1,2], 函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。 你不需要考虑数组中超出新长度后面的元素。思路:将每一个元素和前一个...

2018-11-26 20:37:54 57

原创 WeRateDogs推特数据报告

项目:WeRateDogs推特数据报告一、数据整理1、收集数据导入三个数据集文件。2、评估数据通过.head()、.info()评估3个表格的总体信息。然后分别对3个表进行评估,由于表3在收集数据时已经提取了有效信息,故不对其进行评估。2.1 对 twitter_archive 表格:查找 text 列中的转发信息,判断数量是否与 retweeted_status_id 列的数量是...

2018-11-19 15:54:18 1023

原创 数据清理

一、准备工作在进行清理操作之前,一定要将每份数据备份!使用.copy()方法:df_clean = df.copy()为什么我得在Pandas里复制一份数据框?答:在Pandas中,索引DataFrame会返回初始DataFrame的索引,而更改子集将更改初始DataFrame,因此,如果要确保初始DataFrame不被更改,需使用副本。二、数据清理流程1、Define具体说明要...

2018-11-12 15:02:01 1775

原创 数据评估

1、未清理的数据(1)脏数据(质量):不准确数据损坏的数据重复数据(2)杂乱数据(整洁度):每个变量构成一列每次观察构成一行每类观察单元构成一个表格2、目测评估可在清洗数据前先备注评估问题,例如:Quality‘patients’ tablezip code is a float not a stringzip code has four digits som...

2018-11-08 15:01:58 975

原创 收集数据

1、Web数据抓取使用Beautiful Soup来提取每个HTML文件。创建一个空列表df_list,并附加字典。通过rt_html文件夹中每个电影的Rotten Tomatoes HTML文件循环播放。打开每个HTML文件,并将其传达到一个名为file的文件句柄中。使用pd.DataFrame()将df_list转换为名为df的DataFrame.from bs4 import...

2018-11-07 19:18:19 428

原创 数据整理

数据整理1、收集数据:(1)下载手动下载文件以编程方式下载文件(可扩展性和重复性)(2)打开Jupyter Notebook在终端输入命令提示符。在这之前,应在运行命令的目录下开启Notebook服务器,将Notebook文件保存到指定目录下。在该目录下,我们更容易导入外部文件,比如下载的数据集。(3)收集:解压压缩文件1)将zip文件移动到工作目录(最好把所有文件放在同一个位...

2018-11-06 15:42:36 182

原创 Stroop effect检验

项目:检验心理学现象背景介绍:斯特鲁普效应:在心理学上指优势反应对非优势反应的干扰。文字斯特鲁普测试:有几个不同的表示颜色的文字,例如红、黄、绿、黑,但是如果把红涂上黄、黄涂上绿…随后让你回答字体颜色,就会反应速度减慢。这是因为你对文字意义的反应更快(优势反应),而你识别颜色的反应更慢(非优势反应)。项目要求:了解该试验,创建关于任务结果的假设,自己研究任务。然后查看同样执行了该任务的其他...

2018-11-04 15:28:09 1105

原创 清理数据和绘图

一、清理数据1、数据缺失可用平均值填充缺失值。首先获得缺失值所在列的平均值,然后用.fillna()函数把平均值填充到各空值处,如:mean = df['view'].mean()df['view'].fillna(mean)注意: .fillna()函数并没有修改原来的列,只是把更改返回成一个新列,这一列并没有储存到任何地方,需将更改赋值到原来的列里,或用一个叫inplace的参数...

2018-11-01 09:01:02 395

原创 CSV学习记录

CSV文件学习记录一、读取CSV文件1、标题(1)用 read_csv()将数据从csv文件加载到Pandas数据框时,可以指定文件的哪一行作为标签,而标题指定了列标签。通常第一行是标签,但有时如果文件顶部有额外的元信息,我们希望指定另一行作为标题。如:df = pd.read_csv('scores.csv', header=2)df.head()这里使用第3行作为标题,上面的所...

2018-10-31 18:01:27 171

转载 制作数据报告

@sukie制作数据表制作数据表制作数据表的流程流程图:Step1:目标确定这一步通常是由客户/上级/其他部门同事/合作方提出来的,需要我们自己来确定目标。选择目标时,需注意以下3点:(1)选择一个自己比较熟悉或感兴趣的领域/行业;(2)选择一个范围较小的细分领域/细分行业作为切入点;(3)确定这个领域/行业有公开发表的数据/可获取的UGC内容(论坛帖子、用户点评等)。逐一分析...

2018-10-30 09:35:28 287

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除