pandas DataFrame存入到excel中和从excel中读取出来时的不同

在写一个自动化小程序的时候,遇到了一个小bug,找了老半天也没找到问题在哪里,后来才发现问题出现在pandas从excel中读存取数据时。 例如,一个excel文件是这样的: 用Python pandas模块将excel中数据读出来是这样,会将表中的所有数据作为columns中...

2019-05-17 20:18:41

阅读数 54

评论数 0

letecode13-14-15-17 第六次作业

第13题 解题思路:选择出三个数相乘,得出的值最大值构成有两种情况:一是 分别选出三个最大(正)、最小(负)和第二小(负)的值,它们的乘积是正的,二是 三个值 分别是数组中 最大值 次大值 和 第三大的值。 代码如下: class Solution(object): def...

2019-05-11 23:45:39

阅读数 22

评论数 0

LeetCode练习12

解题思路:这个题没考啥东西,就是考你对python语法的掌握程度,将列表从左到右进行判断,如果以1为左标取完数的话,只剩下0那么就是True,反之就是flase。(代码写的还是非常简洁的~) class Solution(object): def isOneBitCharacter(s...

2019-05-11 09:27:30

阅读数 15

评论数 0

主成分分析(pca的两种实现)

主成分分析(Principal Component Analysis,PCA)。在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为...

2019-05-09 00:17:27

阅读数 13

评论数 0

自动化脚本获取数据 one and two

最近写了一个自动化脚本,用来从网站上和mysql数据库中获取数据,进行处理之后将其插入到excel表格之中,但是速度很慢,之后换了一种思路,速度提高了75%,现在记载一下,以顾后期回顾: 思路一:1、爬虫下载邮政和寄件的数据(表格形式)将其储存在文件夹中。 2、然后分别从...

2019-04-25 23:32:40

阅读数 24

评论数 0

word2vec

【中英】CS224n 斯坦福深度自然语言处理课:https://pwww.bilibili.com/video/av41393758/?p=2 1、计算机在处理词意最常见的方法是:用分类资源来处理词义。(ag:wordnet) 2、独热编码为何有问题:没有给出任何词汇之间的内在联系。 3、针...

2019-04-09 23:52:36

阅读数 42

评论数 0

LeetCode练习11

思路:观察这个数组,你会发现,它的长度一定为奇数,因为如果为偶数,不相等的元素就会有两个~,根据这个思路~这个唯一数字一定出现在奇数位~ class Solution(object): def singleNonDuplicate(self, nums): "...

2019-04-09 22:27:55

阅读数 25

评论数 0

python基本数据结构:栈、队列、双端队列、链表和二叉树

一、栈 1.1、什么是栈 栈(有时称为“后进先出栈”)是一个项的有序集合,其中添加移除新项总发生在同一端。这一端通常称为“顶部”。与顶部对应的端称为“底部”。栈的底部很重要,因为在栈中靠近底部的项是存储时间最长的。最近添加的项是最先会被移除的。这种排序原则有时被称为 LIFO,后进先出...

2019-04-09 22:08:45

阅读数 106

评论数 0

2018文本智能处理挑战赛-第二天

TF-IDF原理及使用 1.TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文本频率). 一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越能够代表该文章. TF(x) TF反映了一个词在当前文章中出现的频率...

2019-04-07 23:07:01

阅读数 525

评论数 0

leetcode练习9-10

练习9: 这个题目好像没有涉及算法,但是难度却是“中等” 代码: class Solution: def queryString(self, S: str, N: int) -> bool: return len([bin(i) for i in ...

2019-04-06 19:56:47

阅读数 20

评论数 0

2018文本智能处理挑战赛-第一天

一、竞赛介绍 网址:http://www.dcjingsai.com/common/cmpt/“达观杯”文本智能处理挑战赛_竞赛信息.html 任务:建立模型通过长文本数据正文(article),预测文本对应的类别(class) 数据:包含两个csv文件 1、train_set.csv:此数据...

2019-04-05 23:20:45

阅读数 255

评论数 0

leetcode练习7-8

给定一个字符串,请你找出其中不含有重复字符的最长子串的长度。 示例1: 输入: "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。 解题思路: 这个无重复的子串的最长长度为不重复的字母的个数,所...

2019-04-04 22:44:11

阅读数 27

评论数 0

leetcode练习6

给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。 示例: 给定 nums = [2, 7, 11, 15], target = 9 因为 nu...

2019-04-03 22:16:08

阅读数 12

评论数 0

leetcode练习5

假设有从 1 到 N 的N个整数,如果从这N个数字中成功构造出一个数组,使得数组的第i位 (1 <= i <= N) 满足如下两个条件中的一个,我们就称这个数组为一个优美的排列。条件: 第i位的数字能被i整除 i能被第i位上的数字整除 现在给定一个整数 N,请问可以...

2019-04-02 22:37:25

阅读数 21

评论数 0

leetcode练习4

给定一个按非递减顺序排序的整数数组A,返回每个数字的平方组成的新数组,要求也按非递减顺序排序。 示例 1: 输入:[-4,-1,0,3,10] 输出:[0,1,9,16,100] 思路1: 先产生平方列表,然后再用冒泡排序进行排序 代码如下: class Solution(obj...

2019-04-01 22:42:15

阅读数 18

评论数 0

leetcode练习1-3

立下个flag,以后每天刷一道LeetCode上面的算法题 第一道: 给定二维空间中四点的坐标,返回四点是否可以构造一个正方形。 一个点的坐标(x,y)由一个有两个整数的整数数组表示。 输入: p1 = [0,0], p2 = [1,1], p3 = [1,0], p4 = [0,1]...

2019-03-29 18:23:26

阅读数 37

评论数 0

初涉协程asyncio爬虫

我最近需要爬取93个表格进行分析,因为表格较多,所以想着用异步的方法速度可能会很快,所以尝试了一下异步爬虫,最后发现这个速度和单进程爬虫时间差不多~因为我的每个表格都很小而且基本不会阻塞~异步还是很有用以后接着学习哈~ 先放协程的代码: import asyncio import json ...

2019-03-27 23:32:18

阅读数 27

评论数 0

Python(selenium)爬取拉勾网招聘信息并可视化分析-附代码

我的工作和数据分析相关,刚好最近也接触点爬虫,也想看看招聘网站的数据分析的要求是什么,就用爬虫爬下来分析分析 接触爬虫不多,什么代理池,cookie池还没有接触过,这个以后肯定要了解。 1、分析页面 先分析下拉钩的页面,是通过ajax方式动态显示的,提交的参数是页数,通过post方式进行...

2019-03-19 22:35:12

阅读数 510

评论数 5

python if elif else 的简化写法(用在列表、字典推导式以及lambda函数中)

最近写程序经常需要在列表推导式中添加判断条件,有时候在lambda匿名函数中添加判断条件,或者有时候写程序写的太长了,需要判断语句的时候不想在写成多行了(显得很啰嗦),这些时候用了一下if elif else的简化用法(这个时候可读性就差),现在我总结一下这个用法: 1、if elif else...

2019-03-19 18:09:30

阅读数 208

评论数 0

python实现自动化报表2

自动化一个报表,用到的知识点和上一篇的知识点是一样的,但是有一个点需要注意: 注意点:我们的自动化报表是先从公司网站上将数据下载下来之后,填充到excel(报表模板)中相应的sheet之中,然后运用excel的公式自动化处理数据并呈现成图,实现报表的自动化,但是有一点需要注意,将从网站爬取得数...

2019-03-03 00:14:56

阅读数 121

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭