出现Cannot create table : 1166 - Incorrect column name,怎么解决? 当出现这种情况,说明数据没有成功导入mysql。这个时候,要将excel文件转换成txt文件,因为txt文件更稳定,更好用。 excel文件转换成txt文件方法如下:先将excel文件打开,另存为txt文件再将txt文件打开,另存为,这个时候修改编码格式,修改为你需要的编码,一般都是修改为utf-8。...
python数据结构 Python的数据结构简单而强大。想要成为一名合格的数据分析师,对Python的数据结构一定要熟练于心。 Python的数据结构主要有元组,列表,字典和集合,下面针对必要的知识点介绍一下。一.元组(tuple) 元组是一种一维的、定长的、不可变的Python对象序列。 1.创建 元组的创建有两种:其一是用括号()直接赋值,赋一组以逗号隔开的值;其二是调用tuple,用第二种方法可以使任...
产品经理入门必备书籍 最近,有一个很爱看书的朋友给我推荐了几本产品经理入门的书籍,特来和大家分享。 看书的顺序和我在这里写的顺序一致,第2、3本书看的顺序随意,可以对调。 1、结网:改变世界的互联网产品经理 2、产品的视角:从热闹到门道 3、产品经理的20堂必修课 4、腾讯方法 5、产品经理面试攻略目前本人刚开始看第一本,遇到有用的地方,和大家分享。...
Python常用的可视化工具入门:Matplotlib入门 用于创建出版质量图表的绘图工具库目的是为Python构建一个Matlab式的绘图接口import matplotlib.pyplot as plt,pyplot模块包含了常用的matplotlib API函数figure Matplotlib的图像均位于figure对象中 创建figure,plt.figure() 示例: Subplot fig.add_subplot(...
NumPy的知识要点 NumPy的介绍NumPy是Numerical Python的缩写高性能科学计算和数据分析的基础包ndarray,多维数组(矩阵),具有矢量计算能力,快速、节省空间矩阵运算,无需循环,可完成类似Matlab的矢量计算线性代数、随机数生成常用import numpy as np注:在jupyter notebook中进行示例。ndarray,N维数据对象(矩阵) 所有元素...
python基础知识(三)python高阶函数 函数式编程1.函数本身可以赋值给变量。赋值后变量为函数 示例: 2.允许将函数本身作为参数传入另一个函数 示例: 3.允许返回一个函数map/reduce1.map(func,lst),将传入的函数变量func作用到lst变量的每个元素中,并将结果组成新的列表返回 示例: 2.reduce(func(x,y),lst),其中func必须有两个参数。每次func计...
python基础知识(二)python高级特性 集合的推导式列表推导式,使用一句表达式构造一个新列表,可包含过滤、转换等操作[exp for item in collection if condition]示例: 字典推导式[key_exp : value_exp for item in collection if condition]示例: 集合推导式{exp for item in...
数据分析师必须知道的知识锦囊 如今,身处互联网时代的我们每个人每时每刻都会在网络中产生很多的行为痕迹,这些行为痕迹在各大互联网公司的后台就形成了大数据,这大数据其实是放错位置的财富,以前人们没有意识到这是一个发财的商机,现在有关大数据的职业如雨后春笋般出现在我们的视线中,数据分析师这个职业就是其中之一。熟谙一切数据分析技术方法的分析者会比其他人技高一筹:他们知道如何处理所有的数据材料,如何将原始数据转变成推进现实工作的妙策,如...
用pandas进行数据分析实战 转载自http://mp.weixin.qq.com/s?__biz=MjM5NjEyMDI2MQ==&mid=2455947430&idx=1&sn=11da6ff57dbaeae9343e822ac8a2f3a7&chksm=b1787b0c860ff21a2568234ea1b5a1bf86c91c2b96ef876863f5dc11ad7de27510107...
python3.6的wordcloud下载安装 今天想实现一个词云展示,遇到了一下问题,按照最常规的pip install命令,安装失败,百度半天后的结果是wordcloud的pip安装命令不适用python3,所以我们另寻它法安装wordcloud。 首先,我们转到http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud,下载我们需要的对应版本的wordcloud 的whl文件,我使用的是64
如何解决Python中的Anaconda中文不能显示问题 当我们用Python中的Anaconda做图表时经常会遇到标签中的问题不能显示问题。df_clean.boxplot(column='avgSalary',by='city',figsize=(9,7))结果如下图: 图表的标签出了问题,出现了白框,主要是图表默认用英文字体,而这里的都是中文,导致了冲突。所以需要改用matplotlib。from matplotlib.fon
Python常用的数据分析工具入门: pandas入门 数据分析绝对绕不过的三个包是numpy、scipy和pandas。numpy是Python的数值计算扩展,专门用来处理矩阵,它的运算效率比列表更高效。scipy是基于numpy的科学计算包,包括统计、线性代数等工具。pandas是基于numpy的数据分析工具,能更方便的操作大型数据集。 下面主要介绍numpy和pandas。 这次示例我们用jupyter notebook。当电脑安装上Anac...
Python常用的包和模块 Python提供了非常丰富的包和模块,合理应用这些模块将极大程度的提供数据分析能力。下面列举一些数据分析要经常用到的包:numpy、scipy、pandas是数据分析最常用的三个包matplotlib、seaborn是常用的绘图包scikit-learn、Gensim、NLTK是机器学习相关的包urllib、BeautifulSoup是常用的爬虫包
Python闭包:返回函数的函数 闭包(closure)不是什么可怕的东西。如果用对了地方,它们其实可以很强大。闭包就是由其他函数动态生成并返回的函数,通俗地讲,在一个函数的内部,还有一个“内层”的函数,这个“内层”的函数是被返回的,它可以访问其创建者的局部命名空间中的变量。 下面是一个非常简单的例子:# 定义一个函数def make_closure(a): # 在函数内部再定义一个函数,其实这个里面的函数就被
Head First Python(前六章)学习笔记 关于python的开发环境配置,请看我之前的博客: http://blog.csdn.net/qq_22499377/article/details/78651840 当然初学者可以使用IDLE的shell来编写代码,对于初学者来说很好用。第一部分列表给一个创建名为movies列表的例子:movies = ['The Holy Grail',1975,'The life o
Hive学习笔记(五)向表中装载数据 1.向管理表中装载数据 再次强调,Hive没有行级别的数据插入、数据更新和删除操作。LOAD DATA LOCAL INPATH '${env:HOME}/california-employees'OVERWRITE INTO TABLE employeesPARTITION (country = 'US', state = 'CA');如果分区目录不存在的话,这个命令会先创建...
Hive学习笔记(四)与表有关的HiveQL语句 1.创建表: 详细见我之前的博客: http://blog.csdn.net/qq_22499377/article/details/79020768 2.展示在数据库mydb的表有两种方式:use mydb;show tables;或者show tables in mydb;如果有很多的表,可以使用正则表达式来过滤出所需要的表名:show tables L...
Hive学习笔记(三)与数据库有关的HiveQL语句 1.创建数据库:CREATE DATABASE mydb;如果数据库mydb已经存在的话,那么将会抛出一个错误信息。使用如下语句可以避免这种情况下抛出错误信息:CREATE DATABASE IF NOT EXISTS mydb; 当我们创建数据库mydb时,Hive会对应地创建一个目录/user/hive/warehouse/mydb.db。值得注意的是,数据库defau...
Hive学习笔记(二)HiveQL和MySQL的区别 HiveQL和MySQL的区别: HiveQL是Hive查询语言,Hive可能与MySQL的方言最接近,但是两者还是存在显著性差异的。Hive不支持行级插入操作、更新操作和删除操作。Hive也不支持事务。Hive增加了在Hadoop背景下的可以提供更高性能的扩展,以及一些个性化的扩展,甚至还增加了一些外部程序。本文为原创博客,仅供技术学习使用。未经允许,禁止将其复制下来上传到百度文库等平台。...
Hive学习笔记(一)集合数据类型和文本文件数据编码 集合数据类型集合数据类型分为STRUCT,MAP,ARRAY三种。 下面一个例子用于演示如何使用这些数据类型,这是一张虚构的人力资源应用程序的中的员工表:CREATE TABLE employees ( name STRING COMMENT 'Employee name', salary FLOAT COMMENT 'Employee salary', su...