Python
文章平均质量分 73
数据之魅
微信公众号“数据之魅”。
数据科学,魅力无限。
敬请关注,谢谢。
展开
-
UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe6 in position解决方法
原因是:python的str默认是ascii编码,和unicode编码冲突,解决方法是设置utf-8;import sysreload(sys)sys.setdefaultencoding('utf8')原创 2020-07-04 05:50:32 · 7316 阅读 · 5 评论 -
解决ImportError: cannot import name “imread” from “scipy.misc”
如图所示,大家在使用imread时可能会出现以上报错。为了解决以上问题,目前试过有两种方法是有效的:1、安装低版本的scipy先查看自己的scipy版本:In [21]: import scipy In [22]: print(scipy.__version__) 1.4.1原创 2020-06-22 07:06:28 · 3624 阅读 · 0 评论 -
数据分析系列 27/32 | Python使用matplotlib实现数据可视化
俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。PART01 Matplotlib现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。今天我们的主角是Python中的matplotlib库(官网:http:// matplotlib.org),相对来说,matplotlib功能不是最强大的,但是对于基本的图形...原创 2020-06-10 07:37:00 · 402 阅读 · 0 评论 -
数据分析系列 26/32 | Python数据科学速成(二)
接上文。PART01 面向对象编程现在有很多的的语言支持面向对象,比如最多的JAVA,PHP等,当然,Python也不例外,Python允许你来定义类(class)。类可以封装对象和函数来对它们进行操作。有时候我们会用类来使代码更加干净整洁,解释类的用法的最简单的方式可能是构建一个有很多注释的例子。如果Python中没有集合,那我们就需要自己去创建Set类。要实现的功能有:给定一个Set,我们需要能在其中加入(add)项目,移除(remove)项目,以及检查其中是否包含...原创 2020-05-15 07:39:34 · 363 阅读 · 0 评论 -
数据分析系列 25/32 | Python数据科学速成(一)
前面一篇讲了一些Python的基础知识和概念,这一篇我们来了解一下Python中更高级的部分,这些特性对开展数据工作特别有用。PART01 排序和列表解析排序每个Python列表都有一个sort方法恰当的排序,如果你不想弄乱你的列表,可以使用sorted函数,它会返回一个新列表。x = [2, 1, 4, 3]y = sorted(x) #结果是[1, 2, 3, 4]x.sort() #x变为[1, 2, 3, 4]默认情况下,sort...原创 2020-05-14 22:50:46 · 281 阅读 · 0 评论 -
数据分析系列 24/32 | Python数据科学库的安装和numpy介绍
如何使用Python进行科学计算和数据分析,这里我们就要用到Python的科学计算库,今天来分享一下如何安装Python的数据科学计算库。PART01 数据科学计算库Python中的数据科学计算库有Numpy、Scipy、pandas、matplotlib(前面我分享了一篇matplotlib的简单应用,历史文章上一篇就是)。Numpy是一个基础性的Python库,为我们提供了常用的数值数组和函数。Scipy是Python的科学计算库,对Numpy的功能进行了扩充,同时也...原创 2020-05-14 22:20:45 · 334 阅读 · 0 评论 -
idea、PyCharm连接MySQL错误如何解决?
大家在使用Idea、PyCharm连接MySQL时,可能会遇到以下报错:Server returns invalid timezone. Go to'Advanced' tab and set 'serverTimezone' property manually.今天整理一下几种解决办法供大家参考。首先,我们来定位原因:原因:服务器返回无效时区,转到“高级”选项卡并手动设置“serverTimezone”属性。首先,出现该问题的原因是MySQL驱动jar中的默认时区是UTC。.原创 2020-05-10 14:37:01 · 514 阅读 · 0 评论 -
Idea、PyCharm连接MySQL报错: Server returns invalid timezone. Go to 'Advanced' tab and set 'serverTimezone
Idea、PyCharm连接MySQL报错:Server returns invalid timezone. Go to 'Advanced' tab and set 'serverTimezone' property manually.原因:服务器返回无效时区,转到“高级”选项卡并手动设置“serverTimezone”属性。(首先,出现该问题的原因是MySQL驱动...原创 2020-05-07 15:29:51 · 1944 阅读 · 0 评论 -
数据分析系列 23/32 | 数据分析必须学习的6种数据分析思维
作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现:“好像是A引起的” ,“好像也和B渠道有关”,“也可能是竞争对手C做了竞争动作”等主观臆测。面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。很显然,这样的思维是乱的,所以做数据分析很重要的一点是:要具备结构化的分析思维。PART01 偏结构化思维逻辑树思维(...原创 2020-05-02 14:30:25 · 769 阅读 · 0 评论 -
数据分析系列 20/32 | 如何选择合适图表来传达信息?
面对多种类型的图表,选择合适来传达我们想要表达的信息至关重要,今天分享下我常遇到和使用的可视化图表。PART01 常见图表及用途折线图:折线图应该用于比较一段时间内的值,非常适合显示大小变化。它们还可用于比较多个数据组的更改。条形图:条形图应用于比较几个类别的定量数据。它们也可用于跟踪数据随时间的变化,但最好仅在这些变化很重要时使用。...原创 2020-03-26 14:18:25 · 950 阅读 · 0 评论 -
数据分析系列 19/32 | 数据可视化初探
俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。PART01 数据可视化 现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。说到这里,说一个经典的可视化案例:俄法战争。...原创 2020-03-26 14:16:18 · 464 阅读 · 0 评论 -
Python代码展示Numpy和Scipy的子库的描述信息
前言学习一个库的最好的方式是了解这个库的源码和组成原理,有时候源码可能会略显生涩,这时候我们想通过查看文档来了解,所以我们可以通过输出库自带的描述文档来了解一个库。Numpy和Scipy模块numpy提供了数组对象,面向的任何使用者。scipy在numpy的基础上,面向科学家和工程师,提供了更为精准和广泛的函数。scipy几乎实现numpy的所有函数,一般而言,如果scipy和nump...原创 2019-06-30 23:36:04 · 409 阅读 · 0 评论 -
Python3.6内置函数(11)——classmethod()
英文文档classmethod(function)Return a class method for function.A class method receives the class as implicit first argument, just like an instance method receives the instance. To declare a class m...原创 2019-06-30 23:34:47 · 485 阅读 · 0 评论 -
Python3.6内置函数(10)——chr()
英文文档chr(i)Return the string representing a characterwhose Unicode code point is the integer i. For example, chr(97) returns thestring ‘a’, while chr(8364) returns the string ‘€’. This is the inver...原创 2019-06-30 23:33:33 · 862 阅读 · 0 评论 -
Python3.6内置函数(9)——callable()
英文文档callable(object)Return True if the object argument appearscallable, False if not. If this returns true, it is still possible that a callfails, but if it is false, calling object will never suc...原创 2019-06-30 23:32:13 · 1401 阅读 · 0 评论 -
Python3.6内置函数(8)——bytes()
英文文档class bytes([source[, encoding[, errors]]])Return a new “bytes” object, which is animmutable sequence of integers in the range 0 <= x < 256. bytes is animmutable version of bytearray – i...原创 2019-06-30 22:40:30 · 2406 阅读 · 0 评论 -
Python3.6内置函数(7)——bytearray()
英文文档class bytearray([source[, encoding[, errors]]])Return a new array of bytes. The bytearray class is a mutable sequence of integers in the range 0 <= x < 256. It has most of the usual meth...原创 2019-06-30 22:39:00 · 1012 阅读 · 1 评论 -
Python3.6内置函数(6)——bool()
英文文档class bool(x)Return a Boolean value, i.e. one of True or False. x is converted using the standard truth testing procedure. If x is false or omitted, this returns False; otherwise it returns Tr...原创 2019-06-30 22:37:12 · 312 阅读 · 0 评论 -
Python3.6内置函数(5)——bin()
英文文档bin(x)Convert an integer number to a binary string. The result is a valid Python expression. If x is not a Python int object, it has to define an __index__() method that returns an integer.b原创 2018-01-13 15:18:41 · 705 阅读 · 0 评论 -
Python3.6内置函数(4)——ascii()
英文文档ascii(object)As repr(), return a string containing a printable representation of an object, but escape the non-ASCII characters in the string returned by repr() using \x, \u or \U escapes. Thi原创 2018-01-13 15:17:50 · 479 阅读 · 0 评论 -
Python网络数据采集Urllib库的基本使用
作为一个数据科学家,从网络获取数据是必备的手段之一。今天来说一下使用Python来采集数据,虽然很多人更想叫它爬虫,但是本人更愿意叫网络数据采集。下面说一下Python中Urllib库的基本使用。在Python2.7中还有urllib2库,但是在Python3中,已经没有urllib2了,它们被整合到了一起成为urllib库。先看一个简单的小栗子:#coding:utf原创 2017-03-02 08:20:12 · 992 阅读 · 0 评论 -
MySQL中使用正则表达式
预备阅读:正则表达式基础MySQL中用正则表达式进行搜索1、使用MySQL正则表达式(1)基本字符串匹配SELECT prod_nameFROM productsWHERE prod_name REGEXP ‘1000’ORDER BY prod_name;检索prod_name包含文本1000的所有行。除关键字LIKE被REGEXP替代外,这条语句看上去非常像原创 2017-02-20 22:41:21 · 929 阅读 · 0 评论 -
Python连接pymysql库实现简单的转账功能
学习Python和数据库的时候,总想找些实例练手,但是又很难找到自己想做的项目和案例,其实案例就在我们生活中,下面分享一下Python实现简单转账功能的代码。供大家参考。#-*-coding:utf-8-*-'''建表create database imooc;create table account( acctid INT (11) DEFAULT NULL COMMENT原创 2017-02-21 22:55:07 · 604 阅读 · 0 评论 -
Python中Requests库的用法
前面讲了Python的urllib库的使用和方法,Python网络数据采集Urllib库的基本使用,Python的urllib高级用法 。今天我们来学习下Python中Requests库的用法。Requests库的安装利用 pip 安装,如果你安装了pip包(一款Python包管理工具,不知道可以百度哟),或者集成环境,比如Python(x,y)或者anaconda的话,就可以直接原创 2017-03-05 21:16:25 · 953 阅读 · 0 评论 -
Python中的希尔排序和选择排序
相关阅读:Python的冒泡排序和插入排序算法前言昨天分享了我之前学习和写的python中的冒泡排序和插入排序,今天继续来分享一下希尔排序和选择排序方法。希尔排序希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法(前面冒泡排序和希尔排序是稳定的)。该方法因DL.Shell于1959年提出而得原创 2017-04-07 09:49:45 · 651 阅读 · 0 评论 -
Python的lxml库学习之XPATH语法
预备阅读:Python中lxml库的用法前言前面已经学习了Python的lxml库,从库的名称来看,lxml包含了xml,所以lxml同样可以解析XML文档,而lxml使用的就是XPATH语法。下面做一下简单介绍。XPath语法XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主原创 2017-03-29 09:20:46 · 1723 阅读 · 0 评论 -
requests‐bs4路线实现中国大学排名定向爬虫
预备阅读:Python中Requests库的用法 Python中Beautiful Soup的用法 前言最近学习了北京理工大学崇天老师的Python爬虫课程,老师讲了一个实现“中国大学排名定向爬虫”的实例,这里想自己实现一下,并分享给大家。2016年中国最好大学排名:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html功能描原创 2017-03-24 08:37:41 · 1488 阅读 · 0 评论 -
Python中lxml库的用法
前言前面已经学习了requests和beautifulsoup库的知识,大家可以看Python中Requests库的用法,Python中Beautiful Soup的用法,今天再来学习一下用一种网页解析的库lxml。lxml是Python语言里和XML以及HTML工作的功能最丰富和最容易使用的库。lxml是为libxml2和libxslt库的一个Python化的绑定。它与众不同的地方是原创 2017-03-16 16:15:07 · 2913 阅读 · 1 评论 -
Python实现“维基百科六度分隔理论“之基础爬虫
预备阅读:Python的urllib高级用法 Python中Beautiful Soup的用法 Python中的正则表达式模块re 前言前面学习了urllib和beautifulsoup来进行数据采集,相信大家都有了一些基础,如果没有,请看预备阅读,今天来做一个有趣的数据采集,就是遍历一个域名。最近看了一下六度分隔理论,所以今天用Python来实现“六度分隔理论”原创 2017-04-05 08:35:47 · 2856 阅读 · 1 评论 -
Python的冒泡排序和插入排序算法
前言今天整理文件时,发现了这部分排序内容,冒泡排序和插入排序的算法实现,在我刚接触Python的时候,面试官让我写一个C语言的冒泡排序,我勉强写出来了,当时对自己不是太满意,所以就回来重新学习了冒泡排序。这里分享一下Python实现冒泡排序和插入排序。冒泡排序冒泡排序(Bubble Sort),是一种计算机科学领域的较简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如原创 2017-04-06 08:59:28 · 1036 阅读 · 0 评论 -
【实战】Python读写Excel实例应用
预备阅读:Python使用xlrd和xlwt读写Excel的简单用法前言前面我们学习了简单的Python操作Excel的两个库xlrd和xlwt,今天来实际操作一个案例来增强实战功能。案例背景我们市场部的同学想通过分析广告投放时间前后(分钟级,前1分钟到后5分钟)的用户活跃数据来分析我们广告的投放效果,来决定是否继续投放和投放的其他选择性,所以他们需要我来帮忙计算一原创 2017-05-26 13:07:37 · 2135 阅读 · 0 评论 -
【干货】Python使用matplotlib实现数据可视化
前言俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。matplotlib现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。今天我们的主角是Python中的ma...原创 2017-05-31 11:54:16 · 4047 阅读 · 0 评论 -
Python3.6内置函数(1)——abs()
前言最近在重新梳理Python,就想着整理下最新版的Python知识,就从Python的内置函数开始吧。abs()abs(x)返回数字的绝对值,参数可以是整数、浮点数或者复数。如果参数是一个复数,此方法返回此复数的绝对值(此复数与它的共轭复数的乘积的平方根)。下面通过代码来实际看一下:>>> help(abs)Help on built-in原创 2017-06-03 09:00:46 · 1150 阅读 · 0 评论 -
Python3.6内置函数(2)——all()
英文文档all(iterable) Return True if all elements of the iterable are true (or if the iterable is empty). Equivalent to:如果iterable的所有元素不为0、”、False或者iterable为空,all(iterable)返回True,否则返回False。函数等原创 2017-06-03 09:03:53 · 631 阅读 · 0 评论 -
Python错误TypeError: write() argument must be str, not bytes
小记一下,今天使用open打开文件的时候出现了下面的错误。注:我用的是Python3.6.1版本。TypeError: write() argument must be str, not bytes网上搜索才发现原来是文件打开的方式有问题。之前文件打开的语句是:filehandle = open(WAV_FILE, 'w')然后使用二进制方式打开就没有这个问题:f...原创 2018-01-13 15:04:10 · 18372 阅读 · 0 评论 -
Python3.6内置函数(3)——any()
英文文档:any(iterable) Return True if any element of the iterable is true. If the iterable is empty, return False Equivalent to:如果iterable的一个元素不为0、”、False或者iterable为空,any(iterable)返回True,否则返回False。函原创 2018-01-13 15:17:03 · 510 阅读 · 0 评论 -
Python统计列表中的重复项出现的次数的方法
前言在实际工作和学习中,经常会遇到很多重复的数据,但是我们又必须进行统计,所及这里简单介绍一下统计列表中重复项的出现次数的简单方法。实例本文实例展示了Python统计列表中的重复项出现的次数的方法,是一个很实用的功能,适合Python初学者学习借鉴。具体方法如下:#方法1:mylist = [1,2,2,2,2,3,3,3,4,4,4,4]myset = set(myl原创 2017-02-26 15:47:40 · 9466 阅读 · 0 评论