![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python入门
草莓女孩
这个作者很懒,什么都没留下…
展开
-
利用Python进行用户消费行为分析(CDNOW_master)
用户消费行为的分析报告 想必大家对于CD用户消费者行为的分析已经见得多了,这里就不再一一叙述,这里主要是作为我的一个小练习,来提高自己处理业务的能力。 项目需求如下:(1)用户消费趋势分析每月的消费总金额每月的消费次数每月的产品购买量每月的消费人数(2)用户个体消费行为分析用户消费金额和消费总数的描述统计用户消费金额和消费总数的散点图用户消费金额和消费总数的分布图用户累计消费金额的占比(3)用户消费行为分析用户第一次消费时间(用户首次购买产品的时间)用户最后一次消原创 2020-05-29 16:44:06 · 3931 阅读 · 0 评论 -
利用Python进行电商网站用户行为分析
电商网站用户行为分析项目需求1.用户整体购物情况怎样?统计数据集中总的用户数,商品数,商品类别数,用户行为数。核心指标如PV,UV,跳出率,复购率,留存率等分别是多少?2.用户的购物行为情况。3.统计出每天各种行为的访问次数。4.找出购买率最高的前二十个商品品类。分析过程:获取业务方的需求->获取数据->分析数据->整理并清洗异常数据->实现需求获取数据import pandas as pdimport matplotlib.pyplot as pltpl原创 2020-05-28 22:02:55 · 6235 阅读 · 9 评论 -
泰坦尼克号数据集的下载
这是一个常用的数据,给大家个链接,可以去该链接下载数据集http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt原创 2020-03-30 20:29:46 · 24884 阅读 · 26 评论 -
ndarray的矩阵操作
import numpy as np# 1.基本矩阵操作# 1)算术运算符:加减乘除n = np.random.randint(0, 10, size=(4, 5))print(n)n1 = n + 10print(n1)n2 = np.add(n, 10)print(n2)n3 = n/2print(n3)# 2)矩阵积np.dot()n4 = np.rando...原创 2020-05-27 20:25:09 · 119 阅读 · 0 评论 -
ndarray的排序
import numpy as np# def Sort()代码越短越好# 普通的排序n1 = np.array([2, 4, 5, 7, 1])def sort(nd): for i in range(nd.size): for j in range(i, nd.size): if nd[i] > nd[j]: ...原创 2020-05-27 20:24:55 · 697 阅读 · 0 评论 -
图片灰度处理
import scipy.misc as miscimport matplotlib.pyplot as pltimport numpy as np# 获取图片face_g = misc.face(gray=True)plt.imshow(face_g, cmap="gray")# plt.show()# print(face_g.shape)# 将彩色图片变为灰色图片 彩色...原创 2018-08-26 17:18:40 · 6104 阅读 · 1 评论 -
Matplotlib基础知识(一)
import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.font_manager import FontProperties #字体管理器'''Matplotlib中的基本元素图表包括的元素:---x轴和y轴:水平和垂直的轴线---x轴和y轴刻度:刻度表示坐标轴均分隔,包括最小刻度和最大刻度---x轴和y轴刻度...原创 2018-08-26 17:32:58 · 1375 阅读 · 0 评论 -
设置plot的风格和样式(二)
import matplotlib.pyplot as pltimport numpy as np'''plot语句中支持除X,Y以外的参数,以字符串形式存在,来控制颜色、线性、点型等要素,语法形式如下:plt.plot(X,Y,"format",...)''''''点和线的样式。'''# 颜色:参数color或c 颜色值的方式:(1)别名color="r";(2)合法的HT...原创 2018-08-26 17:26:37 · 6602 阅读 · 0 评论 -
Matplotlib图形内的文字注释、箭头(三)
import numpy as npimport matplotlib.pyplot as plt''''---text():在Axes对象的任意位置添加文字---xlabel():为X轴添加标签---ylabel():为Y轴添加标签---title():为Axes对象添加标题---legend():为Axes对象添加图例---figtext():在Figure对象的任意位置添...原创 2018-08-26 17:22:20 · 8099 阅读 · 1 评论 -
Python中的函数
函数的定义在一个完整的项目中,某些功能会被反复的进行使用,我们须将这些功能封装成函数,当我们要使用这些功能的时候直接调用函数即可。函数的本质:对功能的封装。 优点:1.简化代码结构,增加了代码的重复利用率; 2.若修改某些功能或者调试某个BUG,只需修改对应的函数即可。定义一个函数函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。#格式def 函数名(参数...原创 2018-08-19 23:09:28 · 259 阅读 · 0 评论 -
Python分析《黄蜂女现身》豆瓣影评分析
最近在学习python爬虫以及数据分析,故想做一个简单的项目来检验一下自己最近的学习状况。在豆瓣上查看正在热映的电影有很多,选择了《黄蜂女现身》这部电影来练手,将豆瓣上对它的影评做一个简单的分析吧!后期还会继续对其他的电影进行分析,下次的分析可能会包括地区等属性,此次只是针对评论进行简单的分析。1、抓取网页数据首先是抓取网页数据,打开豆瓣电影,点击最近的热映电影后,点击全部评论,我们则选取...原创 2018-08-27 13:57:41 · 568 阅读 · 0 评论 -
Python中的文件处理
读文件步骤:1.打开文件;2.读取文件内容;3.关闭文件打开文件格式为:open(path, flags[, encoding][,errors] ),path: 要打开文件的路径, flags:文件的打开方式。 文件的打开方式主要有以下的几种: ‘r’ 以只读的方式打开文件,文件的描述符放在文件的开头。 ‘rb’ 以二进制格式打开一个文件用于只读,文件的描述符放在...原创 2018-08-20 12:32:13 · 172 阅读 · 0 评论 -
Matplotlib中几种常用的图形(四)
条形图条形图常常用来描述一组数据的对比情况,例如:一周七天,每天的城市车流量等。【条形图有两个参数x,y】bar()绘制竖直条形图、barh()绘制水平条形图。 导入绘图工具包:import matplotlib.pyplot as pltimport numpy as np绘制竖直条形图x = np.linspace(0, 5, 5)y = np.random.randin...原创 2018-08-27 17:47:52 · 2541 阅读 · 0 评论 -
numpy中的ndarray聚合操作
import matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 1.求和np.sumn = np.random.randint(0, 150, size=(4, 4, 4))print(n)print(np.sum(n))# 最大最小值:np.max/np.minimage = plt.imread('...原创 2020-05-27 20:25:47 · 132 阅读 · 0 评论 -
ndarray的操作
import numpy as npimport matplotlib.pyplot as plt# 1.索引 一维与列表完全一致 多维也与列表完全一致 可以根据索引修改数据n1 = np.random.randint(0, 100, 10)print(n1, "索引为3的值为:%d" % n1[3]) # [13 44 75 33 49 59 42 17 38 18] 索引为3...原创 2020-05-27 20:25:25 · 117 阅读 · 0 评论 -
Python的标识符
什么是标识符?标识符指的是一串字符串(注意:字符串未必是标识符)规则标识符的规则表示为:只能由字母、数字和下划线组成,开头不能是数字,也不能是Python的关键字。Python的关键字如下:import keywordprint(keyword.kwlist)打印出来的结果如下: (https://img-blog.csdn.net/20180814150234381?wa...原创 2018-08-20 16:40:32 · 6204 阅读 · 0 评论 -
Python的变量和常量
变量的概述变量指的是程序可操作存储空间的名称,程序在运行期间可以修改的数据,每个变量都有特定的类型。变量的作用将不同类型的数据存储到内存中定义变量变量名 = 初始值,初始值是为了确定变量的类型。比如说age = 10,系统会自动判断“age”是整数类型的。举例如下:num1 = input("请输入一个数字")num2 = input("请输入一个数字&am原创 2018-08-20 16:39:00 · 387 阅读 · 0 评论 -
Python的运算符与表达式
什么是表达式?由变量、常量和运算符组成的式子。算术运算符和算术运算表达式算术运算符: +(加) -(减)* (乘) /(除) %(取模) **(求幂) //(取整) 算术运算表达式:1+1 a/3 4%5,等等。功能是进行相关符号的数学运算, 值为相关的数学运算结果。num1 = 30num2 = 50print(num1 + num2)...原创 2018-08-20 16:38:04 · 720 阅读 · 0 评论 -
python中的三大流程
三大流程:分支,循环和顺序if 语句# 格式:if 表达式: 语句逻辑:当程序执行到if语句时,首先计算“表达式的值”,如果“表达式”的值为真,那么执行if下的“语句”。如果“表达式”的值为假,则跳过整个if语句,继续向下执行。num1 = 10num2 = 30if num1 == num2: num2 = 80print("num2 =", num...原创 2018-08-20 16:36:31 · 721 阅读 · 0 评论 -
Pandas的数据处理
常见的聚合方法及说明count—————–计数 describe————-给出各列的常用统计量 min,max————-最大最小值 argmin,argmax—-最大最小值的索引位置(整数) idxmin,idxmax—–最大最小值的索引值 quantile————-计算样本分位数 sum,mean———-对列求和,均值 mediam————-中位数 mad——————根据平均...原创 2018-08-26 17:34:50 · 259 阅读 · 0 评论 -
Pandas的数据结构之Series
import pandas as pdfrom pandas import Seriesimport numpy as np# pandas纳入了大量库和一些标准的数据类型,提供了高效的操作大学数据集所需的工具,pandas提供了大量能# 使我们快速便捷的处理数据的函数和方法,它使Python成为强大而高效的数据分析环境的重要元素之一。# Pandas的数据结构'''Series 是...原创 2018-08-26 17:43:39 · 977 阅读 · 0 评论 -
Pandas的数据结构之DataFrame
from pandas import DataFrameimport pandas as pdimport numpy as np'''DataFrame是一个【表格型】的数据结构,可以看做事【由Series组成的字典】(共用一个索引)。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。行...原创 2018-08-26 17:41:27 · 1501 阅读 · 0 评论 -
使用Python的DataFrame处理丢失数据
import numpy as npfrom pandas import DataFrame, Seriesimport pandas as pd# 处理丢失数据 有两种丢失数据:''' 1)None 是Python自带的,其类型为python object。因此,None不能参与到任何计算中 object类型的运算要比int类型的运算慢的多,计算不同类型数据求和时间2)np....原创 2020-05-27 20:26:50 · 205 阅读 · 0 评论 -
Pandas的多层索引
import numpy as npfrom pandas import DataFrame, Seriesimport matplotlib.pyplot as pltimport pandas as pd'''1.创建多层索引1)隐式构造:最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组'''# Series也可以创建多层索引s = Serie...原创 2020-05-27 20:28:28 · 247 阅读 · 0 评论 -
Pandas的拼接操作
import numpy as npfrom pandas import DataFrame, Seriesimport pandas as pd'''pandas的拼接分为两种:级联:pd.concat,pd.append;合并:pd.merge,pd.join''''''0回顾numpy的级联练习:1.生成2个3*3的矩阵,对其分别进行两个维度上的级联'''nd = np...原创 2020-05-27 20:30:44 · 111 阅读 · 0 评论 -
Pandas数据处理之数据聚合
import pandas as pdimport numpy as npfrom pandas import DataFrame, Series'''5.数据聚合数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值。数据分类处理:-----分组:先把数据分为几组-----用函数处理:为不同组的数据应用不同的函数以转换数据-----合并:吧不同组得到的结果合并起...原创 2020-05-27 20:29:00 · 147 阅读 · 0 评论 -
Pandas数据处理之高级聚合
import numpy as npfrom pandas import DataFrame, Seriesimport pandas as pd'''假设菜市场张大妈在卖菜,有以下属性:菜品(item):萝卜,白菜,辣椒,冬瓜颜色(color):白,红,青重量(weight)价格(price)1.要求以属性作为列索引,新建一个df2.对df进行聚合操作,求出颜色为白色的价格...原创 2020-05-27 20:28:42 · 240 阅读 · 0 评论 -
ndarray的创建
import numpy as np# 使用np.array()由python list创建# 参数列表为:[1,2,3,4,5]# 注意:numpy默认ndarray的所有元素的类型是相同的,如果传递进来的列表中包含不同的类型,# 则统一为同一类型,优先级:str>float>intn1 = np.array([1, 2, 3, 4, 5])print(n1)n2...原创 2020-05-27 20:30:08 · 353 阅读 · 0 评论 -
Python数据类型
Number(数字)主要包括了整数,浮点数(小数)和复数String(字符串)Boolean(布尔值)真和假(True和False)None(空值)list(列表)dict(字典)tuple(元组)set(集合)...原创 2020-05-27 20:31:25 · 207 阅读 · 0 评论