- 博客(20)
- 收藏
- 关注
原创 SQL实战训练
文章目录前言一、用户消费趋势分析1.每月消费总金额2.每月消费次数3.每月下单人数二、用户消费特征分析1.用户首次购买记录2.用户消费时间段3.男女消费频次4.不同年龄段不同性别的用户消费金额5.多次消费的用户第一次和最后一次的消费间隔6.每月消费最高的三天三、用户质量分析1.多少用户仅消费了一次?2.复购率3.回购率4.消费二八法则(客户贡献率)前言本文数据来源于《七周成为数据分析师》,可在以下网盘链接获取本次分析数据:链接:https://pan.baidu.com/s/14CvQiDa6blA
2020-08-25 18:32:52 489
原创 【SQL经典50题】--MySQL5.7版本
数据表说明:学生表Studentsid:学生id,sname:学生姓名,sage:学生出生日期,ssex:学生性别课程表Coursecid:课程id,cname:课程名,tid:教师id教师表Teachertid:教师id,tname:教师姓名成绩表SCsid:学生id,cid:课程id,score:成绩创建上述各表,并且向表中插入数据:Student和SC表通过学生id(sid)来连接,Course和Teacher表通过教师id(tid)连接,SC和Cour
2020-08-18 17:14:57 1045
原创 【SQL经典50题】9.查询和“ 01 “号的同学学习的课程完全相同的其他同学的信息【正解】
SQL经典50题里,第9题正解正确解答需用到group_concat()函数,代码如下:select *from studentwhere sid in ( select sid from sc group by sid having group_concat(cid ORDER BY cid) = ( select group_concat(cid ORD
2020-08-14 22:46:35 3002
原创 Tableau 2020.2版本——环形图
Tableau 2020.2版本画环形图时遇到问题说明:tableau更新到2020.2.x版本后,记录数和以前不一样了。以前的版本做环形图,需要把记录数改成平均值或者最小值的形式。但是最新版的记录数已经没有这个功能了(即,不能将订单数下设置为平均值或最小值)。解决方法:方法一:第一步:订单数拖至行,再复制一个,生成两个柱状图。第二步:点击三角符号,将订单数进行如下设置【快速表计算–>排序】。这一步是解决问题的关键点!!!第三步:在全部的标记下面选择饼图,上方菜单选择整个视图。
2020-08-07 14:55:09 1038 2
原创 Pandas的Series转换为DataFrame
说明在平时数据分析时,通过describe和groupby生成的统计数据,更多的时候是属于series格式的(数据类型DataFrame,如果只有一列,数据类型就自动转为Series)。而我们在后续的分析或者数据合并的过程中,我们往往需要将series格式转换成dataframe格式。虽然Series有一个to_frame()方法,但是当Series的index也需要转变为DataFrame的一列时,这个方法转换会有一点问题。1. to_frame()方法a = pd.Series(['1',
2020-07-22 20:53:56 14485 1
原创 matplotlib中各颜色对应的英文单词
输入color=‘颜色名字’选取对应的颜色出处:https://finthon.com/matplotlib-color-list/
2020-07-20 15:39:18 1587
原创 剑指offer(Python版本)-- 链表
链表的结构链表每一个结点的结构如下:class ListNode: def __init__(self, x): self.val = x # 链表的值 self.next = None # 链表指向的下一个结点如何实现一个链表? 如下所示:class ListNode: def __init__(self, x): self.val = x # 链表的值 self.next = None # 链表指向
2020-05-18 16:54:44 150
原创 剑指offer(Python版本)-- 数组、栈、队列(未完待续)
1 二维数组中的查找题目描述:在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。实现代码如下:class Solution: # array 二维列表 def Find(self, target, array): # write code here # 1 2 3 4 # 3 4 5 6
2020-05-15 16:13:05 162
原创 剑指offer(Python版本)-- 递归和循环
1 斐波那契数列F(1)=1,F(2)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 3,n ∈ N*)题目描述:现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0,第1项是1)。实现代码如下:class Solution: def Fibonacci(self, n): # write code here ''' # 递归解法(会超时,时间复杂度为O(2^n)) if n<=1:
2020-05-13 13:27:29 178
原创 python爬虫编程实践 Task3--selenium、session和cookie(实例:模拟登录163)
selenium(自动化测试工具)1.selenium是什么:一个自动化测试工具(大家都是这么说的)2.selenium应用场景:用代码的方式去模拟浏览器操作过程(如:打开浏览器、在输入框里输入文字、回车等),在爬虫方面很有必要准备工作:1.安装selenium(pip install selenium)2.安装chromedriver(一个驱动程序,用以启动chrome浏览器,具...
2020-04-29 11:10:20 344
原创 python爬虫编程实践 Task4--大作业(某网站新闻爬取)
腾讯新闻爬取用selenium爬取https://news.qq.com/ 的热点精选通过chrome的开发者工具,监控网络请求,并分析用selenium完成爬虫了解ajax加载python学习之滚动页面函数execute_script滚动到底部:window.scrollTo(0,document.body.scrollHeight)滚动到顶部:window.scrollTo...
2020-04-29 09:38:54 910
原创 python爬虫编程实践 Task2--学习Xpath(实战:提取丁香园论坛的回复内容)
学习xpath学习目标:学习xpath,使用lxml+xpath提取内容。使用xpath提取丁香园论坛的回复内容。抓取丁香园网页:http://www.dxy.cn/bbs/thread/626626#626626Xpath常用的路径表达式:1.XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。2.在X...
2020-04-29 00:15:09 242
原创 python爬虫编程实践 Task3--IP代理(实例:从网站获取有效的代理IP地址)
为什么会出现IP被封网站为了防止被爬取,会有反爬机制,对于同一个IP地址的大量同类型的访问,会封锁IP,过一段时间后,才能继续访问如何应对IP被封的问题有几种套路:修改请求头,模拟浏览器(而不是代码去直接访问)去访问采用代理IP并轮换设置访问时间间隔如何获取代理IP地址从该网站获取: https://www.xicidaili.com/inspect -> 鼠标定位:...
2020-04-25 22:46:25 284
原创 python爬虫编程实践 Task2--Re(正则表达式)入门(实战:淘宝商品比价定向爬虫)
Re库(正则表达式)入门正则表达式是用来简洁表达一组字符串的表达式,是一种通用的字符串表达框架,可以用来判断某字符串的特征属性正则表达式在文本处理中十分常用:表达文本类型的特征(病毒、入侵等)同时查找或替换一组字符串匹配字符串的全部或部分1 正则表达式的语法正则表达式语法由字符和操作符构成常用操作符说明实例.表示任何单个字符[ ]字符集,对...
2020-04-24 10:51:37 500
原创 python爬虫编程实践 Task2--Beautiful Soup库入门(实战:中国大学排名定向爬取)
Beautiful Soup库入门1.Beautiful Soup 是一个HTML/XML 的解析器,主要用于解析和提取 HTML/XML 数据。2.它基于HTML DOM 的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。3. BeautifulSoup 用来解析 HTML 比较简单,API非常人性化,支持CSS选择器、Python标准库中的HT...
2020-04-22 17:45:53 497
原创 python爬虫编程实践 Task1--简单爬虫
一个网络爬虫程序最普遍的过程:1.访问站点;2.定位所需的信息;3.得到并处理信息。示例1:爬取python之禅(The Zen of Python)requests.get获取HTML网页的主要方法,对应于HTTP的GETimport requestsurl = 'https://www.python.org/dev/peps/pep-0020/'r = requests.ge...
2020-04-21 22:15:48 722
原创 零基础入门数据挖掘 Task02:数据的探索性分析(EDA)
Task02:数据的探索性分析(EDA)你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全...
2020-03-24 21:38:41 1033
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人