Python
文章平均质量分 83
Jack Tian
微信公众号:杰哥的IT之旅,微信:Hc220088
展开
-
太强了!利用 Python 连接 ES 查询索引某个字段命中数的脚本!
Python 脚本随笔原创 2023-12-17 16:03:58 · 141 阅读 · 1 评论 -
Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸
来源:公众号【杰哥的IT之旅】作者:阿拉斯加ID:Jake_Internet如需获取本文完整代码及 LOL 壁纸,请为本文右下角点赞并添加杰哥微信:Hc220088 获取。一、背景介绍随着移动端的普及出现了很多的移动 APP,应用软件也随之流行起来。最近看到英雄联盟的手游上线了,感觉还行,PC 端英雄联盟可谓是爆火的游戏,不知道移动端的英雄联盟前途如何,那今天我们使用到多线程的方式爬取 LOL 官网英雄高清壁纸。二、页面分析目标网站:https://lol.qq.com/data/info.原创 2021-10-21 11:36:11 · 778 阅读 · 0 评论 -
利用 Python 实现多任务进程
利用 Python 实现多任务进程原创 2021-10-14 17:40:27 · 249 阅读 · 2 评论 -
杰哥原创的 Pyecharts 和 Matplotlib 数据可视化手册,开放下载啦!
大家好,我是JackTian。最近 CSDN 的原创文章更新较慢了,主要原因还是工作太忙,加班到很晚,几乎写一篇高质量的原创文章,零零散散得好久,索性就把主业做好,等后面时间空闲了再来跟大伙分享。其次,这段时间我也在输出 PDF 文件,包括之前给大家分享的 杰哥亲自整理的 3 份面试题 PDF 手册,免费开放下载! 讲真这份面试题涵盖的领域还是非常广泛的,需要一定的时间消化。刚好马上也到了金九银十的时候,来年金三银四为打算跳槽的朋友圈助上我那一臂之力吧!废话不多说,进入正题。今天要跟大家分享的是原创 2021-08-15 19:56:36 · 438 阅读 · 2 评论 -
Python实战 | “端午节” 送亲戚,送长辈,粽子可视化大屏来帮忙!
公众号:「杰哥的IT之旅」,后台回复:「粽子」即可获取本文完整数据本文简介今年,我用 Python 爬取了京东上面的 “粽子数据” 进行分析,看看有啥发现吧!本文就从数据爬取、数据清洗、数据可视化,这三个方面入手,但你简单完成一个小型的数据分析项目,让你对知识能够有一个综合的运用。整个思路如下:爬取网页: https://www.jd.com/爬取说明: 基于京东网站,我们搜索网站“粽子”数据,大概有100页。我们爬取的字段,既有一级页面的相关信息,还有二级页面的部分信息;爬取思路: 先.转载 2021-06-12 16:40:45 · 448 阅读 · 1 评论 -
最详细的 Python 结合 RFM 模型实现用户分层实操案例!
作者:Cherich_sun链接:https://www.jianshu.com/p/f020dfdce58d本文为读者投稿写在最前:做数据分析的小伙伴可能多多少少都知道一些分析方法,但是谈到分析思维却没有底气或者遇到业务问题,不知道如何下手。如果你有上述困惑,那么本篇文章可以作为参考。下图是整理的分析方法论及方法。如果能够灵活运用,将能够解决工作中 80% 以上问题。注意的是,方法论是思维层面,方法是执行层面。那么,重点是我们如何将其应用到实际业务中。本文将以 RFM 模型 为例,运用到实际案例中。(本文原创 2021-05-25 15:03:42 · 1286 阅读 · 17 评论 -
超硬核!11 个非常实用的 Python 和 Shell 拿来就用脚本实例!
作者:养乐多 编辑:JackTian来源:公众号「杰哥的IT之旅」ID:Jake_Internet原文链接:超硬核!11 个非常实用的 Python 和 Shell 拿来就用脚本实例!转载请联系授权(微信ID:Hc220088)关注公众号:「杰哥的IT之旅」后台回复:「脚本合集」可获取本文全部脚本实例文件关注公众号:「杰哥的IT之旅」后台回复:「wx」 可邀请你加入读者交流群大家好,我是JackTian。在上一篇分享的原创文章《7 个非常实用的 Shell 拿来就用脚本实例!》中.原创 2021-04-14 09:57:28 · 698 阅读 · 1 评论 -
太秀了!用Excel也能实现和Python数据分析一样的功能!
作者:Cherich_sun来源:公众号「杰哥的IT之旅」ID:Jake_Internet太秀了!用Excel也能实现和Python数据分析一样的功能!这是一篇关于如何用excel做数据分析的案例。目的是帮助大家,在遇到小型数据样本时,快速利用excel做分析。所以本篇文章的重点是分析思路+数据处理+可视化的实现,因为数据来源于网络,所以不做深入解析。需求说明分析某电商企业销售趋势,找到影响销售增长的因素。同时分析不同市场产品销售状况,找到不同市场的销售差异。挖掘不同产品的销售状况,找到不同产.原创 2021-03-05 10:08:40 · 7560 阅读 · 5 评论 -
我用 Python 分析了一波热卖年货,原来大家都在买这些东西?
作者:Cherich_sun来源:公众号「杰哥的IT之旅」ID:Jake_Internet原文链接:我用 Python 分析了一波热卖年货,原来大家都在买这些东西?公众号:杰哥的IT之旅,后台回复:「年货」,即可获取本文完整数据。今年不知道有多少小伙伴留在原地过年,虽然今年过年不能回老家,但这个年也得过,也得买年货,给家人长辈送礼。于是我出于好奇心的想法利用爬虫获取某宝数据,并结合 Python 数据分析和第三方可视化平台来分析一下大家过年都买了哪些东西,分析结果大屏如下:上面使用清洗好的数.原创 2021-02-07 14:13:17 · 1155 阅读 · 2 评论 -
利用 Python 分析了某化妆品企业的销售情况,我得出的结论是?
【导语】本篇文章是关于某化妆品企业的销售分析。从分析思路思路开始带大家一步步的用python进行分析,找出问题,并提出解决方案的整个流程。需求:希望全面了解此某妆品企业的销售情况,帮助企业运营领导层了解企业整体销售运营情况及商品销售情况,为该企业的营销策略提供相对应的建议和销售策略。业务分析流程1、 场景(诊断现状)对象:用户;销售关注点:找到影响销售的增长因素目标:发现问题&提出解决方案2、需求拆解分析销售趋势,找到影响企业营收增长的商品或区域按月份销售趋势图(整体)原创 2021-02-01 17:05:48 · 7026 阅读 · 1 评论 -
为了探究妹纸对内衣的喜好,我爬了淘宝内衣店的数据!
作者:躲猫猫的猫来源:https://www.cnblogs.com/zhaww/p/9636383.html公众号:杰哥的IT之旅,后台回复【内衣】获取全部源码。大家好,希望各位能怀着正直、严谨、专业的心态观看这篇文章。ヾ(๑╹◡╹)ノ"接下来我们尝试用 Python 抓取天猫内衣销售数据,并分析得到中国女性普遍的罩杯数据、最受欢迎的内衣颜色是什么、评论的关键字。我们先看看分析得到的成果是怎样的?(讲的很详细,推荐跟着敲一遍)图片看不清楚的话,可以把图片单独拉到另一个窗口。这里是分析了.转载 2020-10-31 10:21:33 · 823 阅读 · 1 评论 -
70 个数据分析常用网址!
转自:小蚊子数据分析今天给大家分享的这篇文章,更像是一份数据分析常用网站字典,一共70个,可视化、词频词云、PPT模板等等面面俱到,值得收藏!数据可视化工具百度ECharts: http://echarts.baidu.com/Cytoscape: http://www.cytoscape.org/图表秀: http://www.tubiaoxiu.com/数据观: http://shujuguan.cn/微博足迹可视化: http://vis.pku.edu.cn/weibova/wei.转载 2020-10-05 08:12:40 · 1764 阅读 · 0 评论 -
看了这个总结,其实 Matplotlib 可视化,也没那么难!
作者:旧时晚风拂晓城来源:https://blog.csdn.net/fyfugoyfa/category_9975786.html公众号:杰哥的IT之旅,后台回复:matplotlib数据可视化,获取本文完整数据集。Python 中可以通过 matplotlib 模块的 pyplot 子库来完成绘图。Matplotlib 可用于创建高质量的图表和图形,也可以用于绘制和可视化结果。matplotlib 是 Python 优秀的数据可视化第三方库,matplotlib.pyplot 是绘制种类可视化.转载 2020-09-16 14:35:05 · 632 阅读 · 0 评论 -
利用 Python 爬取了 37483 条上海二手房信息,我得出的结论是?
作者:林小呆编辑:JackTian公众号:杰哥的IT之旅,后台回复:「上海二手房数据」可获取本文完整数据本文数据来源于链家网,搜集时间为2020年7月23日。本次项目使用Scrapy-Redis分布式爬取链家网数据,请自备代理ip。完整代码我已经放文末链接中,本文不再赘述爬虫细节,源码中我都有详细注释。仪表板展示项目背景去面试的时候被问上海二手房的一些情况,作为一个土著,我只知道上海这个区挺贵的那个区大概这个价,但是具体数值却说不上来。所以,就有了本文。从政策上来看,自从 2016.原创 2020-08-22 13:07:01 · 18190 阅读 · 29 评论 -
利用 Python 爬取了近 3000 条单身女生的数据,究竟她们理想的择偶标准是什么?
灵感来源与学习:利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?本文原创作者:壹加柒本文来源链接:https://blog.csdn.net/yu1300000363/article/details/107316568前几天手机上CSDN推荐了一篇文章《利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?》,恰好最近也在学习爬虫相关知识,打开一看,从数据的爬取——》数据的清洗——》数据的可视化,涵盖的知识是很多我从前没有尝试过的。之前一直的实战一直停.转载 2020-07-13 16:40:49 · 1488 阅读 · 1 评论 -
Python 爬取招聘网站数据,利用 tableau 可视化交互大屏,指导你如何学习、找工作!
作者:Huang supreme来源链接:https://blog.csdn.net/weixin_41261833/article/details/104924038 如果觉得文章写得好,如果你想要博客文章中的数据,请关注公众号:【杰哥的IT之旅】,添加作者【个人微信】,进群和上百名小伙伴一起交流学习!目录 1、项目背景 2、信息的爬取(基于51job招聘网站的数据爬取) 1)导入相关库 2)关于翻页的说明 3)完整的爬取代码 3、数据预处理 1)相关库的导.转载 2020-07-09 17:16:31 · 1704 阅读 · 2 评论 -
利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?
作者:JackTian、黄伟呢公众号:杰哥的IT之旅,后台回复:「运维」可获取本文完整数据大家好,我是 JackTian。我经常会收到读者关于一系列咨询运维方面的事情,比如:杰哥,运维到底是做什么的呀?运维的薪资水平/ 待遇怎么样呢?杰哥帮忙看下这个岗位的招聘需要对于小白来说,能否胜任的了呢?等等。这里,我把之前写的《一篇文章带你解读从初级运维工程师到资深运维专家的学习路线》,本文从初级 / 中级 / 高级运维工程师以及到资深方向逐步展开给大家汇总了一些各阶段所具备的技能,仅供学习路线参考,如有.原创 2020-07-09 13:55:57 · 26467 阅读 · 60 评论 -
Python 数据分析之 Numpy (二)
作者:小蜗牛爱学习来源:https://blog.csdn.net/qq_42755939/article/details/107032142一、Numpy读取文件loadtxt()方法numpy.loadtxt(fname, dtype=, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)参数作用fname被读取的文件名(文件的相.转载 2020-07-04 08:22:19 · 682 阅读 · 0 评论 -
Python 数据分析之 Numpy (三)
作者:小蜗牛爱学习来源:https://blog.csdn.net/qq_42755939/article/details/107091694一、数组的拼接1、竖向拼接vstack()import numpy as npimport matplotlib.pyplot as pltarr1 = np.arange(1,10).reshape(3,3)arr2 = np.arange(10,19).reshape(3,3)print(arr1)#[[1 2 3] [4 5 6] [7.转载 2020-07-04 08:17:20 · 844 阅读 · 0 评论 -
Python 数据分析之 Numpy(一)
作者:小蜗牛爱学习来源:https://blog.csdn.net/qq_42755939/article/details/106953651?utm_source=app一、什么是 Numpy?NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供.转载 2020-07-04 08:01:33 · 658 阅读 · 0 评论 -
我精心整理的 136 页 Excel 数据透视表 PDF 文件!【附获取方式】
大家好,我是 JackTian。我的一位好朋友,也是我的一位忠实读者了,从我2018年刚开始做公众号那时,就一直关注到我到现在。累积赠送他书籍共有小 10 余本,我的这位好朋友呢,也非常的良心。他说:杰哥,你每次赠书给我,我也不知道给你点什么回报好?所以呢,我就写几篇原创文章给你吧,顺便也想希望你这个公号平台能够交识到一些同专业领域的小伙伴。他在我公号上的历史原创文章如下:我花了一周的时间,就为了整理这份 97 页的 Python 自动化系列文档。【附获取方式】| 修订版精心整理的 52 页 P转载 2020-06-30 19:19:55 · 1590 阅读 · 0 评论 -
Python数据分析实战之北京二手房房价分析
北京二手房房价分析与预测目的:本篇给大家介绍一个数据分析的初级项目,目的是通过项目了解如何使用Python进行简单的数据分析。数据源:博主通过爬虫采集的链家全网北京二手房...转载 2018-10-09 00:00:00 · 10415 阅读 · 18 评论 -
数据分析之 AB testing 实战(附 Python 代码)
投稿作者:Huang supreme整理编辑:JackTian微信公众号:杰哥的IT之旅(ID:Jake_Internet)1、增长黑客1)前言说到 AB testing,就不得不说到增长黑客,这个词大约在 2015 年就引入到中国了,但是在 2018 年开始火热起来。那么互联网公司想要增加活跃用户、增加收入,现在的产品运营还是采用增长黑客这样一种运营方式,并不是产品经理一拍脑袋就可以想到,或者老板直接拍板决定就可以做到的。大家现在的玩儿法都是“数据驱动”,使用数据驱动方式来帮助运营更好的产.转载 2020-05-24 23:22:05 · 1329 阅读 · 0 评论 -
利用 Python 进行多 Sheet 表合并、多工作簿合并、一表按列拆分
作者:黄伟一、相关知识点讲解1、需要使用的相关库1importnumpyasnp2importpandasaspd3importos2、os.walk(pwd)举例如下② 代码操作如下:1pwd="G:\\a"2print(os.walk(pwd))3foriinos.walk(pwd):4print...原创 2019-11-10 00:00:00 · 4795 阅读 · 1 评论 -
我去,原来 520 情人节大家都在买这款口红!
一、案例说明1、案例背景520情人节,不懂送女朋友口红色号?没关系!Python 数据分析告诉你。我们爬取了京东商城口红近 4000 条口红商品信息,并对这些口红数据进行分析,让大家买口红给女朋友时有个选择的参考,从如下几个方面去分析:1、哪些价格区间的口红卖的最好?2、口红销量分布情况。3、销量前10的口红有哪些?4、销量前10的店铺。5、商品价格和销量的关系。2、任务说明通过 Python 爬虫爬取了京东上所有口红铺的数据集 jd_data.csv。我们希望通过该数据集,针对不同的原创 2020-05-20 08:04:30 · 1875 阅读 · 41 评论 -
精心整理的 52 页 Python 操作 excel、word、pdf 文件【附获取方式】
大家好,我是 JackTian。前两天有一位忠实读者微信跟我聊天说:是想将他精心整理的 52 页 PDF,顶 10 篇 Python 自动化办公文章,分享给大家。废话不多说,直接进入正题。PDF 文件预览:这份 Python 操作 excel、word、pdf 分为三个章节,如下:章节一:Python 使用 openpyxl 操作 excel章节二:Python 使用 PyPDF2 和 pdfplumber 操作 pdf章节三:Python 使用 python-docx 操作 word转载 2020-05-18 12:04:53 · 811 阅读 · 0 评论 -
100天从 Python 小白到大神的学习资源,都在这了。
大家好,我是 JackTian。近期我们收集了一些读者对本公众号的建议与反馈,其主要目的是想了解读者用户们的画像以及关注本公众号的主要原因和希望从本公众号获得什么?那么针对这一问题的调研来看,大家还是想从本公众号内得到一些自己所想要的知识点以及相关性的资料,从而来提升自身的技术水平。因为,我们现在所分享的技术文章都比较琐碎,没有把某一知识点成系列性的进行输出,因此也就无法满足所有读者们的需求,但这也是杰哥目前最头疼的一件事情了。所以,我们现在大力鼓励一些技术能力超强的小伙伴一起投入到本公众号中,分享原创 2020-05-17 16:07:59 · 1749 阅读 · 2 评论 -
Python 自动化办公之"你还在手动操作“文件”或“文件夹”吗?"
作者:Huang supreme原文:https://blog.csdn.net/weixin_41261833/article/details/1059487331、输出目录下所有文件及文件夹1)os.getcwd():获取当前python程序的运行路径import osos.getcwd()结果如下:2)路径中斜杠(/)和反斜杠()的说明3)os.path.join...转载 2020-05-07 16:30:16 · 384 阅读 · 0 评论 -
DataFrame(14):对比MySQL学习“Pandas的groupby分组聚合”(超详细)
作者:Huang supreme来源:https://blog.csdn.net/weixin_41261833/article/details/104232262本文叙述使用的“数据集”链接下载地址如下:http://note.youdao.com/noteshare?id=5f44492149116cb6c52233786c1ca98d&sub=6C35AFC6AF944164...转载 2020-03-02 22:10:56 · 1598 阅读 · 0 评论 -
Python实现RFM建模
作者:Huang supreme来源:https://blog.csdn.net/weixin_41261833/article/details/104425817目录 1、RFM模型的含义 2、RFM分析的前提条件 3、原始数据 4、数据处理 4.1、什么是R、F、M呢? 4.2、熟悉数据集 4.3、保留有效数据 4.4、选取有效字段 4.5...转载 2020-03-02 22:04:41 · 2341 阅读 · 4 评论 -
matplotlib绘图的核心原理讲解(超详细)
作者:Huang supreme来源:https://blog.csdn.net/weixin_41261833/article/details/1042997011、核心原理讲解使用matplotlib绘图的原理,主要就是理解figure(画布)、axes(坐标系)、axis(坐标轴)三者之间的关系。张三的画板matplotlib绘图2、matplotlib库的安装与导入...转载 2020-02-15 13:36:33 · 2940 阅读 · 2 评论