自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 无法定位软件包yum(亲测有效)

可以搞定这个问题所需要的key在报错的返回代码中有提到,然后继续sudo apt-get update之后尝试安装yum,依然有报错,这次的错误是。3、将新的国内源填写到sources.list,这个可以自己百度,我用的中科大源。2、删除源文件并创建新的源文件或者直接打开默认源文件进行修改。这里不得不提一下,参考了其他博主的经验,这里需要在开头添加。就在我以为一切都Ok了以后,重新安装yum,又出现了状况。1、首先将原有的sources.list文件进行备份。此时再重新安装yum就没什么问题了,亲测有效。

2023-08-19 00:28:55 2855 1

原创 大众点评评论爬取

前面我有介绍到点击更多评论之后的评论数据是不加密的,这里我就简单的分析一下网站就好了,通过分析网站我们能发现,更多评论中的评论数据都是写在源代码中的,并且图片是懒加载,且没有涉及加密,这就意味着我们要获取到图片地址是data-lazyload,而不是src。很久之前做的一个小项目了,爬取大众点评的评论,我这里就用熊猫基地的案例来展示整个爬取过程了,首先,其实评论分了两种,一开始进入的评论界面是涉及js逆向的,然后下方的更多评论中的评论爬取就较为简单,不涉及逆向。这里我们用到的是execjs这个库。

2023-08-03 20:44:19 2861 1

原创 pikachu无法连接数据库

这个报错,于是我进入提示的index.php文件,然而并没有发现什么异常,报错提示的是database的名称是pikachu,这跟我们config.inc.php文件中的名称是一致的,所以不会是文件配置问题,于是我打开了phpstudy_pro软件,发现只有root这个数据库,数据库名称也是root,所以我增加了一个pikechu数据库。来删除服务,这里要注意的是,需要使用管理员权限进入cmd,不然无法删除,由于没有截图,所以我就文字叙述了。按回车,进入服务,发现我们找不到MySQL服务进程(虚晃一招)

2023-05-16 12:13:39 9291 14

原创 selenium自动登录爬取网站数据

目标网站:古诗文网站实现目标:自动化登录网站,并爬取指定页面的数据,并存储用到的工具:selenium、百度手写数字识别。

2023-05-15 14:42:04 463 1

原创 python识别二维码。获取二维码中的网页链接

此处的decode函数需要额外导入,from pyzbar.pyzbar import decode,导入decode包,需要下载动态链接库:https://download.microsoft.com/download/F/3/5/F3500770-8A08-488E-94B6-17A1E1DD526F/vcredist_x64.exe。返回的result是网页地址,其余的两个是二维码的顶点参数,后面两个参数返回的是两个矩阵。这里data中的网页链接不能直接返回,因为是以字节的形式存储的。

2023-05-13 21:05:40 1248

原创 青岛啤酒股票数据分析

在分析的过程中产生了bool值 则马上将布尔值转化为行索引,这是一个数据分析的小技巧,如果布尔值作为df的行索引,则可以取出true对应的行数据,忽略false的对应的数据。假如我从2012年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天位置我的收益如何.输出该股票所有开盘比前日收盘跌幅超过2%的日期,伪代码:(开盘收益 - 前日收盘)/ 前日收盘 < -0.02。买股票:找到每个月第一个交易日对应的行数据,每月第一个交易日的行数据。买入股票花费的总金额。

2023-05-01 18:43:14 205

原创 菜品点单量的数据分析

本文是基于一家饭店的菜品点单量来进行数据分析数据集是meal_order_detail.xlsx,可以在网上下载。

2023-05-01 17:32:34 461 1

原创 关于家庭用电数据分析

pyecharts是Echarts是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。我们使用info()函数发现最后的电热水器空调的有功功率的数值是有缺失的,由于数据量比较大,但是缺失的数据量并不是特别的大,这里我们可以选择删除。将日期列的07转化成2007,并且把时间列的数据转化成str格式,将日期列的时间列合并成索引列,并删除日期和时间列。全英文的列名不方便像我这种英语不太好的靓仔分析数据,所以我把列名都换成了中文的。不同类型的家庭用电量和总用电量的关系。

2023-05-01 13:46:04 648 1

原创 电子产品销售数据分析

event_time -购买时间order_id -订单编号product_id -产品编号category_id -产品的类别IDcategory_code -产品的类别分类法(代码名称)brand -品牌名称price -产品价格user_id -用户ID。

2023-05-01 12:03:39 353 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除