万物皆乱-CSDN博客

原创外篇：关于理财的一些个人见解

好久没更新文章了，期间也在学习数据挖掘相关的知识。最近心情有点乱，因为我炒股了，也不是因为亏钱了，就是觉得炒股打乱了自己的生活节奏，这几天静下心来捋一下。这次不写一些专业的知识，聊聊买基金、炒股的一些见解。上个月我可以说是疯狂炒股，疯狂是因为感觉自己每时每刻都在关注股票信息及市场信息，不管上班还是下班，脑海里都是股市的信息，刚开始觉得挺享受其中的，后来慢慢感觉有点厌倦，也刚好这几天感觉眼疲劳，好好静下心来休整一下。回想自己交易的股票，有创世纪、杨杰科技、鹏辉能源、兴旺达、寒锐钴业...

2021-06-10 11:47:17 433

原创 tableau-取客户最后6次消费时间（last函数应用）

如题，取客户最后6次消费时间，首先导入数据（这步不赘述），新增倒序计算字段，如下：然后将消费时间字段放入列，选择连续的日期：然后将客户编码放入行，如下显示，客户所有的消费时间节点都可以看到：现在我只要取最后6次的消费，我们将倒序这个新增的计算字段放入筛选器，值范围选择1，如下：最后显示结果如下，我们最多只能看到客户最近6次的消费了：...

2021-04-06 16:50:09 1084 1

原创 python实例knn分类算法（鸢尾花数据集）

今天学习了knn分类算法（鸢尾花数据集），源数据下载路径如下：http://archive.ics.uci.edu/ml/machine-learning-databases/iris/打开上图数据，复制到Excel文档，根据逗号进行分列，加上表头，最终形成如下文档：直接上代码了，自行学习哈：import numpy as npimport pandas as pd#得到鸢尾花的数据def getData(): #读取自定义的文件，从中获得鸢尾花数据 iris=pd.rea

2021-03-23 14:42:48 2021

原创 tableau-给数值标颜色

如图，先做一个各省销量的一个报表：2 创建一个计算字段：3 将【销量<100000】字段放入颜色中：如上图显示，以100000为分界线显示两种不同颜色，完毕。

2021-01-21 17:04:11 4751 3

原创 tableau环形图制作

因工作需要，接下来一段时间会学习tableau。1 首先制作一个饼图： 2 将记录数拖到行，并设置为最小值：3 同上步骤，再添加一个记录数，后显示如下：4 在第二个饼图，鼠标移至纵坐标区域后单击右键，选择双轴：显示如下：（两个饼图重叠一起）5 将标记中最小（记录数）（2）中的胶囊全部移除：6 将颜色选为白色，然后调节大小即可得到环形图：...

2021-01-12 11:37:09 522

原创 python数据分析：多元线性回归

多元线性回归，即多个变量对目标值的影响（Y=aX1+bX2+cX3…+z）；接下来分析下“店铺面积”和“距离最近的车站”对便利店“月营业额”的影响，并预测店铺的月营业额。数据准备如下：代码如下，自行消化：from pandas import read_csvfrom sklearn.linear_model import LinearRegression#读取数据data = read_csv('data1.csv',encoding='gbk')x = data[["店铺的面积", "距

2020-12-09 17:35:01 2062

原创 python数据分析：一元线性回归

学了一段时间爬虫，接下来学学数据分析吧（感觉有点难，从简单的学起吧），这次学习线性回归，根据广告投入预测销售额，数据参考如下：以下是代码，自行消化哈：from pandas import read_csvfrom matplotlib import pyplot as pltfrom sklearn.linear_model import LinearRegressiondata = read_csv('data.csv',encoding='gbk')#画出散点图，求x和y的相关系数p

2020-11-25 11:11:36 2116 1

原创 python 五月天MV歌名词云

上篇文章已经将五月天MV歌名都下载了，现在现在用词云展示一下吧，代码如下（含下载歌名的过程）：import refrom wordcloud import WordCloudimport matplotlib.pyplot as pltimport requestsimport jsonresponse = requests.get("https://c.y.qq.com/mv/fcgi-bin/fcg_singer_mv.fcg?g_tk_new_20200303=5381&g_tk

2020-11-06 15:58:44 230 1

原创 python爬取五月天MV歌名

音乐网址：https://y.qq.com/n/yqq/singer/000Sp0Bz4JXH0o.html#tab=mv&通过开发工具找到MV歌名存放位置：打开上图中url，显示数据为当前页MV歌名：总共有848个MV，当前页只能查到12个MV歌名，仔细看了下存放网址：https://c.y.qq.com/mv/fcgi-bin/fcg_singer_mv.fcg?g_tk_new_20200303=5381&g_tk=5381&loginUin=0&hostUin

2020-10-27 15:54:43 611 1

原创 python爬虫：定位目标数据位置（四）

今天来讲下请求方式为：POST的URL如何读取其数据。（演示网址：http://www.dongfeng-honda.com/dot_query.shtml）如图，我们要获取当前位置为广州的专营店信息，通过开发工具我们找到了数据存放的URL，但是这个URL的请求方式为：POST（我们之前处理的请求方式是GET），此时要设置data参数才能正确读取该URL数据。data参数的查找如下：代码如下：import requestsimport jsondata = { "d

2020-09-14 11:06:37 1041

原创 python爬虫实例：今日头条街拍大图下载

今天的目标是下载头条首页搜索街拍，下载各个标题下的大图，如下：今天有点懒，仅分享下代码，自行学习消化：import requestsimport osfrom hashlib import md5for i in range(3): offset=i*20 url='https://www.toutiao.com/api/search/content/?aid=24&app_name=web_search&offset=%d&format=json&a

2020-09-02 11:42:26 349

原创 python爬虫：定位目标数据位置（三）

这次讲简单点，直接上图片就可以清楚明白：（演示网址：https://www.buick.com.cn/dealer.html）如上图，打开网址，我们要获取该网址的专营店所有信息，我们按F12打开开发者工具，重新加载页面，查找路径如图：Network>XHR>dealer.json，我们单击dealer.json，这是在右边会出现一个网址，我们打开这个网址就是我们所有的专营店信息了：爬取脚本就不展示了，自己动手吧。感悟：倦了累了，休息下再重新出发。...

2020-08-27 10:52:18 752

原创 python爬虫：导出带E数据为科学计数的解决方法

今天在爬取数据的时候，导出其中一个数据是418E2，导出为csv文件，打开一看显示为：4.18E+04，下面我针对这个写了一段代码演示：import csvdatas={'code':'418E2'}data=datas['code']with open('data.csv','a+',encoding='gb18030',newline='') as f: writer = csv.writer(f) writer.writerow([data])执行代码后，

2020-08-20 10:20:56 2360 2

原创 python爬虫：定位目标数据位置（二）

今天介绍下定位目标数据位置（二），这个方法很简单，只需要在F12开发页面通过搜索目标数据，就可以知道数据在网页中的存储位置，演示网址：https://www.gac-toyota.com.cn/buy/shopping/dealer-search；演示如下，需要获取专营店的信息，在search框输入一家店的店名：广汽丰田第一店，查询后显示结果中有个dealerData.js的地址：https://www.gac-toyota.com.cn/js/newprovincecitydealer/data/dea

2020-08-13 13:43:40 1261

原创 python爬虫：根据经纬度判定省城信息

我们在爬数据的很多时候，获得的数据只有经纬度，没有对应的省份、城市信息，这时我们可以根据如下脚本进行获取：import requestsimport csv,timetimenow =time.strftime("%Y-%m-%d-%H%M%S", time.localtime())file = '省城信息-%s.csv'% (timenow)#写入表头with open(file,'a+',encoding='gb18030', newline='') as f: writer_f

2020-07-28 10:45:11 2670 1

原创 python爬虫：定位目标数据位置（一）

python爬虫中，定位目标数据位置是很关键的一步，今天就来讲其中的一种方法，也是最基础的一种方法。首先怎么看一个网页的源代码，例如打开知乎首页（网址：https://www.zhihu.com/explore），在网页任意空白处单击右键，然后点击【查看网页源代码】选项，就可以查看源代码了：源代码如下：如果你是用Chrome浏览器，也可以直接在网页前面加前缀view-source:如，view-source:https://www.zhihu.com/explore，也是可以找到网页源代码。网页源

2020-07-25 12:07:32 3593