自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 外篇:关于理财的一些个人见解

好久没更新文章了,期间也在学习数据挖掘相关的知识。最近心情有点乱,因为我炒股了,也不是因为亏钱了,就是觉得炒股打乱了自己的生活节奏,这几天静下心来捋一下。 这次不写一些专业的知识,聊聊买基金、炒股的一些见解。 上个月我可以说是疯狂炒股,疯狂是因为感觉自己每时每刻都在关注股票信息及市场信息,不管上班还是下班,脑海里都是股市的信息,刚开始觉得挺享受其中的,后来慢慢感觉有点厌倦,也刚好这几天感觉眼疲劳,好好静下心来休整一下。回想自己交易的股票,有创世纪、杨杰科技、鹏辉能源、兴旺达、寒锐钴业...

2021-06-10 11:47:17 344

原创 tableau-取客户最后6次消费时间(last函数应用)

如题,取客户最后6次消费时间,首先导入数据(这步不赘述),新增倒序计算字段,如下:然后将消费时间字段放入列,选择连续的日期:然后将客户编码放入行,如下显示,客户所有的消费时间节点都可以看到:现在我只要取最后6次的消费,我们将倒序这个新增的计算字段放入筛选器,值范围选择1,如下:最后显示结果如下,我们最多只能看到客户最近6次的消费了:...

2021-04-06 16:50:09 933 1

原创 python实例knn分类算法(鸢尾花数据集)

今天学习了knn分类算法(鸢尾花数据集),源数据下载路径如下:http://archive.ics.uci.edu/ml/machine-learning-databases/iris/打开上图数据,复制到Excel文档,根据逗号进行分列,加上表头,最终形成如下文档:直接上代码了,自行学习哈:import numpy as npimport pandas as pd#得到鸢尾花的数据def getData(): #读取自定义的文件,从中获得鸢尾花数据 iris=pd.rea

2021-03-23 14:42:48 1917

原创 tableau-给数值标颜色

如图,先做一个各省销量的一个报表:2 创建一个计算字段:3 将【销量<100000】字段放入颜色中:如上图显示,以100000为分界线显示两种不同颜色,完毕。

2021-01-21 17:04:11 4415 3

原创 tableau环形图制作

因工作需要,接下来一段时间会学习tableau。1 首先制作一个饼图: 2 将记录数拖到行,并设置为最小值:3 同上步骤,再添加一个记录数,后显示如下:4 在第二个饼图,鼠标移至纵坐标区域后单击右键,选择双轴:显示如下:(两个饼图重叠一起)5 将标记中 最小(记录数)(2)中的胶囊全部移除:6 将颜色选为白色,然后调节大小即可得到环形图:...

2021-01-12 11:37:09 429

原创 python数据分析:多元线性回归

多元线性回归,即多个变量对目标值的影响(Y=aX1+bX2+cX3…+z);接下来分析下“店铺面积”和“距离最近的车站”对便利店“月营业额”的影响,并预测店铺的月营业额。数据准备如下:代码如下,自行消化:from pandas import read_csvfrom sklearn.linear_model import LinearRegression#读取数据data = read_csv('data1.csv',encoding='gbk')x = data[["店铺的面积", "距

2020-12-09 17:35:01 1915

原创 python数据分析:一元线性回归

学了一段时间爬虫,接下来学学数据分析吧(感觉有点难,从简单的学起吧),这次学习线性回归,根据广告投入预测销售额,数据参考如下:以下是代码,自行消化哈:from pandas import read_csvfrom matplotlib import pyplot as pltfrom sklearn.linear_model import LinearRegressiondata = read_csv('data.csv',encoding='gbk')#画出散点图,求x和y的相关系数p

2020-11-25 11:11:36 1983 1

原创 python 五月天MV歌名 词云

上篇文章已经将五月天MV歌名都下载了,现在现在用词云展示一下吧,代码如下(含下载歌名的过程):import refrom wordcloud import WordCloudimport matplotlib.pyplot as pltimport requestsimport jsonresponse = requests.get("https://c.y.qq.com/mv/fcgi-bin/fcg_singer_mv.fcg?g_tk_new_20200303=5381&g_tk

2020-11-06 15:58:44 190 1

原创 python爬取五月天MV歌名

音乐网址:https://y.qq.com/n/yqq/singer/000Sp0Bz4JXH0o.html#tab=mv&通过开发工具找到MV歌名存放位置:打开上图中url,显示数据为当前页MV歌名:总共有848个MV,当前页只能查到12个MV歌名,仔细看了下存放网址:https://c.y.qq.com/mv/fcgi-bin/fcg_singer_mv.fcg?g_tk_new_20200303=5381&g_tk=5381&loginUin=0&hostUin

2020-10-27 15:54:43 397 1

原创 python爬虫:定位目标数据位置(四)

今天来讲下请求方式为:POST的URL如何读取其数据。(演示网址:http://www.dongfeng-honda.com/dot_query.shtml)如图,我们要获取当前位置为广州的专营店信息,通过开发工具我们找到了数据存放的URL,但是这个URL的请求方式为:POST(我们之前处理的请求方式是GET),此时要设置data参数才能正确读取该URL数据。data参数的查找如下:代码如下:import requestsimport jsondata = { "d

2020-09-14 11:06:37 970

原创 python爬虫实例:今日头条街拍大图下载

今天的目标是下载头条首页搜索街拍,下载各个标题下的大图,如下:今天有点懒,仅分享下代码,自行学习消化:import requestsimport osfrom hashlib import md5for i in range(3): offset=i*20 url='https://www.toutiao.com/api/search/content/?aid=24&app_name=web_search&offset=%d&format=json&a

2020-09-02 11:42:26 301

原创 python爬虫:定位目标数据位置(三)

这次讲简单点,直接上图片就可以清楚明白:(演示网址:https://www.buick.com.cn/dealer.html)如上图,打开网址,我们要获取该网址的专营店所有信息,我们按F12打开开发者工具,重新加载页面,查找路径如图:Network>XHR>dealer.json,我们单击dealer.json,这是在右边会出现一个网址,我们打开这个网址就是我们所有的专营店信息了:爬取脚本就不展示了,自己动手吧。感悟:倦了累了,休息下再重新出发。...

2020-08-27 10:52:18 703

原创 python爬虫:导出带E数据为科学计数的解决方法

今天在爬取数据的时候,导出其中一个数据是418E2,导出为csv文件,打开一看显示为:4.18E+04,下面我针对这个写了一段代码演示:import csvdatas={'code':'418E2'}data=datas['code']with open('data.csv','a+',encoding='gb18030',newline='') as f: writer = csv.writer(f) writer.writerow([data])执行代码后,

2020-08-20 10:20:56 2222 2

原创 python爬虫:定位目标数据位置(二)

今天介绍下定位目标数据位置(二),这个方法很简单,只需要在F12开发页面通过搜索目标数据,就可以知道数据在网页中的存储位置,演示网址:https://www.gac-toyota.com.cn/buy/shopping/dealer-search;演示如下,需要获取专营店的信息,在search框输入一家店的店名:广汽丰田第一店,查询后显示结果中有个dealerData.js的地址:https://www.gac-toyota.com.cn/js/newprovincecitydealer/data/dea

2020-08-13 13:43:40 1172

原创 python爬虫:根据经纬度判定省城信息

我们在爬数据的很多时候,获得的数据只有经纬度,没有对应的省份、城市信息,这时我们可以根据如下脚本进行获取:import requestsimport csv,timetimenow =time.strftime("%Y-%m-%d-%H%M%S", time.localtime())file = '省城信息-%s.csv'% (timenow)#写入表头with open(file,'a+',encoding='gb18030', newline='') as f: writer_f

2020-07-28 10:45:11 2371 1

原创 python爬虫:定位目标数据位置(一)

python爬虫中,定位目标数据位置是很关键的一步,今天就来讲其中的一种方法,也是最基础的一种方法。首先怎么看一个网页的源代码,例如打开知乎首页(网址:https://www.zhihu.com/explore),在网页任意空白处单击右键,然后点击【查看网页源代码】选项,就可以查看源代码了:源代码如下:如果你是用Chrome浏览器,也可以直接在网页前面加前缀view-source:如,view-source:https://www.zhihu.com/explore,也是可以找到网页源代码。网页源

2020-07-25 12:07:32 3368

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除