- 博客(6)
- 收藏
- 关注
原创 左连接left join产生的是笛卡尔积,再根据on条件筛选结果
看菜鸟教程里左连接的讲解https://www.runoob.com/mysql/mysql-join.html里面提到LEFT JOIN(左连接):获取左表所有记录,即使右表没有对应匹配的记录。被其误导了,导致我一个下午都不明白我一段SQL查询结果。最终豁然开朗。结论是left join左连接产生的是笛卡尔积,即两个10行的表左连接,首先是生成一个10*10行的表,然后根据on后面的条件筛选符合条件的行。先放上其他博文的评论支持这一观点先看我的应用的一段代码create table
2021-07-13 19:05:17 4297
原创 EXCEL里如何识别AB和BA并去重?EXCEL里如何对多列同一值不区分顺序去重?
在做商品关联分析时,得出的结果容易出现第一列A值,第二列B值,与第一列B值,第二列A值重复计算的情况。为了对这种重复去重。在excel表格里可以如下操作。在新的一列输入函数:=IF(A2>B2,A2&B2,B2&A2)意思是用if函数判断A列和B列大小,总是大的在前,或者总是小的在前,这样AB和BA在新的列里就被统一成AB,AB,或者BA,BA。&的意思是将两列文本连接在一起。处理后的结果如下:然后对D列进行去重操作。选择D列——只勾选D列。确定后
2021-07-13 13:42:56 3165 1
原创 win10下MySQL报错解决——ERROR 1 (HY000): Can‘t create/write to file ‘XXX‘ (Errcode: 13 - Permission
这里写自定义目录标题https://www.cnblogs.com/Braveliu/p/11458901.html解决方法见此链接。但此文针对的是linux。在win10下,最后要把文件夹的斜杠改一下。即select * from tmptwo100 into outfile 'C:/ProgramData/MySQL/MySQL Server 5.7/Data/tmptwo100.xls';文件夹目录前面的参照show variables like 'datadir';得出的目录名,只是把斜杠
2021-07-13 11:01:13 1258
原创 Python进阶之路(3):提取公众号后台数据并数据可视化
公众号后台有丰富的数据统计,但是可能依然没有我想要的统计指标。比如,我公众号粉丝量虽然不高,但是阅读率却普遍很高,那我能不能根据我公众号每篇文章的阅读率的变化情况,画一张散点图,来展现我的公众号运营成果呢?登陆后台发现,公众号每篇文章发送情况的左侧,点击发送完毕按钮,可以看到送达人数,这是公众号发某篇文章前的粉丝数,而标题下方有阅读数。通过爬虫,依次提取每篇文章的送达人数和阅读数,根据公式:阅读率=阅读数/送达人数,就可以计算出每篇文章的阅读率了。思路一:在进行数据可视化的时候,用该篇文章的当前粉丝数作
2020-06-27 14:39:15 1330
原创 Python进阶之路(2):批量下载豆瓣FM红心音乐MP3到本地
用豆瓣FM快十年了,听了3万多首歌,红心标记了近400首歌,然而由于版权问题只剩150首左右还能播放。以前用过一个可以下载浏览器播放的音视频文件到本地的插件,后来因为重装系统丢了,该插件也下架无法下载了。所以很久都没有一个工具能够下载豆瓣音乐到本地。今天偶然想到去Github看看有没人做过相关的项目,发现相关的项目都已经失效了。于是又开VPN去Chrome浏览器的扩展程序里找,找到了一个插件,可以爬取豆瓣FM上红心歌曲的下载链接和歌曲名信息。附该项目地址https://github.com/loveu
2020-06-14 15:02:47 617
原创 Python从放弃到入门,公众号历史文章爬取成pdf的项目实践与自主学习法
这篇文章不谈江流所专研的营销与运营,而聊一聊技能学习之路,聊一聊Python这门最简单的编程语言该如何学习,我完成的第一个Python项目,将任意公众号的所有历史文章导出成PDF电子书。或许我这个Python初学者的学习路径能给你带来启发,或许你产生了要学一门新技术的冲动。文末附送了学习资源通道。学习python两度放弃最终有所成我想要学python五年了,三度捧起python入门书决定开启学习,到第三次才算上道了。第一次死于安装软件环境,安装碰了太多壁,面对各种困难无从解决而搁置。所以传说三分之
2020-06-01 23:16:18 821 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人