林_胖
码龄6年
关注
提问 私信
  • 博客:81,884
    动态:38
    81,922
    总访问量
  • 42
    原创
  • 1,685,277
    排名
  • 117
    粉丝
  • 0
    铁粉

个人简介:找工作...找工作...找工作,有单位收留吗?

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2019-02-15
博客简介:

Lin_Xiao_Dai的博客

查看详细资料
个人成就
  • 获得118次点赞
  • 内容获得63次评论
  • 获得749次收藏
  • 代码片获得285次分享
创作历程
  • 1篇
    2023年
  • 6篇
    2021年
  • 26篇
    2020年
  • 9篇
    2019年
成就勋章
TA的专栏
  • Pandas
    7篇
  • 数据分析
    11篇
  • Excel
    3篇
  • 微信群解答
    3篇
  • MySQL
    5篇
  • 爬虫
    8篇
  • 面试题
    4篇
兴趣领域 设置
  • 数据结构与算法
    推荐算法
  • 大数据
    hadoophivestormsparketl
  • 人工智能
    scikit-learn聚类分类回归
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

355人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Vscode Vim自动切换

vscode中vim插件自动切换输入法
原创
发布博客 2023.11.09 ·
1686 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Excel使用公式设置条件格式

今天同事提了一个需求,结果如下图所示。备注里面为空或者为“✔”则为白底,出现任意其他字符就使用红色填充。操作步骤公式分析一下:ISBLANK()判断单元格是不是空的(如果是#N/A就需要ISNA()来判断)OR()有一个为真则返回TrueNOT()取反先分析单元格里面是不是空或者是不是✔,如果返回False,即单元格即不为空也不是✔,那就直接取反获得True,再自定义一下单元格样式就好了。列前面加不加上"$"都可以。没了...
原创
发布博客 2021.05.12 ·
1793 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

零售数据分析——价格三度

最近项目里面有需要用到零售相关的知识,从网上了解到一些有趣的易于理解的指标,在这做一记录、分析。指标介绍根据价格三度的分析可以判断商品定价、采购及陈列是否合理。假设背景:A店在售的方便面价格从3元/包-15元/包不等,包含了10个sku;B店在售的方便面价格从1.5元/包-13.5元/包,包含了5个sku。价格带价格带相当于一个品类下的价格区间,根据背景可知A店的方便面价格带是3-15元,B店的方便面价格带是1.5-13.5元。宽度宽度就是价格带的极差。价格带的宽度决定了该品类商品满足消费者
原创
发布博客 2021.04.06 ·
1788 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

使用Python将Word表格转Excel

今日需求其实就是把Word中的表格转到Excel中,顺便做一个调整。如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。# 首先要pip install python-docx# 如果原文件是doc格式,那就先转成docxfrom docx import Documentimport pandas as pdpath = "./word表格转excel.docx"docx = Document
原创
发布博客 2021.03.09 ·
2628 阅读 ·
5 点赞 ·
2 评论 ·
24 收藏

使用Python实现邮件发送

邮箱专用密码(授权码)到邮箱设置里面自己生成,可以参考这篇.import smtplibimport timefrom email.header import Headerfrom email.mime.text import MIMETextsender = "xxx@xxx.cn" # 配置发送邮件地址,显示--由xxx@xxx.com代发password = "xxxx" # 客户端登录专用密码receivers = ["xxx@xx.cn"] # 邮件接收地址subject
原创
发布博客 2021.01.19 ·
398 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

利用Python实现企业微信发送文件消息

最近领导希望做一个小的招标信息爬取系统,每日以邮件以及企业微信的方式进行推送。所以记录一下如何使用Python实现企业微信发送文件。第一步:登录企业微信后台,需要用有管理员权限的微信进行扫码登录。第二步:获取AgentId和Secret,获取路径:应用管理-创建应用,创建应用后即可看到。第三步:确认需要接收信息的userid,获取路径:通讯录-选择需要发送的人员-账号。第四步:获取公司ID,获取路径:我的企业-公司ID。通过上面四步即可获取到:CORPID # 企业IDCORPSECRE
原创
发布博客 2021.01.19 ·
4044 阅读 ·
4 点赞 ·
9 评论 ·
39 收藏

微信群解答_根据给定数据范围划分文件

需求描述参数“氧量”(代号T)划分区间[0,1],[1,1.3],[1.3,1.5],[1.5,1.8],[1.8,2],[2,2.5],[2.5,3],[3,5],[5,10],现在T有9个区间,T01、T02…T09;参数“热值”(代号Q)划分区间[4000,4800],[4800,5200],[5200,5300],[5300,5500],[5500,6500],现在T有5个区间,Q01、Q02…Q05。最后想得到T和Q的排列组合的csv文件,就是T01Q01、T02Q01、T03Q01…这样的
原创
发布博客 2021.01.05 ·
233 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

AI面试题(持续更新)

加入了个开课吧9.9元的AI面试题交流群,纯当笔记记录及分析。1. 为什么要对特征归一化?归一化可以消除因特征量纲差异导致对模型收敛带来的影响,可以加快收敛,便于使用默认的参数。如果不归一化,会导致特征值相差大的特征占主导作用,而忽略特征值相差小的特征。对连续数值进行归一化可以将特征统一到一个大致相同的数据区间内。常用方法有min-max scaling,z-score normalization.通常在计算欧氏距离或者使用梯度下降优化的场景下需要对特征进行归一化处理,例如线性回归、逻辑回归、SVM
原创
发布博客 2020.11.09 ·
964 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Superset安装及排坑

-----------------------------------------Windows------------------------------------------1. 创建虚拟环境,需先安装pip install virtualenv cd F: # 切换到F盘virtualenv superset_venv # 创建一个叫做superset的虚拟环境,此时会自动创建文件夹cd superset/Scripts # 进入刚刚创建的文件夹的Scripts文件夹下activate
原创
发布博客 2020.09.04 ·
368 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据分析_滴滴AB test面试题及城市运营分析

滴滴AB test面试题及运营情况分析从和鲸上看到了一个滴滴数据集,看介绍说的是数据来自滴滴出行内部,也有小道消息说是面试题?那我们来试一下。数据字典上图为两个数据集的数据字典,可以看出来维度比较少,进行AB test的test数据集是58行,运营情况分析的city数据集是90行。两者皆无空值。AB test分析数据清洗及特征工程[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8GvDqn8r-1598674835825)(https://imgkr2.cn-bj
原创
发布博客 2020.08.29 ·
5048 阅读 ·
15 点赞 ·
2 评论 ·
98 收藏

微信群解答_行列转换的Mysql,Excel,Python解法

微信群又双叕有新问题了,如图所示,两个表格的转换。首先跟大家分享一下我的记忆口诀:行转列逆透视列转行透视我们用Excel、Python、SQL分别实现一下这个功能。Excel使用到Excel中的Power Query,只有Excel2016以上的版本才有,注意版本号。行转列全选数据>数据选项卡>自表格/区域由于要转换的列是由"/"分割的,所以我们需要先拆分列。选中需要拆分的列>右键>拆分列>按分隔符。选择自定义>输入"/">选择每次出
原创
发布博客 2020.08.21 ·
297 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏
MySQL_复购回购率
发布动态 2020.08.11

MySQL_复购回购率

指标解释如何计算复购率/回购率计算方法一:复购的人复购率 = 单位时间内购买次数大于1的人/所有购买的人例如:一段时间内,10个人中有3个人购买2次,这3个人中有一个人又购买了一次,累计复购人数为3人,则这段时间内的复购率为30%。计算方法二:复购次数复购率 = 单位时间内复购次数/所有购买的人例如:一段时间内,10个人中有3个人购买2次,这3个人中有一个人又购买了一次,累计复购次数为4次,则这段时间内的复购率为40%。复购和回购的区别复购是一个单位时间内的多次购买,回购是在下一个单位
原创
发布博客 2020.08.11 ·
2402 阅读 ·
5 点赞 ·
0 评论 ·
20 收藏

一分钟一个Pandas小技巧(四)

暂更至此,有人看再更。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇涉及的知识点:一维表和二维表互换stack()和unstack()pivot()和pivot_table()高性能查询和赋值query()eval()快速计算同比环比、差异diff()pct_change()一维表和二维表互换一维表是指表中各维相互独立,且不可再分的表二维表是指表中部分列不独立,或者说可以归.
原创
发布博客 2020.08.03 ·
494 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据分析_爬取37491条上海二手房数据,我感觉我又行了!

本文数据来源于链家网,搜集时间为2020年7月23日。本次项目使用Scrapy-Redis分布式爬取链家网数据,请自备代理ip。完整代码我已经放文末链接中,本文不再赘述爬虫细节,源码中我都有详细注释。仪表板展示项目背景去面试的时候被问上海二手房的一些情况,作为一个土著,我只知道上海这个区挺贵的那个区大概这个价,但是具体数值却说不上来。所以,就有了本文。从政策上来看,自从2016年国家喊出“房住不炒”的口号之后中国的房价就出现了明显的降温。2019年国家为了“救市”又宣布了几条政策:政府不再.
原创
发布博客 2020.07.29 ·
1958 阅读 ·
5 点赞 ·
4 评论 ·
20 收藏

一分钟一个Pandas小技巧(三)

在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。 本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇所涉及知识点:美化DataFramePython一些好玩的函数Pandas拼接列中出现列表的处理方式accessor窗口函数美化DataFramedf = pd.DataFrame
原创
发布博客 2020.07.21 ·
693 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一分钟一个Pandas小技巧(二)

在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇所涉及知识点:map、apply、applymapgroupbyMultiIndex DataFrame统计函数、累计函数agg、transform、filtermap、appl
原创
发布博客 2020.07.16 ·
694 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

微信群解答_各月各旬降水量均值_巧用groupby

记录一则群友在微信群里提出的需求,计算多年各月各询的平均降雨量。统计这个多年旬月均值,是为了跟当前年份的旬月值做比较,多了就说明当前月份雨水多,有可能发生洪涝灾害。# 数据文件比较规整,所以用pd.read_csv直接读取df = pd.read_csv("./1.txt",sep='\t')df.head() dt p0 2018-01-06 0.61 2018-01-25 0.12 2018-01-26 0.13 2018-01-27 1.14 2018-02-06 4.0.
原创
发布博客 2020.07.14 ·
1016 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

一分钟一个Pandas小技巧(一)

在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。原网址:https://www.kaggle.com/python10pm/pandas-100-tricks纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。创建测试数据Pandas自带的函数,​避免了自己手写测试数据的痛苦。索引设置重命名索
原创
发布博客 2020.07.12 ·
832 阅读 ·
3 点赞 ·
0 评论 ·
30 收藏

爬虫7_《隐秘的角落》豆瓣影评爬取及可视化分析

爬取链接:隐藏的角落豆瓣影评本文源码:百度云 提取码影评爬取豆瓣网有限制,各种类型的评论只可以爬取220条,所以我爬取了好评、一般、差评各220条,过滤解析错误的影评后,累计爬取630条。爬取维度为评论类型、点赞数、评分、发布日期、评论。分析urlstart:从第几条开始展示,豆瓣影评每一页都是20条评论,所以start应该是20的倍数。limit:这个限制了每页显示多少评论,但修改数值也没用。sort:根据热门/最新/好友进行排序, 这里我选择了热门。status:P/F代表看过和想看,
原创
发布博客 2020.07.05 ·
2241 阅读 ·
1 点赞 ·
8 评论 ·
38 收藏
加载更多