冰阔落-CSDN博客

原创 Python数据分析与机器学习实战

适用人群数据分析,机器学习,数据挖掘领域研究者。Python语言使用者。课程概述【数据分析与机器学习销冠课程，超100000名小伙伴加入】【连续多年荣获“最佳课程奖”，人工智能类“唯一”获奖课程，最佳合作伙伴】【课程同名配套教材《跟着迪哥学Python数据分析与机器学习实战》现已出版，加入课程免费送配套PDF版教材】课程特色：１、机器学习算法全面覆盖，每个算法均有配套项目实战！２、通俗易懂，用最接地气的方式讲解复杂的算法与代码！３、五年沉底，精选配套案例，打造最适合初学者的实战路线图

2021-04-26 14:05:06 1928 1

原创电脑字体变清晰设置

3.在视觉效果下，勾选“调整为最佳外观”，确定即可。1.右键“此电脑”，点击属性 —> 高级系统设置。2.在高级选项下，选择“性能”—>“设置”

2025-02-20 17:04:03 497

原创 PMML简介

Tree model，树模型，也是很常用的模型，她采用类似树分支的结构将数据逐层划分成节点，而每个叶子节点就表示一个特别的类别。对于分类变量，可能包含各种不同类型的分类值，包括有效值 (valid value)，遗漏值 (missing value) 和无效值 (invalid value)，它们由 Value 的“property”属性决定；因此，您可以在一个系统中定型一个模型，在 PMML 中对其进行表达，然后将其移动到另一个系统中，而不需考虑分析和预测过程中的具体实现细节。

2024-09-12 18:45:31 1412

转载只知道 dsp、ssp？互联网广告营销里的作弊与反作弊

媒体通过将广告展示和点击代码放在非约定的位置上，可能是用一块其他内容遮盖了广告，也可能是广告是透明的，也可能是广告只有1像素那么大。有点匠心精神的作弊者们，还会找到你们公司的员工经常浏览的网站比如自家的官网，采集员工的信息，一旦你们公司员工浏览广告，则马上变成一张正常广告，让你们心甘情愿的以为别人也都看到广告了。比如微博上的作弊流量，几百万的粉丝，几千条评论，看似很真实，其实只要稍加研究下，就发现评论下的二次评论一条也没有，这么明显的异常行为，但偏偏上当的人换了一茬又一茬。让监测程序把你判断为不同的个体。

2024-03-06 13:48:14 1031

转载 Excel函数sumifs、sum与常量数组结合的高阶用法

sumifs 和 sum 的使用

2024-02-29 13:57:14 2147

转载 EXCEL 查找某个字符在字符串中最后一次出现的位置

如果指定了 instance_num，则只有满足要求的 old_text 被替换。否则，文本中出现的所有 old_text 都会更改为 new_text。FIND("@",SUBSTITUTE(A1（字符串所在单元格）,"\","@",LEN(A1)-LEN(SUBSTITUTE(A1,"\",""))))在EXCEL文档里想从很长的文件路径中取得文件名，【数据】→【分列】是个不错的选择，但用函数会显得更高大上一些。其他字符（如“@”），然后在查找这个没出现过的字符所在的位置就可以了。

2023-11-07 15:13:08 5077

转载 Excel 如何替换多个文本内容

如何想要替换单元格中特定的字符数字，我们经常会使用Excel自带的查找/替换功能，但是这个功能比较简单，无法替换指定位置的文本，也没有办法同时替换多个文本。3、如果只想要替换第1个“-”，则可以将公式修改为 =SUBSTITUTE(B5,"-",".",1)，最后E5单元格返回的结果就是“A51.10-10001”,如图所示。2、使用【SUBSTITUTE】函数，可以使用图中的公式，也可以直接使用公式 =SUBSTITUTE(B5,"-",".")，最终效果一样。，将部分文本字符串替换为不同的文本字符串。

2023-09-13 11:17:39 8849

转载 Datalore 安装使用教程

接下来我们需要去pull一个镜像，在https://hub.docker.com/r/jetbrains/datalore-agent/tags这里，我们需要找到相同版本的datalore-agent，比如上面的配置文件，我们用的版本是jetbrains/datalore-server:2022.2.3，于是就。来启动，等下载完后，进入127.0.0.1:8080，去随便注册一个，然后登陆进去，到admin panel中填密钥，然后就可以使用了。里面步骤很详细就不说了。下载完后，我们就可以直接。

2023-08-01 14:17:57 1073

转载如何在 Excel 中使用 SQL 语言？

使用 SQL 查询数据，首先需要数据源。如果我们用 Excel 来呈现这些数据的话，就需要先从外部导入数据源。

2023-07-27 16:18:16 3521

转载【Python】开启Pandas进阶：图解Pandas透视表、交叉表

aggfunc是一个很灵活的参数，它是用来指定我们汇总想用哪种函数，默认是均值mean，我们也可以使用求和sum、最值max等。这个网上非常流行的一张图解Pandas透视表函数的图形，它利用一份简单的数据，清晰明了地讲解了pivot_table函数的每个参数的含义，保存备用！下面是在Excel表格中使用消费数据制作的透视表（部分数据截图），我们统计的是不同性别不同日期下的消费金额和小费，同时还显示了总计的数据。透视表的制作灵活性高，可以随意定制我们想要的的计算统计要求，一般在制作报表神器的时候常用。

2023-07-27 15:41:11 1068

转载 EXCEL 如何制作混合数据透视图柱形图添加折线图

当我们制作了数据透视图，增长率什么的，需要在柱形图上增加折线图，如何做呢。

2023-07-27 14:19:58 5077

转载 Excel 数据透视表如何累积求和？

选择数据区域，插入数据透视表。将“区域”与“组别”分别拖放至【行】，将“销售数量”分两次拖放至【值】字段，设置计算类型为“求和”。选择第二个“销售数量”，鼠标右键单击后，在弹出的快捷菜单中依次选择【值显示】→【按某一字段汇总】选项。在弹出的对话框中的【基本字段】对应的下拉列表中选择【组别】选项，最后单击【确定】按钮。修改透视表的字段名称与布局方式即可，如图所示。

2023-07-27 09:41:05 2905

转载如何用 python 进行数据分析

在第一步和第二步，我们主要使用的是Python的工具库NumPy和pandas。其中，NumPy主要用于矢量化的科学计算，pandas主要用于表型数据处理。可以为不同类型的数据和每个估算器提供广泛的描述性统计，统计测试，绘图函数和结果统计列表。数据分析的流程概括起来主要是：读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。Scikit-leran则是著名的机器学习库，可以迅速使用各类机器学习算法。数据可视化是数据工作中的一项重要内容，它可以辅助分析也可以展示结果。

2023-07-26 18:42:51 288

转载 python数据分析之数据分析（步骤）流程

从外部源数据中获取数据保存为各种格式的文件、数据库等使用爬虫等技术。

2023-07-26 18:30:46 218

转载活用这23种图表，让你的数据分析胜人一筹

这当然是积极的变化，但也助长了一种本能倾向，即让数据可视化成为了一种汇报时的必备“流程”，开始无目的地进行可视化，结果做出的图表差强人意，比如机械地把电子表格单元转换为图表，只能提供支离破碎的信息，或者无效却扰乱视听影响决策的信息，进而无法传达出完整的理念。当我们想表达过多类型的数据时，可以使用矩形树图，它展现同一层级的不同分类的占比情况，还可以同一个分类下子级的占比情况，每个矩形代表一个聚合类，颜色的深浅和面积的大小代表这个聚合类的大小。如图，可以看到用户在登录后的行为，以及下一步行为。

2023-07-26 11:21:20 944

转载关于kafka中的消费者组（consumer group）以及kafka到底用的啥消息传递模式（待续）

关于kafka的消费者组的概念和作用，首先，概念很好理解，就是一些消费者具有共同的group id，比如有5个消费者都订阅了 topicA，则我们可以将5个消费者放到 groupA中并将这个group命名为“groupA”，则此时groupA的消费者组的id就是“groupA”。那么为啥要有消费者组这种设定呢？主要原因在于：首先，传统的消息传递模型分为两类，共享消息队列模式允许来自producer的消息流到达单个消费者。推送到队列的每条消息只能读取一次，并且只能由一个consumer读取。

2023-07-25 11:59:02 1589 1

原创如何在 Excel 中快速生成随机密码？

有时，我们可能想创建随机密码来保护某些重要内容。但是，您有什么技巧可以在Excel中快速生成随机密码？在这里，我有一些可以在Excel工作表中处理的方法。

2023-07-17 18:45:13 5786 1

转载 python接口自动化（一）--什么是接口、接口优势、类型（详解）

接口泛指实体把自己提供给外界的一种抽象化物（可以为另一实体），用以由内部操作分离出外部沟通方法，使其能被内部修改而不影响外界其他实体与其交互的方式。人类与电脑等信息机器或人类与程序之间的接口称为用户界面。电脑等信息机器硬件组件间的接口叫硬件接口。电脑等信息机器软件组件间的接口叫软件接口。在计算机中，接口是计算机系统中两个独立的部件进行信息交换的共享边界。这种交换可以发生在计算机软、硬件，外部设备或进行操作的人之间，也可以是它们的结合。接口的优势一、规范性。

2023-07-13 16:50:06 248

转载 python接口自动化（十八）--重定向（Location）（详解）

在实际工作中，有些接口请求完以后会重定向到别的url，而你却需要重定向前的url。URL主要是针对虚拟空间而言，因为不是自己独立管理的服务器，所以无法正常进行常规的操作。但是自己又不希望通过主域名的二级目录进行访问，而是希望通过主域名的二级域名进行访问。所以这个时候就会用到URL重定向。重定向过程好比有个绰号叫“浏览器”的人写信找张三借钱，张三回信说没有钱，让“浏览器”去找李四借，并将李四现在的通信地址告诉给了“浏览器 ”。

2023-07-12 18:58:12 727

转载 Python 如何提取 url 中的参数

是一个tuple对象，把url分成了6个部分，query 属性就是查询参数部分，再通过 prase_qs 方法解析成字典对象，解析后，字典的value 是列表，因为同一个参数可以有多个值，我们只取第一个值。模块中的 urlpase 类来实现。提取其中的参数为字典对象。

2023-07-06 14:28:20 1107

原创 SHELL 脚本定期删除日志文件(日志定期清理)

假设我们的应用每天会产生一个日志文件，但我们并没有对日志文件做任何归档处理，久而久之日积月累，就会将磁盘空间占满，从而影响系统的正常运行。分析磁盘空间占用情况#当前磁盘空间占用情况df -h#当前目录文件大小列表ll -lh#文件列表按时间排序ll -rt#文件大小列表，按时间排序ll -lhrt#查询20天前的日志#删除20天前的日志应用实现的方式这里就不做过多的介绍，本文着重讲解下# vim# :wq!保存并退出。

2023-06-09 11:07:41 3670

原创 Excel 提取 Json 数据属性值

如果要提取tvmid的值，则使用函数mid（A1，find（"tvmid"，A1,1）+8,27）进行提取，具体的使用方法可自行百度。今天遇到了json数据文件，需要对单一属性值进行提取，可以使用excel的mid函数以及find函数进行。

2023-06-01 16:04:23 1593

转载 jar文件反编译（IDEA环境）

想要对一些 jar 文件进行反编译，由于现在 IDEA 使用的人比较多，比较方便的方法是，可以使用 IDEA 中的插件进行反编译。

2023-04-26 17:35:12 2976

原创 MySQL 的 Replace into 与 Insert into on duplicate key update 真正的不同之处

但是实际上，根据我推测，如果是简单的update语句，auto_increment不会+1，应该也是先delete，再insert的操作，只是在insert的过程中保留除update后面字段以外的所有字段的值。有key的时候，replace是delete老记录，而录入新的记录，所以原有的所有记录会被清除，这个时候，如果replace语句的字段不全的话，有些原有的比如例子中c字段的值会被自动填充为默认值。- 意向共享锁(IS): 在一个事务获取表t的某行的S锁之前, 他必须获取表t的一个IS锁或更强的锁。

2023-04-20 17:42:34 2251

转载 mysql 字段值(字符串)累加

但是，在更新时，并不知道该记录的原值，也不希望通过mysql查询来获取原值（实际上，并不关心原值是多少，只需要在原值基础上添加新值即可）。结论：在create table时，需指定该字段NOT NULL,同时设置default 为""即可。如果原值为NULL,上述SQL语句将无法更新字段值(但mysql也不会报错)。即：针对以上记录，执行上述SQL后，country 值为NULL；mysql在更新记录时，需要在原来的值上在累加新的值。执行上述SQL后，country = "USA"。

2023-04-18 19:09:11 1055

转载 DSP、SSP、RTB 是怎样的一个过程

这种购买的行为是每分每秒钟都在发生的，当一个符合条件的“男性20岁大学生”准备打开网页A时，cookie就被放在了菜市场，Nike看到后即可后买，然后将将制作好的广告banner展现在这个网页上，整个过程大约需要0.4秒，所以浏览者是完全感受不到的。与此同时又有无数个符合条件的cookie在浏览无数个网页，所以需要实时竞标，即让电脑自动帮你买入需要的“菜”，，从而产生了RTB（Real-time bidding），一般说来RTB仅仅是DSP平台的一个功能。以下一个浅显的例子说明这个问题。

2023-04-04 14:17:35 323

转载九枝兰专访-----深入解读程序化购买以及行业现状(中篇)

正是因为剩余流量的“不清晰”，“高大上”的广告主既想要享受到程序化购买的优化手段，又想要满足自己对各类广告环境或媒体的要求，催生了私有程序化PDB模式，PDB不变的是传统广告排期采买执行流程，改变的是通过技术手段广告主获取了广告位的管理权：让这些传统广告位更智能化、更可控化、更精益化，以及更规模化。这种模式也是很多业内的人俗称的“保价保量”的模式。当然上面我也提到了依附流量的DSP中存在依附于AdNetwork的DSP，市场上也俗称DSP+ADN模式，这个是程序化的范畴，上面已经介绍过了这里就不在展开了。

2023-04-04 14:09:11 331

Java性能优化指南1.4版

GeoLite2-City.mmdb IP 数据库更新于 2022-05-23

AutoHotkey 中文手册

MyEclipse2015 Stable2.0补丁

空空如也