数据建模分析
文章平均质量分 77
一个高效工作的家伙
你不逼自己一把,你永远都不知道自己有多优秀!只有经历了一些事,你才会懂得好好珍惜眼前的时光!
展开
-
Python 连接clickhouse常用的三种方式
ClickHouse是一个开源的分布式列式数据库管理系统,它被设计用于存储和分析大规模数据。Python是一种流行的编程语言,凭借其简洁的语法和丰富的生态系统,成为了数据处理和分析的首选语言之一。在Python中,我们可以使用多种方式与ClickHouse进行连接并操作数据。本文将详细介绍Python连接ClickHouse的三种常用方式,分别是使用clickhouse-driver、clickhouse-sqlalchemy和pyclickhouse库。原创 2024-06-21 16:49:30 · 2399 阅读 · 0 评论 -
本地部署Ollama+qwen本地大语言模型Web交互界面
Ollama WebUI 已经更名为 Open WebUI.Open WebUI是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作。它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI 兼容的 API。Ollama WebUI 是一个革命性的 LLM 本地部署框架,具有类似 ChatGPT 的 Web 界面。让我们为您的 Ollama 部署的 LLM 提供类似 ChatGPT Web UI 的界面,只需按照以下 5 个步骤开始行动吧。原创 2024-06-18 14:21:36 · 1339 阅读 · 0 评论 -
Rasa.3X中使用lookup实现对实体的抽取
rasa3.6的DIETClassifier实体提取器不准确,使用RegexEntityExtractor的实体提取器替换。原创 2024-05-31 16:36:39 · 494 阅读 · 0 评论 -
DBeaver clickhouse 时区不对 时间少了8小时
用dbeaver工具连接clickhouse发现时间少了8小时转载 2024-05-26 11:00:45 · 699 阅读 · 0 评论 -
elasticsearch索引如何删除字段
有两种方法可以删除 Elasticsearch 索引中的字段。您可以使用 Mapping API 更新索引映射并删除字段。以下是删除字段的步骤:1. 通过获取当前的索引映射。2. 编辑映射,删除要删除的字段。3. 将更新的映射传回 Elasticsearch,使用以下请求。例如,如果您要从名为my-index的索引中删除age字段。原创 2024-05-14 17:58:16 · 2649 阅读 · 0 评论 -
elasticsearch使用more_like_this实现基于内容的推荐
min_doc_freq:一个词语最少在多少篇文档中出现,小于这个值的词会将被忽略,默认是无限制。max_doc_freq:一个词语最多在多少篇文档中出现,大于这个值的词会将被忽略,默认是无限制。min_term_freq:一篇文档中一个词语至少出现次数,小于这个值的词将被忽略,默认是2。percent_terms_to_match:匹配项(term)的百分比,默认是0.3。max_query_terms:一条查询语句中允许最多查询词语的个数,默认是25。boost_terms:设置词语权重,默认是1。原创 2024-04-12 10:33:57 · 570 阅读 · 0 评论 -
ElasticSearch7.9集群的安装部署
总结下elasticsearch集群部署原创 2023-12-13 23:27:47 · 293 阅读 · 0 评论 -
使用 Elasticsearch 轻松进行中文文本分类
本文记录下使用 Elasticsearch 进行文本分类,当我第一次偶然发现 Elasticsearch 时,就被它的易用性、速度和配置选项所吸引。每次使用 Elasticsearch,我都能找到一种更为简单的方法来解决我一贯通过传统的自然语言处理 (NLP) 工具和技术来解决的问题。在某个时刻,我意识到,它可以直接用来解决很多问题,而如果采用我以前学到的方法,则需要从头开始构建解决方案。原创 2023-08-19 17:16:53 · 1144 阅读 · 0 评论 -
如何撰写数据运营分析报告
数据分析报告是根据数据分析原理和方法,运用数据来反映、研究和分析事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。原创 2023-01-04 11:28:01 · 390 阅读 · 0 评论 -
如何通过少量样本推断整体业务情况
在产品运营中非常常见,为了能够解决大量数据时分析效率急剧下降的窘况,我们就必须能够去分析非常小量样本的特征,再用这些特征去评估海量总体数据的特征,我们叫它。样本,是指我们需要“分析或考察的数据”的一部分;而需要“分析或考察的数据”我们叫作总体。说白了就是,用样本的分析情况,来反映总体的情况。抽取一小部分样本数据来快速分析全量用户的特征。例如我们要分析 DAU 的数据,今天 DAU 是 100万,那么这 100万 用户就是总体,其中的10万 用户便是样本;原创 2023-01-01 14:54:41 · 990 阅读 · 0 评论 -
数据分析之描述性统计
当我们打开一份有十几列,几万行的明细数据时,那种感觉我相信用铺天盖地、头晕目眩来形容是再合适不过了。面对如此令人崩溃的场景,必须要求我们要求能够快速找到数据的特征。描述性统计正是为此而生,它通过几个简单的分析方法就能在几秒钟内提取出指标背后的数据特征,快速建立整体全面的认知,并帮助我们寻找到分析的突破口。为了能够高效的发现数据的特征,描述性统计为我们提供了三个非常有用的分析工具,分别是:中位数/平均数方差/标准差。原创 2022-12-26 10:24:53 · 1458 阅读 · 0 评论 -
Clickhouse 使用DBeaver连接
ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。本文介绍如何搭建ClickHouse服务,以及客户端如何连接。原创 2022-12-04 17:14:30 · 7757 阅读 · 0 评论