自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 分布式

分布式事务问题方案1方案2方案3本地事务不支持跨库操作方案1将有关联的表放在一个数据库中1. 同一个数据库操作 可以使用一个事务2. eg:用户表& 用户频道表 ,文章基本信息表 & 文章内容表方案2Mysql从5.6开始支持分布式事务核心是二阶段提交协议(简称 2PC协议 / XA协议)分布式事务会提供一个 事务管理器 来对 各数据库的本地事务进行统一管理, 只有各本地事务都向管理器 预提交 成功后, 事务管理器才会统一执行提交处理, 否则统一进行回滚处理注意: 在F

2020-06-23 20:04:06 96

原创 【无标题】

而在这个浪潮中,OpenAI推出的首个AI视频模型Sora,以其卓越的性能和前瞻性的技术,引领着AI视频领域的创新发展。通过专业性的文章或视频,向读者和观众展示Sora是如何通过深度学习和自然语言处理技术实现视频内容的智能生成和互动的。提示:探讨在AI技术日益普及的背景下,如何平衡技术创新与伦理道德的关系。分析在AI视频模型的助力下,创作者们将如何突破传统限制,实现更加个性化、高效和创新的创作过程。探讨在AI技术的驱动下,视频内容将如何更加智能地适应用户需求,实现更加自然和高效的人机交互。

2024-02-29 15:28:00 260

原创 非结构化数据的分析与挖掘

案例1 词频统计# 导入库import re # 正则表达式库import collections # 词频统计库import numpy as np # numpy库import jieba # 结巴分词import wordcloud # 词云展示库from PIL import Image # 图像处理库import matplotlib.pyplot as plt # 图像展示库# 读取文本文件with open('article1.txt') as fn: .

2020-08-08 17:20:53 1149

转载 常见的数据分析模型

一.消费者行为分析: AIDA模型A : Attention 注意I : Interest 兴趣D : Desire 欲望A : Action 行为模型的意思是: 当你希望用户购买你的产品或者服务时,你应该先吸引他的注意力,再引起他的兴趣,然后勾起他的欲望,最终促成他的行动。比如说,拼多多的广告,就用一支非常洗脑的广告神曲引起了你的注意,然后用“3亿人都在用”这样的广告词勾起你的兴趣,继而又用便宜的价格激发你购买的欲望,最后用一些限时拼单等等有紧迫感的

2020-08-05 18:34:22 652

原创 K-近邻算法(K Nearest Neighbor)(一)

1.简介:定义: 如果一个样本在特征空间中的k个最相似(即特种空间中最近邻)的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性.工作原理:存在一个样本数据集合,称训练样本集,并且样本集中的每个数据都存在标签,即样本集中的每个数据与所属分类的对应关系.输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,人后算法提取样本集中特征醉相思的数据(距离最近)的分类标签在上图实线圆圈内,红三角有两个,而蓝方块只有一个,所以它是红三角的可能性大;但在虚线

2020-08-05 14:29:19 225

原创 SQl 优化问题

SQL编写技巧:1.合理使用索引索引少了查询慢索引多了占用空间大,执行增删改查语句的时候需要动态维护索引,影响性能,选择率高(重复值少),且where频繁需要建立B树索引;一般join列需要建立索引;2. 使用UNION ALL 代替 UNIONunion all 的执行效率比union 高,union执行时需要排重union需要对数据进行排序3.避免 selcet * 写法执行SQL时优化器需要将 * 转成具体的列;每次查询都要回表,不能走覆盖索引;4.避免复杂SQL

2020-08-04 18:40:05 179

原创 SQL 窗口函数 之排名问题

/【知识点1】时间格式转化/select 学号 ,timestampdiff(month ,出生日期 ,now())/12 from student ;2.**涉及到排名问题可使用窗口口函数rank, dense_rank, row_number **select *, rank() over (order by 成绩 desc) as ranking, dense_rank() over (order by 成绩 desc) as dese_rank, row_number() o

2020-08-04 18:05:03 367

原创 精确率与召回率

分类问题的评估指标1.分类评估方法1.1 精确率与召回率1.1.1 混淆举证在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)TP:True Positives, 表示实际为正例且被分类器判定为正例的样本数FP:False Positives, 表示实际为负例且被分类器判定为正例的样本数FN:False Negatives, 表示实际为正例但被分类器判定为负例的样本数TN:True

2020-08-04 15:21:48 7136 3

原创 SQL执行GROUP BY 时可能会碰到的一个错误

#SQL8.0执行GROUP BY 时可能会碰到的一个错误Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘sss.month_id’ which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_b

2020-07-19 11:15:15 679

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除