自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

原创 股票价格走势的行业关联性

A股股价走势的行业关联性分析

2022-07-21 18:25:52 1018

原创 财务分析之利润表、现金流量表

利润表企业在一定时间范围的经营成果,基于"收入-费用+利得-损失=利润"列出各项费用利润表中常见条目解释:净利润利润总额 - 所得税;利润总额营业利润+营业外收入-营业外支出营业利润营业收入-营业成本-营业税金及附加-期间费用-资产减值损失±公允价值变动损益±投资损益±资产处置损益+其他收入期间费用销售费用+管理费用+财务费用,企业在生产经营活动中不能归属于某个特定成本核算的费用;一般期间费用随着规模的增大而增大,但幅度会小于规模增大幅度营

2022-04-28 23:01:55 435

原创 财务分析之资产负债表

资产负债表某一时点企业的全部资产、负债与股东权益(自有资本)的存量及其结构,其中,股东权益(自有资本)也称作净资产。资产负债表主要包括流动资产、非流动资产、流动负债、非流动负债。流动资产1.货币资金:定义:货币形态的资金,包括库存现金、银行存款等特点:流动性高、收益性低;需要在现金流动性和收益能力间权衡举例:取得现金投资、获得现金捐助、获得银行贷款、销售收入;购买材料、支付工资、归还借款、支付税金2.应收账款:定义:销售产品、提供服务时应向购买单位收取的款项特

2022-04-28 14:11:29 534

原创 tensorflow serving过程及线上预测碰到的一些神经网络相关问题

一.安装docker安装教程很多,例如可参考docker官网:https://docs.docker.com/install/linux/docker-ce/centos/# 安装yum-utils包sudo yum install -y yum-utils# 设置repositorysudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo# 安装最新的Dockersud

2022-03-23 11:26:51 2924 2

原创 使用python将ppt文件批量转为pptx、批量提取ppt中的文字保存

import osfrom pptx import Presentationfrom docx import Documentimport os.pathimport win32com.clientclass PPT2Word(object): """将filepath对应的pptx文件中的文字提取,并保存为同名docx文档""" def __init__(self, filepath): self.wordfile = Document() self.

2022-02-20 18:24:26 1838

原创 新闻推荐系统概要

推荐量新文章初次推荐量:通过一段时间内对创作者的内容和读者阅读、关注行为的记录和分析得出的创作价值评分,包括健康度、关注度、传播度、垂直度、原创度等5个维度二次推荐量:将根据读者的点击率和阅读完成率以及其他点赞、转发、收藏、评论互动等来决定是否再进行新一轮更大范围推荐,或者还是减少推荐量另外还有一个影响二次推荐很大的因素,那就是发文时间。文章发布的时间越长了,推荐的数量就越低了,80%以上的推荐量是在24小时内完成的。推荐原理创作者没有粉丝也有可能获得百万千万的阅读量,因为APP自带粉丝通过

2021-09-10 18:19:46 578

原创 NDCG归一化折损累积增益

NDCG常用于TOP-K排序的评价指标,不仅体现了预测的TOP-K个结果是否真的相关(有无点击),同时体现这TOP-K个结果的相对排序。累积增益CG:推荐系统中CG表示将每个推荐结果相关性的分值累加后作为整个推荐列表的得分:CGk=∑i=1kreli​CG_k = \sum_{i=1} ^{k}rel_i ​CGk​=∑i=1k​reli​​其中, relir e l_ ireli​ 表示位置 iii 的预测结果的相关性,kkk 表示推荐列表的大小。CG没有考虑每个推荐结果处于不同位置对整个推荐结果

2021-06-03 23:41:18 1397

原创 python三维视图制作

场景:三维视图,例如想可视化z随着x、y的变化规律maxlen = 5dim = 100# data是需要可视化的二维列表,shape为(maxlen, dim),值介于-1到1之间data = [[0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00

2021-05-13 18:10:30 343

原创 FM/FFM算法介绍

CTR/CVR预测时,用户的性别、职业、教育水平、品类偏好,商品的品类等特征,经过One-Hot编码后特征量膨胀,呈现数据稀疏性;某些特征之间相互关联之后与标签label的相关性大幅提升,例如商品类型特征与性别特征(”化妆品”类商品与“女”性,“球类运动配件”的商品与“男”性),因此,引入特征的关联特性非常具有意义。多项式模型是包含特征组合的最直观的模型,其中二阶多项式模型如下;前两项为普通的特征线性组合,后一项为特征交叉项;特征数量为n, xi和xj分别代表第i和第j个特征的值,只有当xi和xj均

2021-04-05 13:07:36 164

原创 UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position

该错误一般出现在涉及中文的地方,只需要在该地方(变量val)后加上encode(encoding=‘utf-8’) 即可,val.encode(encoding=‘utf-8’) ;另外,打开文件也可能出现该问题:open(path_file, encoding=‘utf-8’)

2021-03-02 17:58:43 1568 1

原创 pid进程相关操作

1.执行py文件生成进程的命令如下:/data/anaconda3/envs/python_env36/bin/python /data/yzx/sale_predicts_allenv/rocketmq_file/task_consumer.py prod2.未运行该文件,查看该文件相关进程:可以看到含有一个pid为10754的查询进程,且该进程号随时变化,task_consumer.py文件并未运行[root@node01 ~]# ps -ef|grep rocketmq_file/task_

2021-02-24 14:53:33 350

原创 时间序列分解:stl、prophet原理与实现

参考文章:局部加权线性回归Lowess时间序列分解算法:STL时间序列分解-STL分解法STL——以鲁棒局部加权回归作为平滑方法的时间序列分解方法STL时序分解:将时序分解为趋势项、季节项(周、月等)、余项。利用Lowess局部加权回归技术进行平滑;通过外循环设计体现鲁棒性。分别用Yv, Tv,Sv,Rv分别代表数据,趋势项、季节项和余项,v的范围为0到N,那么Yv=Tv+Sv+Rv ,其中v=1,⋯,N (加法模型中,各项具有相同量纲、STL只能处理加法模型,可以先将数据

2020-11-30 12:17:21 13319 7

原创 局部加权线性回归Lowess

当要预测的样本序列不是明显的线性关系时,用线性回归会存在拟合不好的现象,即欠拟合。局部加权回归定义:以一个点 x为中心,向前后截取一段长度为frac的数据,对于该段数据用权值函数 w做一个加权的线性回归,记 ( x , y ^ )为该回归线的中心值,其中 y ^为x拟合后曲线对应值。对于所有的n个数据点则可以做出n条加权回归线,每条回归线的中心值y ^的连线则为这段数据的Lowess曲线(上述为单次回归,局部加权回归可多次迭代)。线性回归与局部加权回归的损失函数:可以发现:局部加权回归对局部特征能较

2020-11-27 23:11:16 3596 1

原创 往MYSQL表中导入数据文件碰到的一些问题

1、mysql服务器建立好表table_a后,通过mysql客户端(例如mysql front)连接服务器,step1:点击表"table"—>“右键导入”—>“CSV文件”;step2:选择好相应数据文件data.txt后,右下角更改字符集为"UTF-8"(否则可能导入中文显示乱码问题),点击“确定”step3:选择相关配置:大标题:如果data.txt无字段标题行,则反选;如有字段标题行,则选中;分隔符:选择相应字符,一般为逗号“,”;2、mysql数据导入如果分隔符为一些特殊

2020-11-21 22:17:35 452 1

原创 conda虚拟环境相关

1.conda虚拟环境相关命令:创建虚拟环境:使用 conda create -n your_env_name python=X.X(2.7、3.6等),anaconda 命令创建python版本为X.X、名字为your_env_name的虚拟环境。conda create -n env_name python=2.7激活虚拟环境:Linux使用如下命令即可激活创建的虚拟环境source activate your_env_name(虚拟环境名称)退出虚拟环境: source deact

2020-11-18 00:42:44 549

原创 MYSQL增删改查操作、查询语句执行顺序、力扣试题解析

本文参考廖雪峰的MYSQL教程,链接:https://www.liaoxuefeng.com/wiki/1177760294764384样例用到的数据表如下:students表:| id class_id name gender score1 1 小明 M 902 1 小红 F 953 1 小军 M 884 1 小米 F 735 2 小白 F 816 2 小兵 M 557 2 小林 M 858 3 小新 F 919 3 小王 M 8910 3 小丽 F 85 | |classe

2020-11-13 11:38:19 1135

原创 HADOOP新datanode的添加

新datanode的添加1.对slave2机(已有datanode节点)进行克隆slave222.ifconfig查看mac地址00:0c:29:46:5b:4f3.编辑文件etc/sysconfig/network-scripts/ifcfg-ens33,修改mac地址和ip地址IPADDR=192.168.74.134HWADDR=00:0c:29:46:5b:4f4.nmtui修改主机名称在master主机上的/etc/hosts文件添加slave22机的名称、ip映射在mas

2020-11-10 23:31:54 484

原创 HADOOP完全分布式集群搭建注意点

HADOOP完全分布式集群搭建注意点1.集群规划2.环境相关:cent OS 8JAVA_HOME=/usr/local/jdk/jdk1.8.0_271/HADOOP_HOME=/usr/local/hadoop/hadoop-2.9.2/3.master主机在nat模式下的网络设置参考:https://blog.csdn.net/u013305747/article/details/783759464.重启网络服务命令:nmcli c reloadnmcli c up ens335

2020-11-08 19:01:22 512

申万三级行业分类股票明细2021版

Excel文件,包含三级行业编码、股票代码、股票名称字段

2022-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除