第二版模型报告
两年零九个月内一共发出信号113次,正确判别次数为77次,精确率0.66,其中有些是无效信号,例如涨停你买不进去的,这些无效信号也有亏有赚,未做详细统计。
学校的经费只够买有限的高频l2数据,想完全利用这些数据,所以想了个法子,一共33个月的数据,每一次扣掉三个月的数据,训练了11个基本相同的模型,每个模型用来判别被扣掉的三个月空窗,把判别的结果沿着时间穿起来,相当于就实现了有33个月的验证集
以下是预测的结果,不知道为什么批输出的要比一次次调的少一点
{’
‘600773.SH’: [‘#####20220810判别错误#####’],
‘002156.SZ’: [‘20220805判别正确’, ‘20220808判别正确’],
‘601360.SH’: [‘20230209判别正确’, ‘#####20240507判别错误#####’],
‘601698.SH’: [‘20231017判别正确’, ‘#####20231023判别错误#####’],
‘600446.SH’: [‘#####20220218判别错误#####’],
‘002432.SZ’: [‘20221121判别正确’],
‘000034.SZ’: [‘#####20231030判别错误#####’],
‘603083.SH’: [‘20230418判别正确’],
‘002371.SZ’: [‘20230414判别正确’],
‘600895.SH’: [‘20231011判别正确’, ‘#####20231027判别错误#####’],
‘600096.SH’: [‘20220217判别正确’, ‘20220223判别正确’],
‘600196.SH’: [‘#####20220511判别错误#####’],
‘000002.SZ’: [‘#####20221129判别错误#####’],
‘601858.SH’: [‘20231116判别正确’],
‘002261.SZ’: [‘20230224判别正确’, ‘20230706判别正确’],
‘000063.SZ’: [‘#####20230407判别错误#####’],
‘601138.SH’: [‘20240426判别正确’],
‘002709.SZ’: [‘20221011判别正确’],
‘002129.SZ’: [‘#####20240118判别错误#####’, ‘#####20240522判别错误#####’],
‘600143.SH’: [‘#####20220823判别错误#####’],
‘601788.SH’: [‘#####20221115判别错误#####’],
‘001696.SZ’: [‘20240419判别正确’,
‘20240426判别正确’,
‘#####20240507判别错误#####’,
‘20240517判别正确’,
‘20240731判别正确’,
‘20240731判别正确’],
‘002241.SZ’: [‘#####20230105判别错误#####’],
‘002222.SZ’: [‘20231107判别正确’, ‘#####20231114判别错误#####’],
‘600348.SH’: [‘20220715判别正确’],
‘000831.SZ’: [‘#####20221013判别错误#####’],
‘002402.SZ’: [‘#####20220803判别错误#####’],
‘002230.SZ’: [‘20230130判别正确’, ‘20230428判别正确’, ‘#####20231011判别错误#####’],
‘600100.SH’: [‘#####20230403判别错误#####’],
‘600171.SH’: [‘20240718判别正确’, ‘20240719判别正确’],
‘002384.SZ’: [‘20220728判别正确’],
‘000997.SZ’: [],
‘603019.SH’: [‘20230224判别正确’, ‘20230418判别正确’],
'600487.SH': ['20220830判别正确'], '600161.SH': [], '600061.SH': [], '601989.SH': [], '600958.SH': [], '603005.SH': ['20220805判别正确', '#####20231019判别错误#####', '20231025判别正确'],
'000792.SZ': ['20221104判别正确'],
'002603.SZ': ['20221027判别正确'], '002085.SZ': ['20240424判别正确', '20240516判别正确', '20240729判别正确', '20240829判别正确'],
'002436.SZ': ['#####20231120判别错误#####'],
'603260.SH': ['20220809判别正确'],
'002466.SZ': ['20220429判别正确'],
'600559.SH': ['20230213判别正确'],
'600536.SH': ['#####20220805判别错误#####', '20221013判别正确', '20230119判别正确'],
'002487.SZ': ['20220715判别正确', '#####20231020判别错误#####'],
‘600580.SH’: [‘20240506判别正确’],
‘002281.SZ’: [‘#####20231026判别错误#####’],
‘601127.SH’: [‘#####20231018判别错误#####’],
‘002407.SZ’: [‘#####20220704判别错误#####’],
‘000938.SZ’: [‘#####20230105判别错误#####’, ‘20230403判别正确’],
‘600438.SH’: [‘#####20220704判别错误#####’],
‘000810.SZ’: [‘20240822判别正确’],
‘600392.SH’: [‘#####20240409判别错误#####’],
‘002151.SZ’: [‘#####20231103判别错误#####’],
‘000988.SZ’: [‘20230420判别正确’, ‘#####20240401判别错误#####’],
‘600733.SH’: [‘20240705判别正确’],
‘600062.SH’: [‘20220706判别正确’, ‘20230421判别正确’],
‘000099.SZ’: [‘20240415判别正确’, ‘20240417判别正确’],
‘002456.SZ’: [‘20231013判别正确’, ‘#####20231023判别错误#####’, ‘20231103判别正确’],
‘000977.SZ’: [‘20230209判别正确’, ‘20230213判别正确’, ‘20230215判别正确’, ‘20230411判别正确’],
‘600699.SH’: [‘20220713判别正确’],
‘000021.SZ’: [‘20230403判别正确’, ‘20230406判别正确’],
‘000625.SZ’: [‘20221130判别正确’],
‘600418.SH’: [‘20220726判别正确’, ‘20231009判别正确’, ‘20231025判别正确’, ‘20231026判别正确’],
‘000009.SZ’: [‘#####20220727判别错误#####’,
‘#####20220811判别错误#####’,
‘#####20221014判别错误#####’,
‘#####20221014判别错误#####’],
‘000066.SZ’: [‘20221020判别正确’, ‘#####20230202判别错误#####’],
‘002558.SZ’: [‘20230428判别正确’],
‘601222.SH’: [‘20220714判别正确’],
‘000681.SZ’: [‘#####20230207判别错误#####’],
‘002130.SZ’: [‘20240424判别正确’, ‘20240724判别正确’, ‘20240724判别正确’],
‘601369.SH’: [‘20221019判别正确’],
问题
-
西藏城投–错误原因:范围错误
就不应该是模型的预测范围,因为大股东变了,但是依然是稳定的,不过程序判定为真实市值超过100亿,应该要被踢出范围的,这类问题暂时没想到好的方法解决,可能只能人工纠错了。 -
三六零-- 错误原因:高位接盘
后续再撘风控模型(基于换手+量价),强规则纠错,或者是一些图形判别来减少这种上当的情况。
-
错误原因:涨停无效
,买不进去的情况,还挺多,无论是判别成功还是判别失败,都没意义,这种后续强规则给他干掉。
后续计划
阶段一目前基本完成,作为单因子模型我觉得判别正确的准确率不低,但是容易遇上一两次高位接盘收益清零,贝塔太高,后续会有风控模型(主要是看换手),强规则纠错。模型比较粗糙野鸡现在,但是仍然有0.66的精确度,配合后续的推进,和交易策略上的设计,保守估计胜率可以上0.75,但是精确度不能实际反映盈亏比,所以回测框架得快快建立了。