一、语音识别
以字为建模单元代码:https://github.com/zw76859420/ASR_WORD
二、图像识别
以安检危险品、Mnist等数据集,采用深度学习方法进行分类,其中涉及VGG resnet densenet mobilenet 数据增强等技术,代码:
https://github.com/zw76859420/image-recognition
https://github.com/zw76859420/agriculture_recognition
其中下面是云彩识别比赛,A榜排名60/579:
https://github.com/zw76859420/cloud-recognition
https://github.com/zw76859420/kaggle-cats-and-dogs
三、视频动作识别
采用C3D构建视频动作识别模型,代码:https://github.com/zw76859420/video-action-recognition
四、文本分类
下面代码是师弟最后大作业,算是弥足自己文本处理的不足,代码:https://github.com/zw76859420/ML-DailyWork
五、声纹识别
采用MFCC、FBANK特征,构建声纹识别模型,代码:http://101.200.87.104:8090/zhangwei/jtyd_ai/tree/master/VC_Recognition
本人专研中文语音识别,欢迎各位朋友与我交流QQ:76859420;
深度学习交流群:737145025