【阅读材料精选 From-to-Date:2019.08.01~2019.09.30】
重点内容
【chargrid-ocr:基于语义分割和目标检测的端到端可训练OCR】
web:https://www.arxiv-vanity.com/papers/1909.04469/
【Editing Text in the Wild】
简介:白翔组新出的场景图片文字迁移的文
web:https://www.arxiv-vanity.com/papers/1908.03047/
【使用形状匹配GAN来做可控制的文本风格迁移】
github:https://github.com/TAMU-VITA/ShapeMatchingGAN
【AI落地的经验及思考】
web:https://lonelygo.gitbook.io/shift-ai-models-to-real-world-products/zheng-wen/ch01_overview
【PyTorch版《动手学深度学习》】
web:https://zh.d2l.ai
【一个高性能、模块化、可扩展的中文NLP工具包(中文分词 词性标注 命名实体识别 新词发现 文本分类 拼音简繁转换)】
github:https://github.com/mayabot/mynlp
【APEX加速,可以显著加速训练】
注:适用于有tensorcore的,16FP速度快的显卡,如RTX;
GTX1080Ti等Pascal架构及没有tensorcore的就不要尝试了。
https://zhuanlan.zhihu.com/p/79887894
【中文文本纠错模块代码】
github:https://github.com/zedom1/error-detection
【神经网络权重初始化:从基础到恺明方法】
pdf:https://pan.baidu.com/s/1B3nTP_wqocYLUSF5j60lvQ
【一个近乎完整的可识别中国身份证信息的Demo】
github:https://github.com/zhongfenglee/IDCardRecognition
【深度网络训练最佳实践/调试排错好文集锦】
1.神经网络训练方法
https://weibo.com/1402400261/Hrm70q8tg?type=comment#_rnd1568023907777
2.深度神经网络排错实践指南
https://weibo.com/1402400261/HdPPbgGWa?type=comment#_rnd1568023941900
3.神经网络调试清单
https://weibo.com/1402400261/Hlj4Wq36a?mid=4414132017126680&ouid=1402400261&type=comment#_rnd1568023955419
4.TensorFlow代码调试指南
https://weibo.com/1402400261/HjjTpdZ74?mid=4414132017126680&ouid=1402400261&type=comment#_rnd1568023960878
NLP
【高性能、模块化、可扩展的中文NLP工具包】
github:https://github.com/mayabot/mynlp
【NLP知识点和代码实现】
github:https://github.com/NLP-LOVE/ML-NLP
网络课堂
【OpenCV-Python图像处理教程】
github:https://github.com/ex2tron/OpenCV-Python-Tutorial
【黑客与安防免费电子书大列表】
github:https://github.com/yeahhub/Hacking-Security-Ebooks
【沁原的硅谷创新课】
github:https://github.com/Fabsqrt/BitTigerLab
【Python爬虫(集锦)】
github:https://github.com/xingag/spider_python
【东南大学《知识图谱》研究生课程】
github:https://github.com/npubird/KnowledgeGraphCourse
文献
模型相关
【“拿来就用”的深度学习模型库汇总】
weibo:https://weibo.com/1402400261/I2DuIhCKR?type=comment#_rnd1566269526469
【keras-文本分类】
github: https://github.com/yongzhuo/Keras-TextClassification
【中文的GPT2模型训练代码】
github:https://github.com/Morizeyao/GPT2-Chinese
数据集
【10万级免费(生成)人脸数据集】
web:https://generated.photos/
【EATEN:实体预测及数据集】
github:https://github.com/beacandler/EATEN
(数据集大部分是生成的,并且没有说明label里记录的方式,建议下载一个小型的数据集进行查看)
【机器学习数据集大列表】
web:https://www.datasetlist.com/
【端到端场景文字检测与识别资源大列表】
github:https://github.com/HCIILAB/Scene-Text-End2end
【场景文字检测与识别资源数据集】
github: https://github.com/HCIILAB/Scene-Text-Detection
github: https://github.com/HCIILAB/Scene-Text-Recognition
拓展阅读
【周志华《机器学习》学习笔记】
github:https://github.com/Vay-keen/Machine-learning-learning-notes
【PyTorch语音识别框架】
github:https://github.com/ryanleary/patter
【繁简转换器】
github:https://github.com/berniey/hanziconv
【Generating High-Resolution Fashion Model Images Wearing Custom Outfits】
view: https://www.arxiv-vanity.com/papers/1908.08847/
【能将图片内容用同一类型的元素组合起来】
github:https://github.com/nuno-faria/tiler
【设计模式超简单的解释】
github:https://github.com/guanguans/design-patterns-for-humans-cn#%F0%9F%8F%A0%E7%AE%80%E5%8D%95%E5%B7%A5%E5%8E%82%E6%A8%A1%E5%BC%8Fsimple-factory
【关于用户个人隐私保护的内容推荐】
web:https://www.arxiv-vanity.com/papers/1909.04421/
以上内容摘自新浪微博:@爱可可-爱生活
https://weibo.com/fly51fly?refer_flag=1005055010_&is_all=1