Python是当之无愧的热门语言,尤其是AI人工智能开发。掌握基本语言后,有了一定编程知识,还是感觉无从下手,不会编程,怎么办?
没有捷径,为了适应公司的真实项目开发,就要多写代码,多总结,逐步积累自己的知识库和实际经验。
一,多写代码
推荐一个在线编程网站,HackerRank,看名字就知道很牛,Hacker排行榜,里面有多种编程语言,不同难度、针对初学者的编程练习题。
1,注册账号,登录,选择要练习的Python语言
2,选择题目,可以筛选难度、功能类别
3,编写代码,运行,通过测试后提交
4,积累到一定分数后,获得Python勋章
网站功能还有成绩查询、榜单排名、参加竞赛等。
二,参加开源项目
现在Python是一门使用非常普遍的开发语言,尤其是在AI软件开发领域。多到Github上面寻找,选择有兴趣的开源项目,尝试参与开发。
1. 选择有兴趣的项目,仔细阅读文档和代码,查看历史提交记录,这个过程本身也能学到很多知识
2. 阅读代码,重点理解怎么写?为什么这样写?有没有更好的写法?
3. 按照开源社区的代码标准,开发提交代码,完成单元测试
三,开源项目实例:fastHan汉语词法分析
fastHan基于fastNLP与pytorch实现中文自然语言处理,内核基于BERT联合模型,在13个语料库中进行训练,可处理中文分词、词性标注、依存分析、命名实体识别四项任务。
值得称赞的是,fastHan作者是复旦计算机教授,非常优秀的开源项目。汉语分词,性能杠杠的,亲测有效。
Python运行环境,安装简单:
pip install fastHan==1.3
注意依赖包:
torch>=1.0.0
fastNLP>=0.5.0
使用时只需两步:加载模型、输入句子。
from fastHan import FastHan
model = FastHan()
sentence = "国产人工智能,汉语分析开源项目。"
print(sentence)
answer = model(sentence)
print(answer)
注意首次初始化模型时,将自动从服务器中下载模型数据,并且可以指定large版本,默认base。
model = FastHan(model_type="large")
模型分词时,可以指定target参数,可选"Parsing", "CWS", "POS", "NER",默认CWS。
print(model(sentence, target="NER"))
#python#