paddlepaddle【python小白逆袭大神】结营心得

Day1-Python基础练习

利用循环输出99乘法表,还算蛮简单的
还有就是利用os.walk去遍历,感觉还挺好用的
第一天还是蛮轻松的,老师课也讲得很好

Day2-《青春有你2》选手信息爬取

说实话,第二天开始真的有点python从入门到入土的感觉,爬虫的过程,就是模仿浏览器的行为,往目标站点发送请求,接收服务器的响应数据,提取需要的信息,并进行保存的过程。request模块去获取数据,再用Beautifulsoup这个html的解析器去解析并提取数据。
整个过程:
1.先爬取选手参赛信息,再返回到页面数据。
2.解析页面数据,得到JSON文件。
3.爬取每个选手的百度百科图片,并保存。(百科图片是选手的照片册)保存是根据图片链接列表pic_urls, 下载图片,保存在以name命名的文件夹中。
4.打印爬取图片的路径。
其实老师代码写了很多,我们的部分感觉只需要复制粘贴然后改一些就可以了,代码还是有一些不太理解的部分,需要慢慢消化。

Day3-《青春有你2》选手数据分析

这次是作图,饼图和柱状图
这次真的算简单的了!
用到的就是numpy、pandas、maatplotlib、json这些
maatplotlib作图还是挺好用的的。感觉python作图比matlab还要方便哎。

Day4-《青春有你2》选手识别

这次是用paddlehub了
感觉这个真的很好用啊!以后我也会经常用滴。
首先是抓取数据,得到数据集
利用数据集对模型进行预训练
对数据集进行预处理
组建Finetune Task
当Finetune完成后,使用模型来进行预测。
但是因为那天太忙,没对图片进行增强,图片也不够多,所以预测正确妹妹的准确率不是很高。

综合大作业

1.爱奇艺《青春有你2》评论数据爬取
2.词频统计并可视化展示,看见很多夸我欣欣子的评论就很开心。
3.数据预处理:清理清洗评论中特殊字符(如:@#¥%、emoji表情符),清洗后结果存储为txt文档
中文分词:添加新增词(如:青你、奥利给、冲鸭),去除停用词(如:哦、因此、不然、也好、但是),统计top10高频词,可视化展示高频词
4.根据词频生成词云
可选项-添加背景图片,根据背景图片轮廓生成词云,这个我至今还没搞懂怎么弄,哎。再学吧。
5.结合PaddleHub,对评论进行内容审核

心得

总得来说收获还是蛮多的,python,paddlehub的使用都有了更深的了解,虽然我还没步入那么高深的领域,但起码有了初步接触,说实话白天上一天课晚上继续上课做作业真的有点忙不过来,但我还是都有坚持每天听课然后提交作业啦。后续课程也会继续关注飞桨滴。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值