paddle之《Python小白逆袭大神》小记(下)

paddle之《Python小白逆袭大神》小记(下)

paddle之《Python小白逆袭大神》小记(上)

Day4-《青春有你2》选手识别

感觉这一系列课程是环环相扣的,第四天的目标是对五位选手进行图像识别。

遇到的问题

最终识别结果如图下:
在这里插入图片描述
可以看到模型会把安崎错认为是许佳琪…
个人觉得对于图像识别的准确率主要有以下三点影响因素:

  1. 训练模型本身
  2. 数据集的大小和质量
  3. 批处理的大小batch_size

通过改变和增大数据集之后,对安崎选手的识别能力依然不佳。在以后有精力的时候会尝试着改进模型。

Day5- 综合大作业

最后的综合大作业实际上是前几天任务的总结。

  1. 爱奇艺《青春有你2》评论数据爬取
  2. 词频统计并可视化展示
  3. 绘制词云

遇到的问题

遇到的问题主要是在绘制词频统计图时,发生了如下的情况:
23333
图中我们可以看出:欣虞书!很显然这是在分词过程中出现了问题。
解决方法是采用jieba分词,通过加载自定义词典,使之可以正确分词。

def fenci(text):
    jieba.load_userdict('add_words.txt')
    seg_list_exact = jieba.lcut(text, cut_all = False) # 精确模式分词
    return seg_list_exact

最后附上最终的词云,嘿嘿嘿~
在这里插入图片描述
另外,绘制词云时的图片背景尽量要选择白色的,如果图片本身有白色的部分,则这些部分不会有词条。比如下图这个迪迦奥特曼…

结课感受

本次学习让我对paddle框架产生了浓厚的兴趣。在课程中,给我留下印象最深的是第四天自己动手制作简单的数据集。(ps:小姐姐的图片真的不好收集,最关键的是,她们有的真的好像)也要为老师的讲解点赞,对新手非常友好。后续一定会深入学习这次学习的文档资料。也希望课程组在完成基本的教学任务之后,分享更多训练效果较好的模型供大家学习。
总而言之,这次学习体验很佳,希望飞桨课程越做越好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值