百万英雄答题助手
参考了微信跳一跳助手的思路,通过截取手机上面的题目,利用百度文字识别识别问题和答案。
运行
开启浏览器同步支持:
科普性知识测试
回锅肉属于什么菜系
北京奥运会是什么时候
简洁版本:
我什么都不会勒,但是想带女友打怪升级
真有一个办法,提供了小白版本:
无需下载配置复杂的工具链路
专人协助
一键运行,云端支持开发中
小白版本是基于目前的主干分支开发的,继承了主干分支的功能,主要是使用上面�配置的东西变少了,专门提供给不太懂技术的小白,大神请使用开源代码折腾。
小白版本 目前是需要收取一定的费用,价格是9.9,请走捐赠入口捐赠后联系,或者加微信也可以,微信在最下面。
只有 iphone, 没有 android 手机怎么办?
简单靠谱的办法是使用模拟器。
首先还是要下载adb工具,下文有介绍
下载夜神模拟器并安装
安装完成后,打开 cmd, 检查是否有模拟器设备 adb devices
在模拟器中安装答题应用
运行答题辅助脚本python main.py,如果有问题下文有解决办法,请参照安装步骤
支持捐赠
捐赠后请给我留言,如下福利:
项目结束后,整体讲解
免安装版提供支持,已完成,无需任何下载
无条件辅助安装包
百度OCR
notice: 百度的注册开发者后,创建应用就可以看见自己的 key 和 secret 。
部署
从python官网安装python3.6环境
pip install -r requirements.txt
创建默认的临时文件夹mkdir -p screenshots
修改默认的配置文件config.yaml,配置文件夹中可以配置临时数据目录和appcode
ADB工具配置
以 linux 为例:
下载 android-platform-tools,访问google下载,默认 mac,windows, linux 均支持
配置环境变量,进入 platform 目录下面export PATH=$(pwd):PATH配置 adb 工具到系统的 path 下面
手机打开开发者模式
使用usb连接手机后信任,adb devices来检查是否有自己的设备,确认已经连接
接下来就进入百万英雄,等待有题目的时候就运行python main.py即可
Release
2018/1/15: 增加芝士大会的支持,另外增加特别关键字
2018/1/14: 新增知识库功能, 内置adb,小白版一键运行
2018/1/13: 增加浏览器支持,修复部分bug
2018/1/12: 更改搜索策略,自动决策,减少python依赖
2018/1/11: 结巴分词预编译和多核分词优化
2018/1/10: 增加ios分支,修复master文本摘要bug
2018/1/9: 修复答案获取bug,增加长文本信息摘要算法,增加百度OCR
2018/1/9: 使用相似度猜测答案,请切换分支使用
分支说明
master: 主要是 Android 手机使用,支持汉王 / 百度识别 / ocrspace
knearby: 根据文本关联度思想,答案更加清晰,目前只支持百度识别
V2 文本关联相似度分析
对于答题这样的项目,首先一个问题,然后有三个答案可以选择,能不能通过分别统计问题与三个答案的关联度来选择出正确的答案,由于数据采集是来自百度的,可能会受到部分广告数据的影响,但是在集合相当大的情况下,关联度还是会呈现正相关。
假设题目是:
中国历史上著名的科举制度开始于那个朝代?
汉朝
唐朝
隋朝
我们先用百度分别搜索汉朝,唐朝,隋朝,得到如下数据:
朝代
搜索出的数量(来自百度为您找到相关结果约)
汉朝
17900000
唐朝
30500000
隋朝
16600000
然后我们在用题目 + 答案的方式,搜索示例:
中国历史上著名的科举制度开始于那个朝代? 汉朝 得到三次的搜索结果:
关键字
搜索出的数量(来自百度为您找到相关结果约)
Q + 汉朝
602000
Q + 唐朝
837000
Q + 隋朝
658000
关联度计算方式:
K = count(Q&A) / (count(Q) * count(A))
关联度如下:
答案
关联度
汉朝
0.0336
唐朝
0.0274
隋朝
0.0396
贡献者(不分先后)
参考项目
交流学习
想要交流学习请添加我的 wechat ,
群已经满了200人了,需要邀请进群。
请优先加入qq群,很重要的改进可以加weixin:
请加qq后邀请:
qq: 2244741445