《百万英雄》比较火。最近我也在玩,把高中的知识都还给教员了。10秒的答题时辰让人根柢来不及去百度搜索。于是我建造了这个剧本,对问题问题停止文字识别,主动翻开网页停止搜索。首先来看一下测试成效:
实现事理:
实现事理很是简单。安卓手机毗连电脑,经由过程adb调试实现敌手机答题页面的截屏,然后把持百度云AI停止文字识别,在前往成效中找到问题的文字,经由过程python库翻开阅读器停止阅读。
预备工作:
安卓手机毗连电脑,开启手机的调试形式。
电脑上必要有adb调试工具和python3安装
经由过程pip3 install baidu-aip安装百度的文字识别库
在百度ai上注册,并申请一个文字识别的应用,获得下面第二步必要的三个密码。
代码实现:
第一步:引入必要的库
上面有两个函数,我们一会再说。
第二步:实现上岸百度aip。这局部按照百度api文档写代码即可。
这局部代码百度文档上有,目的是连上百度ai。
第三步:截取屏幕
这局部是adb调试的语法。我们经由过程os.system()挪用
第四步:裁剪图片并发送图片到百度ai
这里用到了上面一起头的两个函数。在第三部获得问题图片后,我们对图片停止裁剪,裁剪出只需问题和选项的局部,如答应以大幅进步ai的反响速度。然后经由过程百度给出的函数get_file_content和client.basicGeneral获得数据。
第五步:获得问题上网搜索
这里面我为了应对,“下面的哪些不是。。。”如许的问题,给了两种搜索编制,一种是只在百度上搜索问题,另一种是连着谜底一起去百度搜索。小编还是要推荐自己建立的裙Python学习:五七七九零一二九四 这里有推荐的学习路线,基础视频学习资料和电子教程文档和Python安装工具及Python技术学习交流和分享.末了经由过程webbrowser翻开阅读器。
一、原理:
其实原理很简单:
1.手机投屏到电脑;
2.截取投屏画面的题目部分,进行识别,得到题目和三个答案;
3.将答案按照一定的算法,进行搜索,得出推荐答案;
4.添加了一些其他辅助功能,比如:浏览器搜索结果展示、关键字高亮、浏览器可点击等;
二、二营长,把我的意大利...............代码,呈上来,给友军看看
1.手机投屏:
方式很多,这里只列举几个比较常用、且自己感觉简单易用的:
A.IOS:局域网内,可以利用iTools里的苹果录屏大师(airplay),进行投屏;
B.安卓:利用连接线,可以用Totall Control,将安卓手机的画面投到电脑上;而且电脑上还能直接操作手机;
C.模拟器:一般都是安卓模拟器;可以自行下载并安装;
2.截取画面中的题目和答案
A.先设置要截图的区域。
我创建了一个窗体,专门用于设置截图区域,给它取名叫:frmCutter。
原理:在主窗体打开frmCutter时,就将frmCutter全拼显示。同时截取一张整个屏幕的图片,把它设置成frmCutter窗体的背景图片。
这样就能在frmCutter上自由地设置了。
主窗体打开frmCutter窗体时:
1 // 新建一个和屏幕大小相同的图片 2 Bitmap catchBmp = new Bitmap(Screen.AllScreens[0].Bounds.Width, Screen.AllScreens[0].Bounds.Height); 3 4 // 创建一个画板,让我们可以在画板上画图 5 // 这个画板也就是和屏幕大小一样大的图片 6 // 我们可以通过Graphics这个类在这个空白图片上画图 7 Graphics g = Graphics.FromImage(catchBmp); 8 9 // 把屏幕图片拷贝到我们创建的空白图片 catchBmp中10 g.CopyFromScreen(new Point(0, 0), new Point(0, 0), new Size(Screen.AllScreens[0].Bounds.Width, Screen.AllScreens[0].Bounds.Height));11 12 // 创建截图窗体13 frmCutter _frmCutter = new frmCutter();14 _frmCutter.Tag = this;15 16 // 指示窗体的背景图片为屏幕图片17 _frmCutter.BackgroundImage = catchBmp;18 19 _frmCutter.Width = Screen.AllScreens[0].Bounds.Width;20 _frmCutter.Height = Screen.AllScreens[0].Bounds.Height;21 DialogResult dr = _frmCutter.ShowDialog();
然后再frmCutter窗体中,写入几个事件:
1 //点击鼠标右键时,取消设置 2 private void frmCutter_MouseClick(object sender, MouseEventArgs e) 3 { 4 if (e.Button == MouseButtons.Right) 5 { 6 this.DialogResult = DialogResult.OK; 7 this.Close(); 8 } 9 } 10 11 //点击鼠标左键时,开始画区域图 12 private void frmCutter_MouseDown(object sender, MouseEventArgs e) 13 { 14 // 鼠标左键按下是开始画图,也就是截图 15 if (e.Button == MouseButtons.Left) 16 { 17 // 如果捕捉没有开始 18 if (!_catchStart && !_catchFinished) 19 { 20 _catchStart = true; 21 22 // 保存此时鼠标按下坐标 23 Point newPoint = new Point(e.X, e.Y); 24 25 _downPoint = newPoint; 26 27 Tools.StartPoint = newPoint; 28 } 29 } 30 } 31 32 //鼠标移动时,根据移动的鼠标和点击时的第一个点,绘制矩形 33 private void frmCutter_MouseMove(object sender, MouseEventArgs e) 34 { 35 #region 确保截图开始 36 if (_catchStart && !_catchFinished) 37 { 38 // 新建一个图片对象,让它与屏幕图片相同 39 Bitmap copyBmp = (Bitmap)Tools.ScreenShots.Clone(); 40 41 // 获取鼠标按下的坐标 42 Point newPoint = new Point(_downPoint.X, _downPoint.Y); 43 44 // 新建画板和画笔 45 Graphics g = Graphics.FromImage(copyBmp); 46 Pen p = new Pen(Color.Red, 1); 47 48 // 获取矩形的长宽 49 int width = Math.Abs(e.X - _downPoint.X); 50 int height = Math.Abs(e.Y - _downPoint.Y); 51 if (e.X
B.设置好截图区域后,每次题目出现时,变对该区域截图:
1 //截取设置的区域屏幕图片 2 Bitmap _screenShots = new Bitmap(Screen.AllScreens[0].Bounds.Width, Screen.AllScreens[0].Bounds.Height); 3 // 创建一个画板,让我们可以在画板上画图 4 // 这个画板也就是和屏幕大小一样大的图片 5 // 我们可以通过Graphics这个类在这个空白图片上画图 6 Graphics g_screenShots = Graphics.FromImage(_screenShots); 7 // 把屏幕图片拷贝到我们创建的空白图片 CatchBmp中 8 g_screenShots.CopyFromScreen(new Point(0, 0), new Point(0, 0), new Size(Screen.AllScreens[0].Bounds.Width, Screen.AllScreens[0].Bounds.Height)); 9 10 //剪切的图片11 _catchBmp = new Bitmap(Tools.CatchRectangleSize.Width, Tools.CatchRectangleSize.Height);12 Graphics g = Graphics.FromImage(_catchBmp);13 g.DrawImage(_screenShots, new Rectangle(0, 0, Tools.CatchRectangleSize.Width, Tools.CatchRectangleSize.Height), Tools.CatchRectangle, GraphicsUnit.Pixel);14 g.Dispose();15 g_screenShots.Dispose();16 17 //显示图像18 this.imgCut.BackgroundImage = (Image)_catchBmp;
C.将截到的问题和答案图片,用OCR识别
比如,我现在设置并截取到了这张图片:
识别图片中的文字,OCR软件和API也不少。以前我用的谷歌tesseract4.0,安装在本机的,没做词库,识别率一般。
后来发现百度OCR每天免费调用500次,果断转场!事实证明,正确率还是高很多。
D.得到识别结果,将识别结果处理后,进行百度搜索:
创建了一个试题实体,后面用起来就方便了:
1 /// 2 /// 试题类 3 /// 4 public class QuestionModel 5 { 6 /// 7 /// 问题 8 /// 9 public string Question { get; set; }10 11 /// 12 /// 答案113 /// 14 public string Answer1 { get; set; }15 16 /// 17 /// 答案218 /// 19 public string Answer2 { get; set; }20 21 /// 22 /// 答案323 /// 24 public string Answer3 { get; set; }25 }
E.百度搜索,并显示参考答案:
a).算法搜索:
1.用题目去百度搜索。在搜索的结果中,查询答案出现的次数。
2.用题目+答案去搜索。得到每个组合的百度结果个数。
然后将上述两种方法,根据权重权衡,用户可以自行决定偏向于哪种结果。
b).辅助搜索:
右边还放了一个浏览器,可以在得到识别结果的第一时间,呈现出根据题目搜索百度的结果;并且在里面高亮显示3个答案关键字。
三、坐等吃鸡!
自动截图、自动识别、自动搜索、自动给出参考答案、自动展现出搜索页面并高亮显示关键字……
多了一系列的辅助功能,想不吃鸡都难啊~