python
文章平均质量分 74
donruo
这个作者很懒,什么都没留下…
展开
-
python多进程使用
ps:对于远程过程调用的高级应用程序而言,比如使用进程池,Pool可以提供指定数目的进程,供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个进程用来执行该请求;但如果池中的进程数已经达到规定最大值,那么该请求就会等待,直到池中有进程结束,就重用进程池中的进程。例如当被操作对象数目不大时,可以直接利用multiprocessing中的Process动态生成多个进程,十几个还好,但如果是上百个上千个,手动的去限制进程数量却又过于繁琐,此时可以发挥进程池的功效。原创 2022-09-11 10:13:35 · 591 阅读 · 0 评论 -
基于bert特征提取的FAQ问答系统构建
faq的问答系统是目前用的比较广泛的问答系统,由于它落地简单,并且大部分场景都需要,构建一个faq问答系统可以作为一个baseline快速应用到实际场景中。下面就介绍如何快速构建一个faq问答的baseline。一、环境的搭建faq的核心技术是信息检索,信息检索的常用工具则是es,es既可以对faq知识库存储,又可以快速查询文本。同时也有配套的可视化工具kibana,方便数据查询和管理。此外,es的社区也很活跃,文档和讨论的问题也方便使用。elasticsearch+kibana安装使用docker容器拉取原创 2022-06-02 14:14:31 · 1099 阅读 · 0 评论 -
使用pip安装numpy遇到问题
根据教程将numpy安装包从http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy下载后进行安装由于我的电脑是64位的,所以我根据python和bit选择合适的安装包:numpy‑1.13.3+mkl‑cp27‑cp27m‑win_amd64.whl将包放到本地文件夹后发现:pip安装报错:is not a supported wheel on原创 2017-10-07 09:29:05 · 9135 阅读 · 0 评论 -
Titanic生还率预测
Titanic生还率预测是Kaggle的经典项目,最近学习了机器学习与数据分析相关算法,参考了Kaggle里一些Kernels,通过此项目来锻炼自己所学的知识。主要使用Python语言里的pandas、sk-learn、matplotlib包进行相关数据分析。主要分析思路分为四个部分:导入数据、数据可视化、数据整理、调用算法预测。一、导入数据#导入数据,简单查看数据特点af=pd原创 2017-11-26 18:16:25 · 543 阅读 · 0 评论