Python
文章平均质量分 58
在路上吗
简单的学习笔记
展开
-
解决Mac系统VSCode终端无法启动Conda环境
最近,需要开发Python项目,在VSCode中安装了插件管理Conda环境。但是,在VSCode内嵌终端无法切换Conda环境,仍然是系统自带的版本。原创 2023-03-22 12:06:23 · 1687 阅读 · 0 评论 -
随手笔记:Windows Python 安装、删除 error 2203/2502/2503
错误描述The installer has encounted an unexcepted error install this package. This may indicate a problem with this package. The error code is 2203/2503/2503. 官方定义2203 Database: [2]. Cannot open原创 2018-01-24 16:48:55 · 6818 阅读 · 1 评论 -
如何通过Python+Selenium+PhantomJS/Chrome获取HTTP状态和Response Headers
Selenium没有提供获取HTTP状态码的API,并且似乎以后也不准备提供该功能,还好有变通的方法。这里提供Python+Selenium+PhantomJS的实现供参考。Python+Selenium+ChromeDriver似乎也有解决方法,有需要的同学,翻翻这个问题的答案。原创 2017-12-03 01:50:15 · 21095 阅读 · 1 评论 -
Gensim官方教程翻译(三)——主题与转换(Topics and Transformations)
gensim官方教程翻译。本篇主要介绍了gensim提供的各种空间向量模型转换方法及其使用。翻译 2015-07-03 15:38:20 · 12597 阅读 · 10 评论 -
Gensim官方教程翻译(五)——英文维基百科的实验
仅供个人学习只用,如有错误,敬请指正。原文地址为了测试gensim的性能,我们在维基百科英文版上运行了一些实验。 这个页面描述了获取与处理维基百科的过程,以便任何人都能再现这个结果。本教程要求已经正确安装了gensim。 译者注:维基百科的内容在不断更新,因此本文的结果仅供参考,可能与实际情况有出入。准备语料库首先,从 http://download.wikimedia.org/enwik翻译 2015-07-05 22:14:32 · 7059 阅读 · 7 评论 -
Python 写入 Mysql 乱码问题
确保以下几点,就不会有乱码问题,字符集统一采用UTF-8: 1 . 表的默认字符集是否为UTF-8,使用类似如下的SQL语句:CREATE TABLE IF NOT EXISTS name( id INTEGER PRIMARY KEY AUTO_INCREMENT, prop VARCHAR(50), ...)DEFAULT CHARSET = UTF8;2 .原创 2016-05-20 16:55:30 · 3483 阅读 · 0 评论 -
NumPy、SciPy 等Python包在Windows下的whl安装包下载
该地址提供了许多开源扩展包的官方CPython发布的32位及64位的二进制文件(包括NumPy,SciPy等),安装方便。 感谢加利福尼亚大学尔湾分校(University of California, Irvine)荧光动力实验室(瞎翻译的,原名Laboratory for Fluorescence Dynamics,LFD)提供的便利。原创 2015-07-20 09:20:06 · 11802 阅读 · 0 评论 -
Gensim官方教程翻译(六)——分布式计算(Distributed Computing)
为何要分布式计算?需要构建一个百万文档级语料库的语义代表,却耗时太~~长?手上有几个可用的闲置计算机?分布式计算力争通过将给定的任务切分为几个小型任务,并将这些任务指派给几台平行的计算机完成来实现加速计算。 本文主要简单介绍了Gensim的分布式计算的使用方法。翻译 2015-07-06 11:12:43 · 5040 阅读 · 0 评论 -
Gensim官方教程翻译(七)——分布式潜在语义分析案例(Distributed Latent Semantic Analysis)
本文主要记录了使用gensim进行分布式潜在语义分析计算的方法。翻译 2015-07-06 21:52:30 · 5084 阅读 · 2 评论 -
Gensim官方教程翻译(四)——相似度查询(Similarity Queries)
本文主要讲述了如何利用gensim将训练好并经过空间转换的空间向量模型进行索引,并应用于计算查询字符串与已索引文档的相似度。翻译 2015-07-03 23:20:41 · 25834 阅读 · 7 评论 -
Gensim官方教程翻译(一)——快速入门
为了方便自己学习,翻译了官方的教程,原文:http://radimrehurek.com/gensim/tutorial.html。本教程按照一系列的实例组织,用以突出gensim的各种特征。本教程的受众是熟悉Python,已经安装了gensim,而且阅读过介绍的读者。本教程包括为以下几个部分:语料库与向量空间从字符串到向量语料库流-一次一个文档语料库格式与NumPy和Sc翻译 2015-07-02 13:41:49 · 27625 阅读 · 2 评论 -
Gensim官方教程翻译(二)——语料库与向量空间(Corpora and Vector Spaces)
本文内容:如何利用gensim将文本信息转换为分析用的语料库,以及如何读取/存储语料库。翻译 2015-07-03 11:02:12 · 19896 阅读 · 11 评论 -
Gensim官方介绍翻译
为了方便自己学习,翻译一下。原文地址:http://radimrehurek.com/gensim/intro.html。Gensim是一个免费的Python库,它可以用来从文档中自动提取语义主题,并且尽可能地做到轻松(对人)高效(对电脑)。Gensim致力于处理原始的、非结构化的数字文本(普通文本)。Gensim中用到的算法,如潜在语义分析(Latent Semantic Analy翻译 2015-07-01 22:24:22 · 8529 阅读 · 5 评论 -
Python使用easy-install安装时报UnicodeDecodeError的解决方法
result_path = result_path.decode("gbk").encode("gbk") + p_path.decode("gbk").encode("gbk")原创 2014-11-02 23:52:35 · 2093 阅读 · 0 评论