python学习
Kang_TJU
Talk is cheap!
展开
-
python爬虫-常用的User-Agent列表
常用的User-Agent列表随机生成User-Agent的时候使用。USER_AGENTS = [ "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Mozilla/4.0 (compatible; MSIE原创 2016-09-17 15:31:07 · 17717 阅读 · 0 评论 -
python可视化-matplotlib学习
本文记录了我对python画图的学习,循序渐进的,刚开始只求画出来。后面对画图类有了一点研究,代码逻辑更加清晰。散点图参考了[知乎-Matplotlib 如何画散点图的图例],[官方文档] 下面直接上代码:#my_drawing.py#-*- coding:utf-8import tracebackimport randomfrom matplotlib import pyplot as原创 2017-01-04 01:31:33 · 7916 阅读 · 0 评论 -
解决'ascii' codec can't encode character
问题下午写实验代码时,遇见一个错误。 Traceback (most recent call last): File “/home/kang/坚果云_windows/final_paper/code/genetic_enhancement/workspace/src/network_analysis/preprocess.py”, line 54, in get_feature原创 2017-05-01 14:53:06 · 19586 阅读 · 1 评论 -
python机器学习-聚类KMeans
基本原理代码实现先给出完整代码,再分别说明#-*- coding:utf-8import tracebackfrom sklearn.cluster import KMeansimport numpy as npimport matplotlib.pyplot as plt'''函数名:draw_original功能:根据样本和真相画图@X:样本@Y:真相'''def draw_o原创 2017-03-25 01:48:34 · 933 阅读 · 0 评论 -
python网络分析-network第一版的封装
本文主要是对我在写实验的时候所用到的networkx进行的一个初步的封装。其实不是很标准,现在再写第二版。先把之前的代码贴上来。主要参考的文档就是networkx的官方文档。 [networkx-reference]我需要说明一点,下面的代码针对的是无向图。代码下面这一部分代码是对networkx的初步封装。GraphOperation.py#-*- coding:utf-8 -*-impo原创 2017-01-17 23:45:07 · 2597 阅读 · 0 评论 -
python语言-目录操作
本文总结下这两天写代码遇见的python目录操作。直接上代码。常见目录操作获取目标目录下的目录文件和非目录文件#-* coding: utf-8 -*-import tracebackimport os# 目录操作类class DirOperation: """ 功能:返回目标目录下的目录文件和非目录文件 @root_path: 目标目录 @dir_list:原创 2017-01-09 22:53:25 · 299 阅读 · 0 评论 -
python网络分析-数据集汇总
本文给出平常实验当中经常使用的网络数据集。都是开放数据集。下面直接上链接了!数据集[Stanford Large Network Dataset Collection]非常经典的数据集,承包了研二上数据实验报告。原创 2017-01-09 21:54:33 · 1009 阅读 · 0 评论 -
pythonNLP-Gensim安装
先贴个链接,这个是官方的安装教程:Gensim安装教程下面给出我的安装步骤。安装gensim的一些依赖项命令如下: sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose安装gensim s原创 2016-12-13 00:28:29 · 1000 阅读 · 0 评论 -
pythonNLP-文本相似度计算-Demo
参照博客[我爱自然语言处理]里面的如何计算两个文本的相似度系列,把代码自己实现了一遍,对整个流程有了了解。纯属个人记录,新手想学习可直接去上面的博客学习,讲的非常好。代码#-*- coding:utf-8import gensimfrom gensim import corpora, models, similaritiesimport tracebackdocuments = [ "Shi原创 2016-12-20 15:53:21 · 6921 阅读 · 0 评论 -
pythonNLP-文本相似度计算实验汇总
本文总结我写实验时文本相似度计算的代码。任务是:给定语料库,计算任意两篇语聊的相似度。输入是语料库,输出是整个语料库的相似度矩阵。基于LDA模型的文本相似度计算主要的过程如下:文本预处理过程训练LDA模型相似度计算结果保存下面分别去说。文本预处理过程(pre_process.py)#-*- coding:utf-8'''preprocess.py这个文件的作用是做文档预处理,讲每篇文原创 2016-12-20 23:19:06 · 10260 阅读 · 5 评论 -
python语言-It's better to ask forgiveness than permission
python编程中,对于这句话的理解。本质是两种不同的变成风格。当然,我知识看到了这个问题,查了查相关的解释。我本省对这个问题并没有很好的认识。所以,下文内容主要来自于stackoverflow的一段解释的搬运。我先附上[原帖的链接]问题描述Ask forgiveness, not permission” opposes two programming styles!“Ask for permis原创 2016-12-03 15:00:20 · 781 阅读 · 0 评论 -
python可视化-matplotlib学习2
本目承接该系列上一目,总结更多的我用到的的画图技巧。柱状图(横向)import matplotlib.pyplot as pltfrom matplotlib import cmimport numpy as nplabel = ['a', 'b', 'c', 'd', 'e', 'f']x = sorted([1234, 221, 765, 124, 2312, 890])idx = np.原创 2017-11-16 13:09:54 · 527 阅读 · 0 评论