- 博客(32)
- 资源 (9)
- 收藏
- 关注
原创 基于python的数据分析库Pandas
Pandas中的数据结构Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。Time- Series:以时间为索引的Series。DataFrame:二维的表格型数据结构。很多功能与R中的dat
2017-02-19 10:23:29 1333
原创 networkx学习笔记2:四种网络模型
四种网络模型:规则图,ER随机图,WS小世界网络,BA无标度网络""" 规则图: random_graphs.random_regular_graph(d, n)方法可以生成一个含有n个节点,每个节点有d个邻居节点的规则图"""RG = nx.random_graphs.random_regular_graph(3, 20) # 随机生成20个节点,每个节点的度都是3,构成一
2017-02-27 14:26:15 8051 1
原创 networkx学习笔记1:网络图创建
创建一个无标度网络G,随机生成节点:# -*-coding:utf-8-*-import networkx as nximport matplotlib.pyplot as pltG = nx.random_graphs.barabasi_albert_graph(100, 1) # 生成一个BA无标度网络Gnx.draw(G) # 绘制网络Gplt.savefig("ba.png")
2017-02-27 14:17:37 3937
原创 Pandas:Data_Structure_Series
# -*-coding:utf-8-*-import numpy as npimport pandas as pd""" Series"""""" Series 它是一个一维的标记阵列,可以容纳任何的数据类型(整型、字符串、浮点数、python对象), 轴标签统称为索引,轴就是纵向的。 最基本的创建Series序列:s = pd.Series(data,
2017-02-24 10:14:23 866
原创 Pandas 数据处理,数据清洗
# -*-coding:utf-8-*-from pandas import DataFrameimport pandas as pdimport numpy as np""" 获取行列数据"""df = DataFrame(np.random.rand(4, 5), columns=['A', 'B', 'C', 'D', 'E'])print dfprintdf['col_s
2017-02-23 22:12:30 4301
原创 【scikit-learn】04:sklearn库下进行文本数据分析
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.21# ----------------------# -----------------------# Working With Text Data 文本数据处理# http://scikit-learn.o
2017-02-21 15:15:48 4462
转载 程序员编程技术迅速提高终极攻略
你是否觉得自己从学校毕业的时候只做过小玩具一样的程序?走入职场后哪怕没有什么经验也可以把以下这些课外练习走一遍(朋友的抱怨:学校课程总是从理论出发,作业项目都看不出有什么实际作用,不如从工作中的需求出发)建议:不要乱买书,不要乱追新技术新名词,基础的东西经过很长时间积累而且还会在未来至少10年通用。回顾一下历史,看看历史上时间线上技术的发展,你才能明白明天会是什么样。一定要动手,例子不管多么简单,建
2017-02-21 11:06:19 579
转载 程序员这样优化简历,一投制胜
特别说明: - 本文写于2015年11月,当时我在找工作,据此优化简历,每投必中。当时我还写了求职相关的其它文章,发布在我的微信公众号“程序视界”上,比如大龄程序员的未来在何方、35岁程序员的独家面试经历等。 - 文章特长,特考验耐性,特冲击三观,特消耗时间和精力,特容易造成心理压力,请先深呼吸三次再往下看。 - 求职季到了,我后续会在简书和公众号“程序视界”发布一系列求职相关
2017-02-21 11:02:03 627
原创 【scikit-learn】03:将sklearn库用于非监督性学习 聚类
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.16# ----------------------# -----------------------# Unsupervised learning: seeking representations of the data
2017-02-17 22:00:52 7717
原创 【scikit-learn】02:使用sklearn库进行统计学习
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.17# ----------------------# -----------------------# A tutorial on statistical-learning for scientific data p
2017-02-17 19:43:20 3812
原创 【Pandas-Cookbook】05:DataFrame框架案例
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# ---------------------# Chapter 5: Combining dataframes and scraping Canadian w
2017-02-17 16:14:01 784
原创 【Pandas-Cookbook】08:时间戳处理
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17# ---------------------# Chapter 8 - How to deal with timestamps.ipynb# ---------------------import pandas as pd''' 8.1 Parsing Unix timestamps'
2017-02-17 15:56:22 3063 1
原创 【Pandas-Cookbook】09:加载SQL数据库数据
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17# ---------------------# Chapter 9 - Loading data from SQL databases.ipynb# ---------------------import sqlite3import pandas as pd''' pandas ca
2017-02-17 15:55:19 694
原创 【Pandas-Cookbook】07:数据清洗
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# ---------------------# Chapter 7 - Cleaning up messy data.ipynb 清理垃圾数据# ----
2017-02-17 15:53:17 776
原创 【Pandas-Cookbook】06:字符串操作
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# ---------------------# Chapter 6 - String Operations- Which month was the snowie
2017-02-17 10:25:00 849
原创 【scikit-learn】01:使用案例对sklearn库进行简单介绍
sklearn学习笔记:Quick Start 源地址:http://scikit-learn.org/stable/tutorial/basic/tutorial.html# -*-coding:utf-8-*-''' Author:kevinelstri Datetime:2017.2.16'''# -----------------------# An introdu
2017-02-16 18:59:47 10649 1
原创 【Pandas-Cookbook】04:分组、聚集
# -*-coding:utf-8-*-# ---------------------# Chapter 4: Find out on which weekday people bike the most with groupby and aggregate# ---------------------import pandas as pdimport matplotlib.pyplot as
2017-02-16 15:51:14 841
原创 【Pandas-Cookbook】03:噪音数据处理
# -*-coding:utf-8-*-# ---------------------# Chapter 3 - Which borough has the most noise complaints (or, more selecting data).ipynb# ---------------------import pandas as pdimport matplotlib.pyplot
2017-02-16 15:43:33 1593
原创 【Pandas-Cookbook】02:数据选择
# -*-coding:utf-8-*-# ---------------------# Chapter 2 - Selecting data & finding the most common complaint type.ipynb# ---------------------import pandas as pdimport matplotlib.pyplot as plt# pd.se
2017-02-16 15:40:08 882
原创 【Pandas-Cookbook】01:读取CSV数据
# -*-coding:utf-8-*-# ---------------------# Chapter 1 - Reading from a CSV.ipynb# ---------------------import pandas as pdimport matplotlib.pyplot as plt# pd.set_option('display.mpl_style', 'defaul
2017-02-16 15:36:46 1396 2
原创 python pandas.read_csv参数详解
filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or any object with a read() method (such as a file handle or StringIO) 可以是URL,可用URL类型包括:http, ftp, s3和文件。对于多文件正在准备中 本地文件读取
2017-02-16 13:18:26 5090
原创 Ipynb文件的打开
安装 jupytersudo pip install jupyter运行jupyterjupyter notebook浏览器中网页显示: 进入文件夹,直接点击文件: 文件打开如下:
2017-02-16 13:11:38 2572
原创 python 数据结构
# -*-coding:utf-8-*-# -----------------# Data Structures# -----------------import numpy as np''' Lists'''''' list.append(x):添加元素x list.extend(L):添加list列表L list.insert(i,x):在i位置插入元素x
2017-02-16 10:08:05 553
原创 python-Pandas基础
# -*-coding:utf-8-*-# -------------------# pandas 两种数据结构:Series和DataFrame# -------------------import pandas as pdfrom pandas import Series, DataFrameimport numpy as np'''pandas 功能: 数据丢失 插入
2017-02-15 20:00:12 597
原创 python-NumPy基础
# -*-coding:utf-8-*-# ----------------# Numpy:科学计算,主要是矩阵运算# ----------------# THE BASICSimport numpy as np''' Numpy的数组称为ndarry,也可以使用array来表示函数说明: ndarray.ndim:矩阵的维数 ndarray.shape:矩阵的行
2017-02-15 19:58:49 611
原创 python高级特性
# -*-coding:utf-8-*-# -----------------# 高级特性# -----------------# 构造一个列表L = []n = 1while n < 99: L.append(n) n = n + 2print L# ----------# 切片# ----------L = ['mich', 'sara', 'tracy',
2017-02-15 19:57:19 307
原创 python函数
# -*-coding:utf-8-*-# -----------------# 函数# -----------------print abs(-100) # abs函数:取绝对值print cmp(1, 2) # cmp函数,比较大小,如果x<y,返回-1,如果x=y,返回0,如果x>y,返回1# ---------------# 数据类型转换:# 数据的不同类型之间的转换
2017-02-15 19:56:37 295
原创 python基础
# -*-coding:utf-8-*-# ---------# python基础# ---------# ---------# 数据类型# 整数:# 浮点数:可以使用科学记数法表示,1.23,3.14,-9.01# 字符串:# 布尔值:and or not运算,True,False# 空值:None# 变量:# 常量:# ------
2017-02-15 19:55:46 394
原创 python:pandas合并csv文件(图书数据集成)
两张表:ReaderInformation.csv,ReaderRentRecode.csvReaderInformation.csv: ReaderRentRecode.csv: pandas读取csv文件,并进行csv文件合并处理:# -*- coding:utf-8 -*-import csv as csvimport numpy as np# -------------# csv读取
2017-02-13 15:05:58 17169
原创 python编码问题
这里是一个图书馆读者借阅信息: 在对数据进行分析的过程中遇到了中文编码的问题,折腾了一上午也没有解决,最后我把源文件的文件格式改成utf-8格式,才正常显示。# -*- coding:utf-8 -*-# -------------# pandas读取表格数据# -------------import pandas as pddf = pd.read_csv('ReaderRentRecod
2017-02-13 14:09:45 592 1
原创 python文件
交互操作:input、raw_input、print打开文件:open(name, mode, suffer)读取文件:read()写入文件:write()管式输出:|读写行:file.readline(),file.readlines(),writelines()关闭文件:close()# -*- coding:utf-8 -*-########################## open(n
2017-02-10 17:19:06 1831
原创 python函数
# -*-coding:utf-8-*-import cmathimport math################################################## x = pi# abs(x) 返回数字的绝对值# cmath.sqrt(x) # 返回平方根,也适用于负数# float(x) # 转换成浮点数# input() # 用于用户输入# int(
2017-02-10 16:12:33 2376 1
ourbestModel_highscore3500
2019-04-14
停用词表stopwords
2017-08-15
文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)
2017-04-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人