- 博客(7)
- 收藏
- 关注
原创 运用numpy进行数组、向量、矩阵运算
众所周知,python中3个用于数学计算的库分别是:numpy scipy pandas。之前已经介绍过了pandas的用法,这篇笔记主要介绍numpy用法。因为numpy是直接封装c语言,所以速度上达到了类似于在c++里面掉包的程度,当然,本身比python自带的数据结构快了n倍。尤其是在大数据处理的时候,差距更为明显。import numpy as npimport pandas as pd
2017-10-04 13:16:39 5424
原创 数据规整化:清理、转换、合并、重塑
import pandas as pdimport numpy as npfrom pandas import DataFramefrom pandas import Series1.合并数据集pd.merge():各种参数的使用df1 = DataFrame({'key':['b','b','a','c','a','a','b'],\ 'data1'
2017-10-04 13:15:59 559
原创 数据加载存储和文件格式
1.读取文本格式数据import pandas as pdimport numpy as npimport sysimport pymysql# 图片:pandas解析函数df = pd.read_csv('ex1.csv')print(df) a b c d message0 1 2 3 4 hello1 5 6 7 8 world
2017-10-04 13:15:34 654
原创 pandas处理各种表格数据
一读取文本格式数据二逐块读取文本文件三将数据写出到文本格式四DataFrame和数据库 经常遇到Python读取excel和csv还有其他各种文件的内容。json还有web端的读取还是比较简单,但是excel和csv的读写是很麻烦。这里记录了pandas库提供的方法来实现文本内容和DataFrame的转化。一、读取文本格式数据首先来看一下针对不同格式的文件的读取函数:总结一下常见参数:(例
2017-10-04 13:13:08 6250
原创 matplotlib绘制常见概率图
import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport mathimport timefrom scipy import statsfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib import cmmpl.rcParams
2017-10-04 13:12:21 8034
原创 matplotlib实现数据可视化
一库的安装和环境的配置二设置中文环境三一窥全貌四精益求精五图的存储六子图致谢 一篇matplotlib库的学习博文。matplotlib对于数据可视化非常重要,它完全封装了MatLab的所有API,在python的环境下和Python的语法一起使用更是相得益彰。一、库的安装和环境的配置windows下:py -3 -m pip install matplotliblinux下:pyt
2017-10-04 13:11:43 1441
原创 干货:完全基于情感词典的文本情感分析
这是4个月前做的。受当时的知识水平的限制,还没有接触到机器学习和相关理论,记录一下作为以后备查。当然,如果你想看源码和资料,点击我。从结项到现在,博主一直在使用机器学习并结合相关论文进行情感极性分析(源码点我),效果远远好于本篇代码的效果。 但是,本篇的数据处理和特征选择还是很有意义的,特此记录。摘要 当今社会媒体的发展导致了金融舆论数据的爆炸式增长。因此,针对金融舆论数据的情
2017-10-04 13:06:25 59128 12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人