数据挖掘
nudt_qxx
这个作者很懒,什么都没留下…
展开
-
python 操作xls文件
首先pip install xlrd和pip install xlwt# -*- coding: utf-8 -*-import xlrdimport xlwtfrom datetime import date,datetimedef read_excel(): # 打开文件 workbook01= xlrd.open_workbook("file.xls") table01原创 2017-05-22 23:38:18 · 1431 阅读 · 0 评论 -
pandas DataFrame数据转为list
首先使用np.array()函数把DataFrame转化为np.ndarray(),再利用tolist()函数把np.ndarray()转为list,示例代码如下:# -*- coding:utf-8-*-import numpy as npimport pandas as pddata_x = pd.read_csv("E:/Tianchi/result/features.csv",useco原创 2017-05-21 22:46:10 · 155726 阅读 · 21 评论 -
python 读取txt,json和hdf5文件
一.python读取txt文件 最简单的open函数:# -*- coding: utf-8 -*-with open("test.txt","r",encoding="gbk",errors='ignore') as f: print(f.read())这里用open函数读取了一个txt文件,”encoding”表明了读取格式是“gbk”,还可以忽略错误编码。 另外,使用with语原创 2017-05-24 15:51:50 · 13671 阅读 · 0 评论 -
win10 下安装facebook开源预测工具Prophet的方法
Facebook开源了大规模时序预测工具Prophet,官网:https://facebookincubator.github.io/prophet/ github地址:https://github.com/facebookincubator/prophet 正当逼着兴奋不已打算在win10的Python3.5环境下用pip install fbprophet命令安装的时候,错误出现了:INFO原创 2017-05-17 15:09:45 · 4266 阅读 · 4 评论 -
win10 python 3.5.2 安装lightgbm
去年(2016年)12月,微软开源了LightGBM,地址:https://github.com/Microsoft/LightGBM 。该项目刚开源就被受到热捧:三天之内GitHub上被star了1000+次,fork了200+次;知乎上有近千人关注“如何看待微软开源的LightGBM?”。接下来简单介绍下这个号称“性能超越其他boosting”的学习模型及其编译和安装方法,以及开启python的原创 2017-06-23 16:25:00 · 11273 阅读 · 2 评论 -
win10下导入theano报错
解决方案为: 先卸载:pip uninstall theano 然后安装mingw和libpython:conda install mingw libpython 接下来import theano就不会报错了!原创 2017-05-28 09:52:05 · 937 阅读 · 0 评论 -
win10下导入keras/tensorflow报错
我在win10 Python3.5.2安装keras,然后导入时报错如下:Python 3.5.2 |Continuum Analytics, Inc.| (default, Jul 5 2016, 11:41:13) [MSC v.1900 64 bit (AMD64)] on win32Type "help", "copyright", "credits" or "license" for原创 2017-05-28 22:06:19 · 24637 阅读 · 2 评论 -
python 快速把超大txt文件转存为csv
今天项目有个需求,就是把txt文件转为csv,txt之间是空格隔开,转为csv时需要把空格转换为逗号,网上找的一个版本,只需要三行代码,特别犀利:import numpy as npimport pandas as pddata_txt = np.loadtxt('datas_train.txt')data_txtDF = pd.DataFrame(data_txt)data_txtDF.to原创 2017-06-21 15:24:33 · 18111 阅读 · 4 评论 -
解决matplotlib库show()方法不显示图片
最近使用python里的matplotlib库绘图,想在代码结束时显示下图片看看,结果图片一闪而过,附上我原来代码:import matplotlib.pyplot as pltimport numpy as npimport pandas as pd......#type(forecast)=<class 'pandas.core.frame.DataFrame'>pic01=m.plot原创 2017-05-17 19:45:34 · 34881 阅读 · 4 评论 -
python处理时序模型之StatsModels
Pandas专注于数据读取、处理和探索。而StatsModels专注于数据的统计建模分析,使得Python有了一点R语言的味道。StatsModels支持和Pandas的交是Python数据挖掘中的一对利刃组合。 首先看下头文件#-*-coding:utf-8*-*-import pandas as pdimport numpy as npfrom scipy import statsi原创 2017-05-16 11:39:30 · 4240 阅读 · 0 评论 -
pandas read_csv和to_csv的基本使用
read_csv原始csv如下:id,test001C8DA7-9969-4C51-A957-89F4C6E4999F,000468119-70E6-4C33-9F30-64BC91134253,0005E0BA1-3B27-40F0-A231-5BAE6246599D,0007EFD04-DBE6-4B14-A1AA-8A500C1D1EBC,0008D289C-CE20-4F69...原创 2019-01-24 10:31:38 · 2334 阅读 · 0 评论