![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
jran_ml
这个作者很懒,什么都没留下…
展开
-
numpy和pandas中数组的合并、拉直和重塑
numpy和pandas中数组的合并和拆分合并numpy中numpy中可以通过concatenate,指定参数axis=0 或者 axis=1,在纵轴和横轴上合并两个数组。import numpy as npimport pandas as pdarr1=np.ones((3,5))arr1Out[5]: array([[ 1., 1., 1., 1., 1.], [原创 2017-06-15 20:43:52 · 15226 阅读 · 0 评论 -
Python 在 MySQL 中读取、写入数据
Python 在 MySQL 中读取、写入数据写入数据:import pandas as pd from sqlalchemy import create_engine import pymysql#准备一个示例数据df = ts.get_hist_data('000875')#读取数据,格式为DataFrame #创建一个engineengine = create_engine(原创 2017-07-07 16:09:14 · 9691 阅读 · 0 评论 -
MongoDB服务配置系列问题
MongoDB服务配置系列问题通过配置文件配置服务:dbpath=F:\Program\DATA\Mongo\db #数据存储路径logpath=F:\Program\DATA\Mongo\logs\mongo.log #日志存储路劲logappend=true #日志写入方式:追加port=27017 #端口#auth=true #是否认证bind_ip=0.0.0.0 service原创 2017-07-04 20:05:08 · 524 阅读 · 0 评论 -
pandas修改DataFrame的列名
方法一:通过columns属性good_frame.columns=['Na','F','M','N'] #暴力修改方法二:通过rename方法good_frame.rename(columns={' ': 'Na'},inplace=True)#传入字典,只修改需要修改的地方。inplace=True,原数据被修改;inplace=False 原数据不原创 2017-06-18 13:52:09 · 3814 阅读 · 0 评论 -
用itchat爬取朋友圈好友信息
用itchat爬取微信好友基本信息Python有一个好玩的软件包itchat,提供了一个微信api接口,借此可以爬取朋友圈的一些基本信息,下面我们一起来玩玩吧。import itchatimport numpy as npimport pandas as pdfrom collections import defaultdictimport reimport jiebaimport os原创 2017-07-03 00:25:17 · 28976 阅读 · 5 评论 -
pandas 中 stack 和 unstack的用法
import numpy as npimport pandas as pddata=pd.DataFrame(np.arange(6).reshape((3,2)),index=pd.Index(['a','b','c'],name='state'),columns=pd.Index(['I','II'],name='number'))dataOut[627]: number I IIsta原创 2017-06-19 09:11:03 · 16631 阅读 · 0 评论 -
dataframe中更改列属性的方法
在读取文件时将整数变量读成了字符串, 或者需要转换列属性时,通过方法astypePython中举例:dataframe.numbers=dataframe.numbers.astype(float)province.id=province.id.astype(str)R中举例:data<-read.csv('data.csv',col.names = c原创 2017-06-18 22:25:02 · 9948 阅读 · 0 评论 -
关于读取文件遇到UnicodeDecodeError
更改文件编码或更改译码方式问题:pandas在读取含有中文字符的csv文件时报错,因为python默认的编码方式是‘ utf-8’,而这个文件的编码是‘gbk’。UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte解决办法:data=p原创 2017-06-17 19:50:59 · 1746 阅读 · 0 评论 -
机器学习中的变量选择——进阶篇
机器学习中的变量选择变量选择回顾单变量筛选通过模型选择变量变量选择进阶只用模型就能选好变量么数据处理模型介绍实验结果认识伪相关两步法估计变量选择回顾符号说明:p:p:p: 特征数量n:n:n: 样本数量变量选择在机器学习中扮演着重要的角色,无论是对于构建一个可解释的模型,还是提升模型的预测能力。单变量筛选在高维情况下,有时候我们需要预先筛选部分变量,然后再训练模型。筛选过程需要做到...原创 2019-03-03 13:42:17 · 19996 阅读 · 2 评论