python
文章平均质量分 67
yisuoyanyv
这个作者很懒,什么都没留下…
展开
-
绘图和可视化 《利用Python进行数据分析》第8章 读书笔记
绘图和可视化回归 第八章代码下载链接import matplotlib.pyplot as pltimport numpy as npfrom numpy.random import randnplt.plot(np.arange(10))plt.show()Figure和Subplotfig=plt.figure()ax1=fig.add_subplot(2,2,1)ax2=fig.a原创 2017-05-15 17:05:12 · 3924 阅读 · 7 评论 -
NLP自然语言处理 之 jieba中文处理
教程参考来源视频:https://www.bilibili.com/video/av21452290/?p=1jieba中文处理与拉丁语系不同,亚洲语言不是以空格分隔词的。因此需要专门的工具将完整的文本分解成粒度更细的词。jieba就是一个十分好用的中文工具。它以分词起家,但功能比分词强大很多。1.基本分词函数与用法jieba.cut及jieba.cut_for_search 返回的结构...原创 2019-08-15 00:34:28 · 1441 阅读 · 0 评论 -
机器学习笔记-房价预测实例
机器学习笔记摘自kaggle初学者教程 所用数据集为一个房价预测的数据集import pandas as pdmain_file_path = 'dataset/kaggle_house_prices/train.csv'data = pd.read_csv(main_file_path)#删除数据集中的缺失值# data=data.dropna(axis=0)#显示数据...原创 2018-05-08 11:49:09 · 3607 阅读 · 0 评论 -
机器学习--处理缺失值
处理缺失值在python语言中,缺失值一般被称为nan,是”not a number”的缩写。 下面的代码可以计算出数据总共有多少个缺失值,这里数据是存储在pandas中的DateFrame中:print(data.isnull().sum())处理缺失值有一下几种方式:1.删除包含缺失值的数据列data_without_missing_values=origin...原创 2018-05-08 21:57:30 · 2163 阅读 · 1 评论 -
Mac 系统下 解决python matplot画图中文乱码问题和plot.show()无响应问题
Mac 系统下 解决python matplot画图中文乱码问题和plot.show()无响应问题参考:https://www.zhihu.com/question/25404709网络上大多是关于Windows的教程。mac上可以照着配置如下: 1.百度搜索字体simhei,放到类似于 /Users/xxxxx/anaconda/lib/python2.7/site-packages原创 2018-01-11 11:30:35 · 3174 阅读 · 2 评论 -
Python 正则表达式 示例
Python正则表达式代码示例使用match()方法匹配字符串,从字符串起始部分对模式进行匹配。成功返回一个匹配对象,否则返回None,匹配对象的group()方法能够用户显示那个成功的匹配import rem=re.match('foo','foo')#模式匹配字符串if m is not None:#如果匹配成功,就输出匹配内容 m.group()m#确认返回的匹配对象<_sre.S原创 2017-08-18 21:33:11 · 1623 阅读 · 0 评论 -
pandas入门笔记
pandas备忘录,速查指南import pandas as pdimport numpy as np创建测试对象df=pd.DataFrame(np.random.rand(8,5))#创建一个DataFramedfs=pd.Series([1,2,3,4,5,4,3,3])#创建一个Seriess 0 1 1 2 2 3 3 4原创 2017-07-09 19:22:41 · 414 阅读 · 0 评论 -
sklearn 特征提取
Feature extraction 特征提取参考自官方文档http://scikit-learn.org/stable/modules/feature_extraction.html注意:特征提取与特征选择不同:前者包括将任意数据(如文本或图像)转换为可用于机器学习的数值特征。后者是应用这些特征的机器学习技术。从字典加载特征DictVectorizer类可将表示为标准Python字典(dict)对原创 2017-07-01 20:22:47 · 2378 阅读 · 0 评论 -
sklearn官方文档学习笔记 管道和特征联合(Pipeline and FeatureUnion):组合估计器
sklearn官方文档学习笔记 管道和特征联合:组合估计器Pipeline and FeatureUnion: combining estimators管道:链接估计器from sklearn.pipeline import Pipelinefrom sklearn.svm import SVCfrom sklearn.decomposition import PCAestimators翻译 2017-07-01 16:18:32 · 2765 阅读 · 0 评论 -
scikit-learn数据预处理
Python下的机器学习工具scikit-learn(-数据预处理)参考自http://lib.csdn.net/article/machinelearning/1119和http://scikit-learn.org/stable/modules/preprocessing.html(1)数据标准化(Standardization or Mean Removal and Variance Scal原创 2017-07-01 11:52:24 · 558 阅读 · 0 评论 -
数据规整化:清理、转换、合并、重塑 《用Python进行数据分析》读书笔记第7章
数据规整化:清理、转换、合并、重塑 第7章合并数据集pandas.merge可以根据一个或多个键将不同DataFrame中的行连接起来。pandas.concat可以沿着一条轴将多个对象堆叠到一起 实例方法combine_first可以将重复数据编接在一起,类似于数据库中的全外连接数据库风格的DataFrame合并数据集的合并(merge)或连接(join)运算是通过一个或多个键将行链接起来的。这原创 2017-05-10 10:35:44 · 1915 阅读 · 3 评论 -
Python正则表达式
Python正则表达式正则表达式验证网站,强烈推荐!!!https://regexr.com/练习题网站 https://alf.nu/RegexGolf,闯关练习,十分有意思。简单例子# encoding:UTF-8import re#将正则表达式编译成Pattern对象pattern=re.compile(r'hello.*\!')#使用python匹配文本,获得匹配结果,...原创 2019-08-16 21:52:16 · 143 阅读 · 0 评论