python
鸡汤本汤
这个作者很懒,什么都没留下…
展开
-
以题促学02_matplotlib画图_墨尔本1981年至1990年的每月温度情况折线图
墨尔本1981年至1990年的每月温度情况,利用数据,画出如下图:代码:from matplotlib import pyplot as pltimport pandas as pdimport numpy as npplt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号data=pd.read_csv('../data/l原创 2022-01-18 23:43:02 · 763 阅读 · 0 评论 -
以题促学01_matplotlib画图_分别用subplots和subplot,add_subplot3种方法画组合图
题目要求:要求1.一个画布上,有四个子图,画布大小设置为662.左上子图,折线图,y=xx3.右上子图,散点图,x轴范围(0-10)之间整数,y轴为(0-1)之间正太分布数据4.左下子图,饼图,数值见图下,分别标记各个块为 ABCD,同时,突出表示B代表的块5.右下子图,条形图,ABCDE五个类别的数值分别是15,20,25,30,35用三种不同的方法做出下图方法一 plt.subplots()from matplotlib import pyplot as pltimport原创 2022-01-11 23:24:20 · 906 阅读 · 0 评论 -
TypeError: not supported between instances of ‘treeNode‘ and ‘treeNode‘ PF-growth
参考博客原创 2021-09-06 20:15:11 · 278 阅读 · 0 评论 -
计算两经纬度之间距离
def haversine(latlon1, latlon2): """ 计算两经纬度之间的距离 """ if (latlon1 - latlon2).any(): lat1, lon1 = latlon1 lat2, lon2 = latlon2 dlon = lon2 - lon1 dlat = lat2 - lat1 lon1, lat1, lon2, lat2 = map(radians,原创 2021-09-01 17:23:31 · 666 阅读 · 0 评论 -
AttributeError: module ‘numpy‘ has no attribute ‘ndarray‘
费了好大功夫,卸载安装多次,最终1.20.0版本的是可以的pip uninstall numpypip install numpy==1.20.0原创 2021-08-31 16:09:20 · 8721 阅读 · 2 评论 -
ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 88 from C head
费了好大功夫,卸载安装多次,最终1.20.0版本的是可以的pip uninstall numpypip install numpy==1.20.0原创 2021-08-31 16:08:31 · 1237 阅读 · 2 评论 -
pandas读取大文件
文章目录两种方法1 使用参数chunksize2 使用参数iterator两种方法1 使用参数chunksizereader = pd.read_csv('./data/my_data.txt', sep='\t', chunksize=4) # chunksize=4其实就是4行4行地读取reader.get_chunk(4) # 查看四行reader.get_chunk(4) 多次运行会有不同的结果,因为是迭代的,第一次显示的是0~3行,第二次则显示的是4-7行,以此类推。2 使用原创 2021-07-28 17:14:04 · 1994 阅读 · 0 评论 -
word2vec 使用大语料库 边读边训练
使用gensim中word2vec训练词向量时,需要将语料处理成列表形式。1 一般训练过程:corpus=["我 是 中国人","北京 是 中国 首都","学生 向往 北京 大学"]sentence=[i.split() for i in corpus]from gensim.models.word2vec import Word2Vecimport multiprocessingworkers=multiprocessing.cpu_count() #获取cpu核数,使用最大的核数,并行d原创 2021-07-28 15:50:35 · 787 阅读 · 0 评论 -
Python yield理解
可以使用一个例子理解。设计一个函数输出0到n的平方,设计第一版函数:def sum_n(n): for i in range(n+1): print(i**2)运行函数,sum_n(3)得到以下结果这个函数可以打印出我们需要的结果,但是函数的可复用性比较差,因为函数的返回值是None,其他程序无法使用此函数产生的结果。如果要提高函数的复用性,则可以使用列表将结果保存,第二版函数如下:def sum_n(n): sum_list=[] for i in range(n+1): su原创 2021-07-28 14:38:28 · 242 阅读 · 1 评论 -
python 版本3.6.5+tensorflow==2.0.0安装
之前一个电脑上python版本是3.6.1配合tensorflow2.1.0安装成功。但是这一个是python3.6.5安装tensorflow2.1.0版本一直不成功。有的显示安装成功,但import tensorflow时会显示以下错误:看到博客上很多经验是说版本不匹配。后来换了tensorflow=2.0.0(在anaconda prompt下)直接输入如下命令:pip install tensorflow==2.0.0 --user -i http://pypi.douban.com/原创 2020-09-19 11:38:53 · 1330 阅读 · 0 评论 -
pd.get_dummies()默认str类型才会变成onehot
以泰坦尼克号死亡率预测数据为例,(1) pd.get_dummies()不指定列如果直接使用pd.get_dummies()而不指定列,则只有那些数据类型为object,也就是str类型的列会被变成onehot如果把Cabin的类型修改为int,则此特征不会被处理为onehot(2)指定需要被onehot的列当指定了columns时,只有指定的列被处理为onehot,不管这个列数据类型是什么,都可以进行处理。...原创 2020-07-22 16:45:45 · 441 阅读 · 0 评论 -
明明安装了lightgbm 使用时却报错:No module named lightgbm
我的是因为我使用的是anaconda,安装lightgbm时直接在cmd面板上pip install 镜像安装的。查看到一个博客(找不到了)说是anaconda的python和在的位置有点特别啥的,不能直接在cmd里安装。打开anaconda 的prompt,在里面安装就成功了。我试了,真的成功了...原创 2020-06-19 18:09:00 · 5102 阅读 · 2 评论 -
生成requirements.txt文件,用于记录所有依赖包及版本号
1.python项目中必须包含一个 requirements.txt 文件,用于记录所有依赖包及其精确的版本号。以便新环境部署。requirements.txt可以通过pip命令自动生成和安装。2.生成requirements.txt文件:pip freeze > requirements.txt3.安装requirements.txt依赖:pip install -r requirements.txt(想要速度快可以设置镜像安装)镜像安装:pip install -i http://p原创 2020-06-12 20:03:15 · 973 阅读 · 0 评论 -
Anaconda 安装gensim
镜像安装参考博客pip install gensim -i https://pypi.doubanio.com/simple原创 2020-02-14 10:17:29 · 518 阅读 · 0 评论 -
导入keras报错module 'tensorflow.python.keras.backend' has no attribute 'get_graph'
导入keras的时候出现了版本不兼容的情况。参考的如下博客:其中很有用的一个链接:介绍了tensorflow和keras的配套版本,在已经有安装好tensorflow的情况下,再安装合适的keras版本。我的tensorflow是1.9.0,配套的keras是2.2.0所以安装时:pip install keras==2.2.0就可以了。...原创 2019-12-24 20:30:31 · 545 阅读 · 0 评论 -
pandas contains查看包含特定数字、字母的行
train_data[train_data[‘certId’].astype(‘str’).str.contains(‘64’)]原创 2019-10-23 20:00:22 · 3497 阅读 · 0 评论 -
使用pandas查看字符串的前几个
x=train_data[train_data[‘certId’].astype(‘str’).str.startswith(‘710’)]原创 2019-10-23 19:58:04 · 5190 阅读 · 0 评论 -
爬虫爬取动态网页(selenium配合chrome浏览器安装与使用)
本来是做推荐系统的,,但第一步要得到数据,就又卡到了爬虫这里。爬取的网页是动态网页,需要用到selenium,所以这里记录一下在chrome浏览器使用selenium的过程。首先下载chrome插件:这里下载从里面挑一个比较新的下载。下载解压后,是一个exe文件,放在自己电脑的一个路径下面,这个路径就是python所在的路径,我的python是anaconda下的,所以放在了如图所示位置...原创 2019-09-06 20:44:23 · 670 阅读 · 0 评论 -
xLearn库的安装详细步骤(Windows系统)
xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。在近年来,大规模稀疏数据机器学习算法被广泛应用在各种领域,例如广告点击率预测、推荐系统等。如果你是 liblinear、libfm、libffm 的用户,那么现在 xLearn 将会是你更好的选择,因为 xLearn 几乎囊括了这些系统的全部功能,并且具有更好的性...原创 2019-08-30 22:13:59 · 2915 阅读 · 2 评论 -
Win10系统anaconda(python3.6)安装tensorflow(简单实用)
在一些教程中看到anaconda中安装tensorflow的例子,大多是在envs中创建一个新的python版本,然后在此基础上安装tensorflow,因为在原环境上安装一般都会出现各种各样的问题。但是这种安装方法会出现一个问题,那就是在包含tensorflow的新环境里,anaconda本身集成的一些工具包比如scipy之类的都没有了,想要使用必须重新安装,这真的是一个很大的bug。后来发现了...原创 2019-08-30 13:29:11 · 340 阅读 · 0 评论 -
安装mlxtend库(stacking利器)出现问题及解决方案
介绍一款功能强大的stacking利器,mlxtend库,它可以很快地完成对sklearn模型的stacking。直接pip install mlxtend安装失败。安装过程出现的错误提示为:在一个python非官方外部支持库网站找到适合的msgpack。我的python版本为:适合的msgpack版本为:将其下载下来。我放的路径为 C:/5 软件安装接下来定位到文件所在位置,p...原创 2019-08-29 13:58:13 · 6994 阅读 · 1 评论