python
傅华涛Fu
热爱代码,热爱技术。
展开
-
DataFrame object has no attribute ‘as_matrix‘
as_matrix是在老版本的pandas中,新版本已经删除了该方法,并建议使用.values方法比如,我的代码中是这样的:temp = data.as_matrix(columns=cols)修改后:temp = data.values原创 2021-08-16 13:26:24 · 641 阅读 · 0 评论 -
import seaborn ImportError: DLL load failed: 找不到指定的模块。
我在anaconda中import seaborn时,出现了“ImportError: DLL load failed: 找不到指定的模块。”于是我先conda uninstall scipy然后conda install scipy再重新import seabornOk,问题解决!!!原创 2021-08-15 11:12:43 · 571 阅读 · 0 评论 -
ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 88 from C head
在python3.7版本中遇到上面这个问题,是numpy的版本问题。我原来的版本是1.20.0,后来升级到1.21.1,问题解决!!!原创 2021-08-15 10:57:58 · 706 阅读 · 0 评论 -
在Jupyter notebook中开启虚拟环境失败
记录一个小错误报错如下:[I 21:22:17.778 NotebookApp] JupyterLab extension loaded from E:\anaconda3\lib\site-packages\jupyterlab[I 21:22:17.778 NotebookApp] JupyterLab application directory is E:\anaconda3\share\jupyter\lab[I 21:22:17.780 NotebookApp] Serving not原创 2020-12-05 22:05:20 · 2810 阅读 · 1 评论 -
Python生成器
什么是生成器?生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是我什么时候调它,它什么时候开始计算一个新的值,并给你返回。原创 2020-09-07 09:50:02 · 67 阅读 · 0 评论 -
史上对pandas的rank()最直白最清晰的理解
官网的文档解释如下:官方解释:rank通过将平均排名分配到每个组来打破平级关系。我感觉比较晦涩难懂,感觉说的不是人话,为此我对此深究,结果如下:例子:代码:obj = pd.Series([7, -5, 7, 4, 2, 0, 4])print(obj.rank())运行结果:0 6.51 1.02 6.53 4.54 3.05 2.06 4.5dtype: float64分析:首先将这个列表中...原创 2020-07-12 10:13:11 · 682 阅读 · 0 评论 -
pandas读取CSV编码:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb5 in position 0: invalid start
今天在利用pandas读取csv文件时出现编码问题,出错如下:试了很多种方法,包括设置encoding='gbk', encoding='gb18030',都不行,最后改为unicode_escape,成功运行将:data = pd.read_csv(filePath, skiprows=3)改为:data = pd.read_csv(filePath, skiprows=3, encoding='unicode_escape')...原创 2020-07-09 11:25:41 · 8709 阅读 · 1 评论 -
基于物品余弦相似度的协同过滤算法
import randomimport mathclass DataSet(): def __init__(self, filePath): self.data = self.loadData_100K(filePath) # self.data = self.loadData_1M(filePath) def loadData_100K(self, filePath): print("加载数据...") data .原创 2020-07-12 10:15:40 · 1837 阅读 · 0 评论 -
二分K-均值聚类算法
原始数据:testSet2.txt3.275154 2.957587-3.344465 2.6035130.355083 -3.3765851.852435 3.547351-2.078973 2.552013-0.993756 -0.8844332.682252 4.007573-3.087776 2.878713-1.5659...原创 2019-04-07 22:15:45 · 2228 阅读 · 0 评论 -
K-均值聚类算法
原始数据:testSet.txt1.658985 4.285136-3.453687 3.4243214.838138 -1.151539-5.379713 -3.3621040.972564 2.924086-3.567919 1.5316110.450614 -3.302219-3.487105 -1.7244322.6687...原创 2019-04-07 22:16:15 · 415 阅读 · 0 评论 -
python——使用matplotlib将坐标可视化
测试数据:第一个数据为x,第二个数据为y,中间以“tab”分隔1.658985 4.285136-3.453687 3.4243214.838138 -1.151539-5.379713 -3.3621040.972564 2.924086-3.567919 1.5316110.450614 -3.302219-3.487105 ...原创 2019-03-24 13:38:06 · 2106 阅读 · 0 评论 -
python读取txt文件并统计每个字出现的频率
测试数据:test1.txt发的发生地方大师傅申达股份电话费归属感发生大范甘迪是大哥大法官更广泛的苟富贵给对方是个公司的符合规范还是发的规范的公司代码:# -*- coding: utf-8 -*-# 打开文件fr=open('test1.txt','r', encoding='UTF-8')# 读取文件所有行content=fr.readlines()conten...原创 2019-03-30 09:49:28 · 23322 阅读 · 2 评论 -
python读取excel文件上的点,并在坐标上显示坐标的位置和坐标的数据
测试数据:坐标数据:testExcelData.xlsx使用python读取excel文件需要安装xlrd库:xlrd下载后的压缩文件:xlrd-1.2.0.tar.gz解压后再进行安装即可,具体安装方法请另行百度。代码:import xlrdimport matplotlib.pyplot as pltimport numpy as np#打开文件da...原创 2019-03-30 09:42:48 · 8009 阅读 · 0 评论