- 博客(15)
- 收藏
- 关注
原创 推荐算法
协同过滤推荐数据:一些用户对电影的评分数据# A dictionary of movie critics and their ratings of a small# set of moviescritics={'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5.
2021-02-14 22:17:26 149
原创 Mac版Django安装配置(terminal)
1.安装virtualenv Pip3 install virtualenv Pip3 install virtualenvwrapper出现问题:command not found: virtualenv解决:先保证安装路径正确,设置默认版本的方式如下:alias python=路径后面的路径可以输入一下命令查询which python3.8设置好后然后检查python版本python -V是不是变成3.8了然后pip3 list查看之前装的virtualenvpip
2021-01-30 11:47:04 181
原创 各种bug
在安装jupyter_contrib_nbextension插件时,jupyter contrib nbextension install --user出现jupyter: command not found尝试一:jupyter contrib-nbextension install --user失败尝试二:1.打开jupyter_contrib_nbextensions目录cd /Users/apple/Library/Python/3.8/lib/python/site-packag
2021-01-22 13:49:37 86
原创 pandas基础
pandas可用于处理非数值型数据常用类:series——类似一维数组,可有各种类型 ,series算术运算会补空values 数据可以是列表,np,字典index 显示索引用来增强可读性dataframe——表格形式切片: df[index1:index2] df.iloc[:,col1:col3] 索引: df[col] df.loc[index] df.iloc[index,col]时间类型转换: pd.to_datetime(col)将某列设为行索引
2021-01-22 01:41:25 111 2
原创 三行代码爬取网页中table数据
import pandas as pdif __name__ == '__main__': url='https://hz.house.ifeng.com/news/2014_10_28-50087618_1.shtml' data =pd.read_html(url)[0] #[0]表示网页中第一个表格 data.to_csv('房产数据.csv', encoding='utf-8', index=False)
2020-12-23 22:56:42 222 1
原创 bs4解析具体使用
from bs4 import BeautifulSoup对象的实例化:1.本地html文件加载fp=open('./test.html','r',encoding='utf-8')soup=BeautifulSoup(fp,'lxml')2.互联网获取页面加载page_text=response.textsoup=BeautifulSoup(page_text,'lxml')提供用于数据解析方法和属性:1.soup.tagname:返回文档中第一次出现对应的标签2.soup.find(
2020-12-22 19:54:03 449
原创 跨包引用模块
import sysprint(sys.path)#模块查找路径出现一些列表,再把路径添加上即可如:dpath='/Users/apple/PycharmProjects/PythonStudy/web_spider/'sys.path.append(dpath)import testertester.test()
2020-12-19 03:16:46 247 1
原创 简单的图片批量爬取
一、获取html页面内容用requests获取,用beautifulsoup解析import osimport requestsfrom fake_useragent import UserAgentfrom bs4 import BeautifulSoupua = UserAgent(verify_ssl=False)# print(ua.random)user_agent=ua.random#url='https://www.yunbtv.com/vodtype/oumeiju.h
2020-12-18 20:44:27 223 1
原创 在桌面创建文件夹
#!/usr/bin/python# -*- coding: UTF-8 -*-import os, sys# 创建的目录path = "/Users/apple/Desktop/test"os.makedirs( path,mode=0o777, exist_ok=False);print('路径被创建')``
2020-12-18 18:12:23 215 1
原创 Excel for Mac 快捷键
这里写自定义目录标题创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入项目1项目2项目3 计划任务 完成任务创建一个表格一个简单的表格是这么创建的:项目Value电脑$1600手机$12...
2019-07-21 11:15:36 2406
原创 numpy基础(一)
1.numpy中关于mat()和array()区别可把mat理解成矩阵,array理解成数组mat(): * 或 .dot()表示矩阵相乘,.multiply()表示对应位置元素相乘array():.dot()表示矩阵相乘,*或.multiply()表示对应位置元素相乘2.浅拷贝与深拷贝numpy中浅拷贝:返回视图,a=b,修改a值会改变b,而深拷贝必须用copy(),返回副本,修改...
2019-06-28 20:37:15 94
原创 matplotlib可视化(一)
关于figure一个figure代表一个窗口,可以有多个figure,一个figure下可有多个图形import numpy as npimport matplotlib.pyplot as pltx=np.linspace(-3,3,50)y1=2*x+1y2=x**2plt.figure() //第一个figureplt.plot(x,y1)plt.figure(num=3...
2019-06-27 11:00:34 82
原创 matplotlib可视化(二)
1.关于坐标轴的设置import numpy as npimport matplotlib.pyplot as pltx=np.linspace(-3,3,50)y1=x**2y2=2*x+1plt.figure()plt.xlim((-1,2)) //设置范围plt.ylim((-2,3))plt.xlabel('i am x') //加标签plt.ylabel('i...
2019-06-27 10:33:43 92
原创 Spyder中如何让图表单独显示出来
一般图表只显示在ipython console中,且是静态,无法进行放大,移动等操作解决方案:tools——preferences——ipython console——graphics中backend改成automatic或者QT5一定要重启!!!否则不会显示...
2019-06-26 22:01:46 5458
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人