python数据分析
莫杨94
知识图谱,自然语言处理qq:2016299773
展开
-
numpy随机采样
使用 numpy.random.choice随机采样: numpy.random.choice(a, size=None, replace=True, p=None) 1、按照指定概率采样: #按照分布采样 def randomExample(): d1=np.array([0.2,0.3,0.5]) index=[] for num in range(100000): r = random.uniform(0, 1) for i in ra原创 2020-11-25 21:50:47 · 1502 阅读 · 0 评论 -
numpy输入输出
numpy二进制文件操作 save()、savez()、load()是numpy专用的二进制类型数据的保存和读取,分别对应处理nidm、dtype、shape save()输出的文件很难兼容 npy格式:以二进制的方式存储的文件,在二进制文件第一行以文本形式保存了数据的元信息,可以用二进制工具查看zip npz格式:压缩包的方式存储文件 语法:numpy.save(file,arr,allow_pickle=True,fix_imports = True) numpy.load(file,mmap_mode原创 2020-11-23 21:17:09 · 101 阅读 · 0 评论 -
爬虫学习(四)正则表达式爬取猫眼电影Top100
爬虫学习(四)正则表达式爬取猫眼电影Top100 使用知识:requests库,正则表达式 获取网易源码(HTML) def get_one_page(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ...原创 2020-04-17 17:37:30 · 418 阅读 · 0 评论 -
爬虫学习(三)爬虫基本流程
爬虫的基本流程 Request和Response作用: Response包含的内容: 保存数据:原创 2020-04-15 15:11:46 · 150 阅读 · 0 评论 -
pandas读取和写入csv文件
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipin转载 2020-04-07 16:54:30 · 2580 阅读 · 0 评论