自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 完成爬虫

财新网、东方财富、和讯网相关企业新闻搜索采集 '''财新网采集搜索新闻,该网站许多内容需要付费,所以需要登录'''from urllib import request, parsefrom bs4 import BeautifulSoupfrom random import choi...

2017-11-09 09:36:00 302

转载 中文分词

#分词#读分词词典,词典中最长词长度def get_word_dict(dictpath): max_index = 1 with open('dict.txt','r',encoding='utf-8') as f: dictwords =f.readli...

2017-11-08 21:06:00 83

转载 URL链接中文编码

在编写爬虫时,需要利用拼接URL获得相应页面。如:在和讯网,希望获得搜索关键词“乐视网”的页面,发现链接如下: http://news.search.hexun.com/news?key=%C0%D6%CA%D3%CD%F8&s=1&page=1&f=0 “乐视网”...

2017-11-06 16:22:00 251

转载 numpy合并array

array1 = [1,2,3,4]array2 = [5,6,7,8]#final = [1,2,3,4,5,6,7,8]final = np.append(np.array(array1),np.array(array2))print(final) #获得[ 0. 0. 0....

2017-09-21 14:38:00 83

转载 list,array,series,dataframe

import numpy as npimport pandas as pdfrom pandas import Series,DataFrame##list转为arraylist1 = [1,2,3,4,5,6,7,8]print(list1,type(list1))np_arr...

2017-09-21 14:30:00 109

转载 Tensorboard报错

进行tensorboard 报错:module 'pandas' has no attribute 'computation' 进行: cuda update dask 生成图: 生成的文件命令:writer = tf.summary.FileWriter('graph',...

2017-09-07 18:04:00 96

转载 pip;conda 换源

PIP 临时使用: pip 后加参数-i https://pypi.tuna.tsinghua.edu.cn/simple 例:pip install -ihttps://pypi.tuna.tsinghua.edu.cn/simplepandas 永久使用: Linu...

2017-09-06 08:55:00 86

转载 Mysql5.7免安装版 配置

免安装版配置主要包括以下几步: 1.第一步解压文件,随便放到一个文件夹下面,如:D:\mysql-5.7.15-winx64 2.配置环境变量,在系统变量path后面追加 D:\mysql-5.7.15-winx64\bin 3.复制my-default.ini,命名为my.ini,打开m...

2017-09-05 10:04:00 68

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除