Python
DataLiu
大数据技术成长记
展开
-
多个XML文件合并并转换为TXT文件
一、通过网络爬虫从网上撸到xml小文件,现将文件合并并转换为txt文件。#coding=utf-8import osfrom bs4 import BeautifulSoup#1、放xml文件的文件夹路径filePath = "G:\\DataCenter\\stoke_critic_data\\"#2获取文件夹下的所以文件目录files = os.listdir(path ...原创 2020-03-17 22:10:28 · 978 阅读 · 0 评论 -
Python小游戏之“读心术”
读心术:猜数字游戏 〉 一款经典的猜数字AI:用户先随机在 0-1000之间随意写一个数字,AI开 始猜,如果猜的数大了,用户就说大 了,反之,则说小了。算法:二分查找〉 从中间的数开始,如果猜中则结束〉 如结果大于或者小于中间的数,则在 剩下大于或小于中间的数的那一半中 查找〉 每一次比较都使搜索范围缩小一半import randomimport sysde...原创 2020-02-22 16:39:16 · 4385 阅读 · 0 评论 -
python爬取图片与爬取网络小说实例
一、爬取网络图片存入本地文件from bs4 import BeautifulSoupimport requestsimport sysimport reimport sslname = 0def get_content(url, headers): ssl._create_default_https_context = ssl._create_unverified_cont...原创 2020-02-21 13:48:29 · 329 阅读 · 1 评论 -
Python网络爬虫爬取豆瓣电影的数据
一、豆瓣电影的数据是动态加载,所以要用到json解析https://movie.douban.com/typeranktype_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=为例子用火狐浏览器打开完成第四步就获取到请求动态数据的json请求地址,在执行第三步时,你会发现你点击不同的url地址,消息头...原创 2020-02-21 13:43:24 · 5346 阅读 · 0 评论