- 博客(4)
- 收藏
- 关注
原创 探索NoSQL数据库
1.NoSQL:NoSQL,泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS(社交网站)类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。...
2018-10-15 12:50:12 432
原创 开始爬虫之旅的第三天
1.爬虫利器-Beautiful Soup 4的语法(1)bs4语法是什么? BeautifulSoup,就是一个第三方的库,使用之前需要安装 pip install bs4##############################pip进行安装,默认是从国外安装,所以需要将pip源BeautifulSoup,就是一个第三方的库,使用之前需要安装配...
2018-07-18 19:35:41 141
原创 开启Python爬虫之旅的第二天
1.模拟请求方式:get请求:GET http://weibo.com/signup/signup.php?inviteCode=2388493434Host: weibo.comAccept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8post请求:POST /inv...
2018-07-18 19:35:01 238
原创 开启Python爬虫之旅的第一天
1.爬虫概念:卡卡写一段代码,代码的功能能从互联网中提取数据信息2.互联网:每一个互联网都有一个节点,节点就是一个Url(统一资源定位符),很多a链接组成 3.互联网爬虫:简单来说互联网爬虫就是写代码,模拟浏览器访问节点(Url),从而提取数据内容。通俗易懂4.能用哪些语言实现爬虫?(1)PHP(自称最优美的语言,谁用谁知道。不是难用,关键你这PHP天生就对多线程、多进程支持的就不是很友好,...
2018-07-09 17:41:18 219
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人