学习周记(一)

信安星火web学习周记(一)

时间:2018年12月13日至2018年12月20日


1.学习内容:
(1)使用phpstudy软件搭建php环境;
(2)了解php基本语法知识;
(3)安装python语言环境;
(4)阅读requests库文档;
(5)写出百度搜索结果爬虫脚本;
2.完成情况及感受心得:
(1)有关phpstudy软件:
事实上,通过在CSDN中搜索,不难找到phpstudy的安装教程及操作说明。网络上推荐的关于php的软件有很多,例如phpstorm,phpedit等。但结合自身情况,以及通过对phpstudy的进一步了解,phpstudy这个软件也确实存在着许多优点,就像版本的自由切换以及各主要版本的php环境的配置都是比较齐全的,而这对于入门的新手来说可以省去很大一部分的时间(由于我对php各版本的优缺点不是很熟悉,因此在版本的选择上,借鉴了其他一些博主的安装教程,选择了7.0.12这个版本。)

在这里插入图片描述

对于"My HomePage",作为个人的主页,我们可以对其进行优化,使其更好的为自己服务。具体的操作规程还是通过搜索一些CSDN大佬博主们的教程进行优化,我选择了从网上下载wordpress来对主页进行操作规范。
(2)有关PHP:
学习PHP语言的相关平台还是比较多的,我选择了在W3Cschool上进行学习,一方面,W3Cschool上的语言类教程还是很齐全的,另一方面,它会在一些知识点的后面进行相应的在线编程练习,这样就减少了许多麻烦。
就我个人而言,按照教程的先后顺序进行每日学习,学习内容主要分为下几个方面:
1.PHP基本语法:
PHP作为服务器端脚本语言,其代码在服务器上执行,结果以纯HTML形式返回给浏览器。
①PHP脚本以<?php开始,以?>结束;
②PHP文件通常包含HTML标签和PHP脚本代码;
③PHP代码依托于HTML的编辑结构,内嵌在(\n)(\n)(\n);(\n)之中;
2.PHP变量及类型:
①当在PHP中定义变量时,其变量名定义规则与C语言变量名定义相近,也存在着区别;
②存在四种变量作用域,当在函数中引用全局变量时,需要使用global关键字;
③PHP输出语句常用echo与print执行,echo可以输出一个或多个字符串,print只能输出简单类型变量的值。
④PHP的数据类型,常用的数据类型如整形,浮点型,字符串,数组,空值等,这些内容在C语言的学习中都有相应的了解
然而与C语言不同的是,在C语言的编辑中,我们通过定义int或float来给出数值。以整数值为例,在C语言中,当我们输入’int x;’后,x的值即为整形值,即使输入了小数部分,也会转换为整形;但对于PHP的编辑,我们直接通过整数的规则直接给出,如’x=666’,不需要我们再定义int。通过对教程的学习,不难发现,利用var_dump()函数可以返回变量的数据类型和值;当我们输入’var_dump(x);’后,直接返回’int(666)’,浮点型数值同理;对于字符型,返回的结果略有不同;空值则可以作为清空变量数据的操作,将上述几种类型数据进行编辑,输出结果如下图:

⑤PHP常量值,在脚本中不能被改变且数字不能作为首字母出现。设置常量时,用define()函数,即define(string constant_name, mixed value, case_sensitive = true);其中constant_name为常量名称(标符),value为常量的值,case_sensitive指定是否大小写敏感,true即为不敏感;示例如下:

(3)有关python及网络爬虫:
首先对于python环境的搭建,我选择了安装3.7版本,3.X与2.7确实存在着一些区别比如说兼容性问题,当然我们也可以选择两个版本同时安装。对于python的学习,还是从W3Cschool上开始进行,对基本的函数语法需要每周的学习巩固。
那么对于网络爬虫这个东西,我也是第一次接触,通过百度搜索不难发现,爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,编辑爬虫脚本时通常会使用python程序,通过与 requests的相关语句,抓取网页的html源代码。
通过在CSDN上的进一步搜索,在众多博客中选择了Jack-Cui的python爬虫解析教程。不得不说博主在这一方面上下功夫很深内容也确实非常走心。为了进一步了解爬虫的用途,先从博主的文章中复制一段小代码,进行实验,从豆瓣网开始:


第一次运行程序后,这种操作毕竟是第一次见到,所以感觉还是比较神奇的。其实我个人并不是很懂这个程序的设计或者说它的构造,我对python3.x了解的还是很少的,平日只是接触C,但是绿色字体这一部分还是知道点的。url后面就是我们知道的网址,xpath后面括号的内容是我们要爬取的,这个是可以从网页源代码上查到的(各个浏览器的网页查看器),通过点击小箭头,在网页上对自己想要爬取的数据进行点击,从而进行更换,当然更换的内容是//以前的部分,例如输入 div[@class=“g-header-container”]后就是不同的内容。
在经过不同的网站操作后,也会发现,有的网站在爬取后输出的是[],而不是想要的数据。在这一点上,只能通过后续的学习再进行分析研究。
(4)几点感受:
1.感谢一些博客主。作为一个初学者,有许多不懂得,许多要学的内容都是通过他们的介绍讲解进行学习,确实也少走了许多弯路,在此一并感谢。
2.自己要走的路还有很长。在这样一个信息化高速发展的时代,需要掌握的计算机方面的知识还有很多,只有熟练掌握语言后才能做自己想要做的事情,成为自己想要成为的人。
3.努力是为了减少运气的成分。这是Jack-Cui博主里的一句话,我觉得非常好,坚持一件事情很难,但是这过程真的很美。我在自己搭建的localhost中写了一句话:老当益壮宁移白首之心,穷且亦坚不坠青云之志。送给自己,也送给每一个追梦的人。
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值