学习周记（一）

最新推荐文章于 2022-08-21 20:20:03 发布

極品━═☆宏

最新推荐文章于 2022-08-21 20:20:03 发布

阅读量4.1k

点赞数

分类专栏：基础内容学习文章标签：周记

本文链接：https://blog.csdn.net/qq_43214809/article/details/85140221

版权

基础内容学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

信安星火web学习周记（一）

时间：2018年12月13日至2018年12月20日

1.学习内容：
（1）使用phpstudy软件搭建php环境；
（2）了解php基本语法知识；
（3）安装python语言环境；
（4）阅读requests库文档；
（5）写出百度搜索结果爬虫脚本；
2.完成情况及感受心得：
（1）有关phpstudy软件：
事实上，通过在CSDN中搜索，不难找到phpstudy的安装教程及操作说明。网络上推荐的关于php的软件有很多，例如phpstorm,phpedit等。但结合自身情况，以及通过对phpstudy的进一步了解，phpstudy这个软件也确实存在着许多优点，就像版本的自由切换以及各主要版本的php环境的配置都是比较齐全的，而这对于入门的新手来说可以省去很大一部分的时间(由于我对php各版本的优缺点不是很熟悉，因此在版本的选择上，借鉴了其他一些博主的安装教程，选择了7.0.12这个版本。)

在这里插入图片描述

对于"My HomePage"，作为个人的主页，我们可以对其进行优化，使其更好的为自己服务。具体的操作规程还是通过搜索一些CSDN大佬博主们的教程进行优化，我选择了从网上下载wordpress来对主页进行操作规范。
（2）有关PHP：
学习PHP语言的相关平台还是比较多的，我选择了在W3Cschool上进行学习，一方面，W3Cschool上的语言类教程还是很齐全的，另一方面，它会在一些知识点的后面进行相应的在线编程练习，这样就减少了许多麻烦。
就我个人而言，按照教程的先后顺序进行每日学习，学习内容主要分为下几个方面：
1.PHP基本语法：
PHP作为服务器端脚本语言，其代码在服务器上执行，结果以纯HTML形式返回给浏览器。
①PHP脚本以<?php开始，以?>结束；
②PHP文件通常包含HTML标签和PHP脚本代码；
③PHP代码依托于HTML的编辑结构，内嵌在(\n)(\n)(\n);(\n)之中；
2.PHP变量及类型：
①当在PHP中定义变量时，其变量名定义规则与C语言变量名定义相近，也存在着区别；
②存在四种变量作用域，当在函数中引用全局变量时，需要使用global关键字；
③PHP输出语句常用echo与print执行，echo可以输出一个或多个字符串，print只能输出简单类型变量的值。
④PHP的数据类型，常用的数据类型如整形，浮点型，字符串，数组，空值等，这些内容在C语言的学习中都有相应的了解
然而与C语言不同的是，在C语言的编辑中，我们通过定义int或float来给出数值。以整数值为例，在C语言中，当我们输入’int x；’后,x的值即为整形值，即使输入了小数部分，也会转换为整形；但对于PHP的编辑，我们直接通过整数的规则直接给出，如’x=666’,不需要我们再定义int。通过对教程的学习，不难发现，利用var_dump()函数可以返回变量的数据类型和值；当我们输入’var_dump(x);’后，直接返回’int(666)’，浮点型数值同理；对于字符型，返回的结果略有不同；空值则可以作为清空变量数据的操作，将上述几种类型数据进行编辑，输出结果如下图：

⑤PHP常量值，在脚本中不能被改变且数字不能作为首字母出现。设置常量时，用define()函数，即define(string constant_name, mixed value, case_sensitive = true)；其中constant_name为常量名称（标符），value为常量的值，case_sensitive指定是否大小写敏感，true即为不敏感；示例如下：

（3）有关python及网络爬虫：
首先对于python环境的搭建，我选择了安装3.7版本，3.X与2.7确实存在着一些区别比如说兼容性问题，当然我们也可以选择两个版本同时安装。对于python的学习，还是从W3Cschool上开始进行，对基本的函数语法需要每周的学习巩固。
那么对于网络爬虫这个东西，我也是第一次接触，通过百度搜索不难发现，爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，编辑爬虫脚本时通常会使用python程序，通过与 requests的相关语句，抓取网页的html源代码。
通过在CSDN上的进一步搜索，在众多博客中选择了Jack-Cui的python爬虫解析教程。不得不说博主在这一方面上下功夫很深内容也确实非常走心。为了进一步了解爬虫的用途，先从博主的文章中复制一段小代码，进行实验，从豆瓣网开始：

第一次运行程序后，这种操作毕竟是第一次见到，所以感觉还是比较神奇的。其实我个人并不是很懂这个程序的设计或者说它的构造，我对python3.x了解的还是很少的，平日只是接触C，但是绿色字体这一部分还是知道点的。url后面就是我们知道的网址，xpath后面括号的内容是我们要爬取的，这个是可以从网页源代码上查到的（各个浏览器的网页查看器），通过点击小箭头，在网页上对自己想要爬取的数据进行点击，从而进行更换，当然更换的内容是//以前的部分，例如输入 div[@class=“g-header-container”]后就是不同的内容。
在经过不同的网站操作后，也会发现，有的网站在爬取后输出的是[]，而不是想要的数据。在这一点上，只能通过后续的学习再进行分析研究。
（4）几点感受：
1.感谢一些博客主。作为一个初学者，有许多不懂得，许多要学的内容都是通过他们的介绍讲解进行学习，确实也少走了许多弯路，在此一并感谢。
2.自己要走的路还有很长。在这样一个信息化高速发展的时代，需要掌握的计算机方面的知识还有很多，只有熟练掌握语言后才能做自己想要做的事情，成为自己想要成为的人。
3.努力是为了减少运气的成分。这是Jack-Cui博主里的一句话，我觉得非常好，坚持一件事情很难，但是这过程真的很美。我在自己搭建的localhost中写了一句话：老当益壮宁移白首之心，穷且亦坚不坠青云之志。送给自己，也送给每一个追梦的人。
在这里插入图片描述