批量下载网页上的链接然后合并、筛选、编辑文本内容

1. 打开网页,按F12打开开发工具,点击源代码,查看 网页的源代码,并将其复制到一个文档中

2.保留需要批量下载的链接行

3.对其进行修饰

4. 去除多每一行多余的文字

echo "123.456.AABBCCDDEEFF(GGHHII)" > test.txt
echo " 678.890.BBCAACDDFFEE(GGIIKKHH)" >> test.txt  #这一行最前面有空格!!
# 以下位删除普通字符
sed 's/.*AA//g' test.txt > B.txt   # 删除test.txt中,AA字符串之前的内容,一直到行首,保存到B.txt
sed 's/FF.*$//g' test.txt > B.txt  # 删除test.txt中,FF字符串之后的内容,一直到行尾,保存到B.txt
#以下为删除特殊字符,需要用  \ 进行字符的转义!!
sed 's/.*\.//g' test.txt > B.txt   # 删除test.txt中,.字符串之前的内容,一直到行首,保存到B.txt
sed 's/\..*$//g' test.txt > B.txt  # 删除test.txt中,.字符串之后的内容,一直到行尾,保存到B.txt

5. wget 批量下载

wget -i url.txt

6. 合并下载下来的html文档

cat *.html >> name.txt

7. 提取具有指定标志符号的内容

grep br name.txt > ok.txt

8. 替换不必要的文字

vim ok.txt

:1,$s /AAA/BBB/g            将AAA 替换成BBB

sed -i 's/AAA/BBB/g' ok.txt

如果要替换的字符串中间有空格,要用转义符\紧跟空格,再接后一个字符

9. 在行尾加入字符

在行尾加入 <br>符号
sed 's/$/&\<br\>/g' A.txt > B.txt

10. 复制前 100行到文件b中

head -n 100000 A.txt > B.txt

11.删除 2-50行,然后复制到B

# 先查看多少行
wc -l A.txt
sed '2,50d' A.txt > B.txt

# 可以直接在A中删除
sed -i '2,50d' A.txt

12. 删除含有特定字符的行

sed -i '/abcd/d' A.txt

#删除空行
sed -i '/^$/d' A.txt

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
内容提要 -------------------------------------------------------------------------------- 本书全面深入地介绍了MySQL的功能,主要内容包括MySQL、PHP、Apache、Perl等组件的安装与功能简介,mysql等一些重要系统管理工具和用户操作界面的使用,MySQL数据库系统设计的基础知识与用不同语言设计MySQL数据库的过程,以及SQL语法、工具、选项、API应用指南,最大限度地帮助读者更快地学习和掌握MySQL数据库系统的设计和使用。本书覆盖了MySQL 5.0,讨论了新的程序设计口(如PHP 5里的mysqli)和新的系统管理工具。   本书是MySQL数据库管理员和开发人员的必备参考书。 目录 -------------------------------------------------------------------------------- 第一部分 入门  第1章 什么是MySQL   1.1 什么是数据库   1.2 MySQL   1.3 MySQL的不足   1.4 MySQL的版本编号   1.5 MySQL的许可证   1.6 MySQL软件的替代品   1.7 小结  第2章 测试环境   2.1 是Windows还是UNIX/Linux   2.2 在Windows系统上安装MySQL和相关软件   2.3 在SUSE Linux 9.3系统上安装MySQL和相关软件   2.4 在Red Hat Enterprise Linux 4系统上安装MySQL和相关软件   2.5 编译MySQL软件的开发者版本(Linux)   2.6 配置Apache   2.7 配置PHP   2.8 配置MySQL  第3章 初级案例研究:MySQL+PHP   3.1 概述   3.2 数据库的开发   3.3 调查问卷   3.4 问卷调查结果的处理和显示   3.5 改进意见 第二部分 管理工具和用户操作界面  第4章 mysql、mysqladmin和mysqldump   4.1 mysql   4.2 mysqladmin   4.3 mysqldump  第5章 MySQL Administrator和MySQL Query Browser   5.1 安装   5.2 与MySQL服务器建立连   5.3 MySQL Administrator   5.4 MySQL Query Browser  第6章 phpMyAdmin   6.1 phpMyAdmin的安装与配置   6.2 用户管理,保护MySQL   6.3 创建和编辑数据库   6.4 查看、插入和编辑数据   6.5 执行SQL命令   6.6 导入和导出   6.7 服务器管理   6.8 辅助功能  第7章 Microsoft Office和OpenOffice/StarOffice   7.1 安装Connector/ODBC   7.2 Microsoft Access   7.3 Microsoft Excel   7.4 安装Connector/J   7.5 OpenOffice/StarOffice Base   7.6 OpenOffice/StarOffice的Data Source视图 第三部分 基础知识  第8章 数据库设计概论   8.1 参考读物   8.2 数据表类型   8.3 MySQL数据类型   8.4 数据库设计技巧   8.5 规范化   8.6 层次关系的处理   8.7 关系   8.8 主键和外键   8.9 索引   8.10 视图   8.11 示例数据库mylibrary(图书管理)   8.12 示例数据库myforum(网上论坛)   8.13 示例数据库exceptions(用于特殊情况的测试)  第9章 SQL语言入门   9.1 简介   9.2 简单查询(SELECT)   9.3 对查询结果进行排序(ORDER BY)   9.4 筛选数据记录(WHERE,HAVING)   9.5 涉及多个数据表的关联查询(LEFT/RIGHT JOIN)   9.6 合并查询结果(UNION)   9.7 分组查询,统计函数(GROUP BY)   9.8 修改数据(INSERT、UPDATE和DELETE)   9.9 创建数据表、数据库和索引  第10章 SQL解决方案   1

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值