在Linux运维与开发面试中,面试题:Linux 常用命令 awk sed grep是考察候选人文本处理能力的核心题目。这三个工具被称为"文本处理三剑客",在日志分析、数据提取、批量处理等场景中不可或缺。掌握它们不仅能显著提升工作效率(据鳄鱼java技术团队统计,熟练使用三剑客可将文本处理时间缩短70%),更是通过Linux技术面试的必备技能。本文将从命令原理、核心用法、实战案例到面试题解析,全面拆解这三个命令的精髓,帮你在面试中展现专业运维能力,正如鳄鱼java在《Linux命令实战手册》中强调的:"三剑客不是孤立的工具,而是协同作战的文本处理利器。"
grep:文本搜索的"定位雷达"

grep(Global Regular Expression Print)是基于正则表达式的文本搜索工具,核心功能是在文件中查找匹配模式的行,是日志分析和内容过滤的首选工具。
1. 核心语法与常用选项
grep的基本语法为:grep [选项] 模式 文件名,关键选项包括:
| 选项 | 作用 | 实战案例 |
|---|---|---|
| -i | 忽略大小写 | grep -i "error" app.log(匹配Error/ERROR等) |
| -n | 显示行号 | grep -n "timeout" server.log(定位错误位置) |
| -v | 反向匹配(显示不包含模式的行) | grep -v "^#" config.conf(过滤注释行) |
| -r | 递归搜索目录 | grep -r "password" /etc/(查找敏感信息) |
| -A/-B/-C | 显示匹配行的上下文(后/前/前后) | grep -A 3 "Exception" trace.log(显示异常后3行) |
鳄鱼java技术团队提醒:结合正则表达式使用grep威力更大,例如grep -E "([0-9]{1,3}\.){3}[0-9]{1,3}" access.log可提取日志中的IP地址。
2. 典型应用场景
- 日志错误排查:
grep -i "error" /var/log/nginx/access.log | grep -v "404"(过滤非404错误) - 代码审计:
grep -rn "TODO" /project/src(查找未完成任务) - 系统配置检查:
grep -v "^$" /etc/sysctl.conf | grep -v "^#"(过滤空行和注释行)
sed:流编辑的"文本手术刀"
sed(Stream Editor)是面向行的流编辑器,通过非交互式方式对文本进行替换、删除、插入等操作,特别适合批量处理配置文件和日志。
1. 核心语法与常用命令
sed的基本语法为:sed [选项] '命令' 文件名,核心命令包括:
| 命令 | 作用 | 实战案例 |
|---|---|---|
| s/旧文本/新文本/g | 全局替换 | sed 's/old/new/g' file.txt(替换所有old为new) |
| d | 删除行 | sed '2,4d' file.txt(删除第2-4行) |
| i | 行前插入 | sed '3i insert line' file.txt(在第3行前插入文本) |
| p | 打印行(需配合-n选项) | sed -n '5p' file.txt(仅打印第5行) |
| c | 替换整行 | sed '2c new line' file.txt(将第2行替换为new line) |
注意:使用-i选项可直接修改文件(建议先备份:sed -i.bak 's/old/new/g' file.txt)。
2. 高级应用:正则替换与批量处理
- 正则表达式替换:
sed -r 's/([0-9]+)/\1秒/' time.log(给数字添加"秒"单位) - 条件编辑:
sed '/error/s/warn/ERROR/g' app.log(仅在含error的行中替换warn为ERROR) - 多命令组合:
sed -e '1d' -e 's/foo/bar/g' file.txt(删除首行并替换文本)
鳄鱼java运维案例:通过sed -i 's/^Allow from .*/Allow from 192.168.1.0\/24/' /etc/httpd/conf.d/*.conf批量修改Apache访问控制配置。
awk:数据处理的"瑞士军刀"
awk是功能强大的文本分析工具,支持按列处理数据、自定义变量和函数,适合结构化数据(如CSV、日志)的统计与报告生成。
1. 核心语法与内置变量
awk的基本语法为:awk '模式{动作}' 文件名,常用内置变量包括:
| 变量 | 含义 | 示例 |
|---|---|---|
| $0 | 整行内容 | awk '{print $0}' file.txt(打印全行) |
| $n | 第n列(默认空格分隔) | awk '{print $1,$3}' data.txt(打印第1和第3列) |
| NF | 当前行的字段数 | awk '{print NF}' file.txt(打印每行列数) |
| NR | 当前行号 | awk 'NR==5{print}' file.txt(打印第5行) |
| FS/OFS | 输入/输出字段分隔符 | |
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。





