bash 的环境变量和 shell 变量
文章目录
本文简单介绍了 bash 的启动过程;shell 变量和环境变量的区别及相互转换;环境变量传递给子进程的过程;在当前环境下执行脚本及其实际应用,本文适合 Linux 初学者。
1. 导言
- 
shell是一个Linux的命令行解释器,Linux下有很多shell,其中ubuntu中默认的shell应该是 dash,因为我们看到/bin/sh被链接到了 dash
图1:/bin/sh指向dash  
- 但是当你启动终端时(不管是在桌面还是远程),默认启动的却是 bash(Bourne-Again SHell),
bash是GNU(Gnu's Not Unix)开发的; - 使用 
cat /etc/shells命令可以看到在你的Linux下有那些shell;使用echo $SHELL可以看到当前你正在使用的shell; - 本文中如无特别说明,
shell指的是bash,所有范例在ubuntu 20.04下完成,在更高版本的ubuntu上,可能会有些微区别;在较低版本的ubuntu上不能保证有相同的效果。 
2. 终端是如何启动 shell 的
- 
ubuntu的 1 号进程是systemd,这是ubuntu在加载完Linux内核后启动的第一个进程,是所有其它进程的祖宗; - 
你可能用
ps aux(ps -ef)命令发现 1 号进程是 /sbin/init,而不是 systemd,但你用ls -l /sbin/init看一下就会恍然大悟;
图2:1号进程 
图3:/sbin/init指向systemd  
- 
当你在
ubuntu桌面版上启动一个终端时,会启动一个 gnome-terminal 进程,gnome-terminal进程启动了 bash 进程,这样你就看到可爱的提示符了,这个过程使用pstree命令一目了然;
图4:gnome-terminal进程启动bash  
- 
当你使用
ssh客户端远程登录到Linux系统时,bash 进程是由 sshd 进程启动的,这个也可以用pstree命令看到
图5:sshd进程启动bash  
- 只有启动了 
bash你才拥有了一个shell环境,你才能够在终端上输入命令,你从键盘输入的任何内容都必须由bash进行解释并做出进一步的处理。 
3. shell 变量和环境变量
- 
shell 变量
shell管理着一个变量表,这使得用户可以自己定义变量,这些变量是在shell下建立,由shell管理,在shell下使用- 在启动 
shell(bash)的时候,shell会创建一些变量(不同的shell创建的变量会有所不同),同时,shell在启动过程中还会去执行一些可以由客户自定义的脚本,比如:在启动bash时会执行:/etc/bash.bashrc,在登录时会执行:~/.bashrc等,这些脚本通常也会建立一些变量; - 由于有些脚本是在用户登录时执行的,比如:~/.bashrc,而这个脚本是放在用户的 home 目录下的,这就使得不同的用户在登录时可以执行不同的脚本,从而每个用户在登录后所建立的 
shell变量也可以是不一样的 - 在 
shell下,可以直接用:变量名=变量值的方法定义或修改shell变量;也可以用:unset 变量名来删除变量,按照惯例,shell变量名使用 大写字母 - 使用 
set命令可以查看当前所有的shell变量;用echo $变量名可以显示指定变量名的值。 
 - 
环境变量
- 环境变量也是 
shell变量,但环境变量却不等同于shell变量,我们暂时把不是环境变量的shell变量称作 普通 shell 变量,在bash内部,环境变量与普通shell变量的区别,仅仅是一个不同的标记而已; - 环境变量和普通 
shell变量的最主要的区别是,在建立一个子进程时,环境变量会被传递给这个子进程,而普通shell变量不会,所以,环境变量可能会对一个子进程的行为产生影响,因为子进程可以根据环境变量的值做出不同的动作; - 环境变量可以使用 
export 变量名=变量值进行设置,可以像普通shell变量一样用unset 变量名进行删除; - 可以使用 
printenv命令查看所有的环境变量;用echo $变量名可以显示指定环境变量的值;也可以用printenv 环境变量名来显示一个环境变量的值; env如果不带参数的话,也是可以显示环境变量的,但这个命令主要用于在指定环境下执行命令。
 - 环境变量也是 
 - 
关于 env 命令的两个例子
env 环境变量名=变量值 命令和env -u 环境变量名 命令都只能临时在一个新的环境中改变或者删除一个变量,用于在一个指定的环境中执行命令,这一点在很多文章中都没有明确说明;- 下面的例子设置了一个临时环境变量 ENV_VAR_1,并且在这个临时环境中将这个变量的值打印出来:
1 2 3 4 5$ printenv ENV_VAR_1 # 当前环境下,不存在环境变量 ENV_VAR_1 $ env ENV_VAR_1=first_value printenv ENV_VAR_1 # 临时设置环境变量并打印出值 first_value # 临时设置的环境变量ENV_VAR_1的值 $ printenv ENV_VAR_1 # 当前环境下,仍然不存在环境变量 ENV_VAR_1 $ - 下面的例子中在临时环境中删除一个在当前环境中存在的环境变量,在临时环境中打印该环境变量为空,确定该环境变量在临时环境中已经不存在;
1 2 3 4 5 6 7 8 9$ export ENV_VAR_2=second_value # 当前环境下设置环境变量 $ printenv ENV_VAR_2 # 打印该环境变量的值 second_value $ env -u ENV_VAR_2 printenv SHELL ENV_VAR_2 USER # 临时删除该环境变量,并在临时环境中打印该变量 /bin/bash # SHELL变量的值 demouser # USER变量的值,偏偏没有变量ENV_VAR_2的值 $ printenv ENV_VAR_2 # 当前环境下打印环境变量ENV_VAR_2 second_value $ 
 - 
环境变量和普通 shell 变量的转换
- 普通 
shell变量,通过export 变量名可以转变成环境变量;1 2 3 4 5 6 7 8 9$ set|grep VAR_TO_ENVVAR # 没有VAR_TO_ENVVAR这个shell变量 $ VAR_TO_ENVVAR=convert_var_to_envvar # 设置VAR_TO_ENVVAR $ set|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR是一个shell变量 VAR_TO_ENVVAR=convert_var_to_envvar $ printenv|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR不是一个环境变量 $ export VAR_TO_ENVVAR # 执行export命令 $ printenv|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR已经变成一个环境变量 VAR_TO_ENVVAR=convert_var_to_envvar $ - 普通 
shell变量,通过declare -x 变量名可以转变成环境变量:1 2 3 4 5 6 7 8 9$ unset VAR_TO_ENVVAR # 删除变量VAR_TO_ENVVAR $ VAR_TO_ENVVAR=convert_var_to_envvar # 设置VAR_TO_ENVVAR $ set|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR是一个shell变量 VAR_TO_ENVVAR=convert_var_to_envvar $ printenv|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR不是一个环境变量 $ declare -x VAR_TO_ENVVAR # 执行declare命令 $ printenv|grep VAR_TO_ENVVAR # VAR_TO_ENVVAR已经变成一个环境变量 VAR_TO_ENVVAR=convert_var_to_envvar $ - 环境变量,通过 
declare +x 变量名可以转变成普通shell变量:1 2 3 4 5 6 7 8$ export ENV_VAR_1=testing # 设置一个环境变量 $ printenv|grep ENV_VAR_1 # 确认设置成功 ENV_VAR_1=testing $ declare +x ENV_VAR_1 # 执行declare +x命令 $ printenv|grep ENV_VAR_1 # 该变量已经不再是环境变量 $ set|grep ENV_VAR_1 # 该变量仍然是一个普通shell变量 ENV_VAR_1=testing $ declare 变量名=变量值可以用来设置或修改一个普通shell变量的值;declare -x 变量名=变量值可以用来设置或修改一个环境变量的值;declare -x 变量名可以将普通shell变量变成环境变量;declare +x 变量名可以将环境变量变成普通shell变量;
 - 普通 
 
在
Bourne Shell家族中(bash - Bourne-Again SHell)对变量和环境变量的区分确实不是很严格,很容易混为一谈,比如:两者按惯例都是用大写字母表示,设置和删除方法相同;但是在C Shell(csh)是进行了严格区分的,在csh中,按惯例shell变量使用小写字母,环境变量使用大写字母,shell变量使用set和unset命令进行设置和删除,而环境变量必须用setenv和unsetenv命令进行设置和删除。
4. bash 如何将环境变量传给子进程
- 
bash 如何执行一个命令
shell在收到一个换行符(new line,ASCII码0x0A)时开始解释命令行的命令;shell查找命令是否有别名(alias),如果有则用别名代替命令;- 如果命令中不包含 
"/",shell首先查找同名函数,如果有,执行这个函数即可; - 如果没有同名函数则查找内建命令,如果是内建命令,则在 
bash内部执行即可; - 如果也不是内建命令,则根据环境变量 PATH 的顺序查找命令文件;
 - 如果找不到命令文件,则显示错误信息并回到提示符接收下面的命令;
 - 如果找到命令文件或者命令中有 
"/"字符,bash会fork一个子进程,自身进程执行 wait() 等待子进程结束,然后在子进程中执行 execve(),一切的其他工作交给 execve() 来处理; 
 - 
环境变量的传递
- 
我们看一下 execve() 的手册

图6:execve()手册  
- 在执行 execve() 时,需要传递三个参数过去,
filename- 要执行的程序文件名;argv[]- 执行这个程序需要的参数;envp- 环境变量;环境变量就是这样传递给了可执行程序; - 大家可能注意到,
shell不仅可以执行一个二进制的程序,也可以执行一个shell脚本(ASCII文本文件),我们并不需要告诉shell我们在执行那种文件,而shell却不会搞错,其实这个识别过程也是 execve() 的功劳;execve() 在执行程序时首先要读出文件的前
128个字节,用以分析文件的类别,以便用适当的方式执行这个文件;比如:shell脚本文件的前两个字符是"#!",这一点在手册中有明确说明;ELF文件的前四个字符是:0x45 0x4c 0x46 0x7c等,还有其它不同的可执行格式,这个过程其实还是比较复杂的,但是和shell变量毫无关系,所以不在本文讨论的范围内; 
 - 
 - 
一个打印环境变量的C程序
- 该程序只是验证传递给子进程的环境变量不包括普通 
shell变量 - 源代码,文件名:
print_env.c1 2 3 4 5 6 7 8 9 10 11 12#include<stdio.h> extern char **environ; int main() { int i; for (i = 0; environ[i]; i++) printf("*%s\n", environ[i]); return 0; } - 编译执行
1 2$ gcc print_env.c -o print_env $ ./print_env - 本程序打印出的环境变量与 
printenv命令打印出的结果一致。 
 - 该程序只是验证传递给子进程的环境变量不包括普通 
 - 
跟踪程序的执行
- 
用
strace ./print_env可以清楚地看到环境变量被传递给了程序print_env
图7:跟踪程序print_env  
- 我们先用 
printenv|wc -l打印出环境变量的数量,然后我们看到有相同数量的变量被传递给了我们的程序print_env; 
 - 
 - 
环境变量对启动程序的影响
- 
上面这个小程序我们在运行时是使用
./print_env的方式运行的,其中"./"表示当前路径,但是这个程序其实就在当前目录下,我们为什么一定要指定路径呢?我们试一下不指定路径会怎样
图8:命令执行失败  
- 
这是因为
shell是沿着环境变量 PATH 的顺序来查找命令文件的,而当前目录./并不在当前的 PATH 中,我们可以试着把./加入到环境变量 PATH 中,然后再运行一下试试;
图9:执行print_env成功  
- 正如我们所期待的,执行成功了
 
 - 
 - 
子进程中无法修改父进程环境的环境变量
shell传递给的程序的环境仅仅是父进程环境的一个副本,所以我们在程序中改变这个副本中的变量都无法改变父进程的环境,当程序运行结束时,这个环境副本将被销毁;- 下面这个例子我们首先在 
shell下定义一个环境变量ENV_VAR_1,然后编写一个脚本修改这个环境变量,在脚本退出后我们再次打印这个环境变量;脚本文件名为:
chg_envvar.sh,脚本的代码如下:1 2 3 4 5 6 7 8 9 10#!/bin/bash echo "Print environment variable - ENV_VAR_1" printenv ENV_VAR_1 echo "Change ENV_VAR_1 to 'second_value'" ENV_VAR_1="second value" echo "Again, print environment variable - ENV_VAR_1" printenv ENV_VAR_1 exit 0下面我们完成这个测试
1 2 3 4 5 6 7 8 9 10 11 12 13whowin@ubuntu:~$ chmod +x chg_envvar.sh whowin@ubuntu:~$ export ENV_VAR_1="first value" whowin@ubuntu:~$ printenv ENV_VAR_1 first value whowin@ubuntu:~$ ./chg_envvar.sh Print environment variable - ENV_VAR_1 first value Change ENV_VAR_1 to 'second_value' Again, print environment variable - ENV_VAR_1 second value whowin@ubuntu:~$ printenv ENV_VAR_1 first value whowin@ubuntu:~$我们看到,在脚本内部执行
printenv ENV_VAR_1时,打印出来的结果已经是second value,说明我们已经修改成功了这个环境变量的值,但当脚本退出,我们再次打印这个变量时,其值仍然是first value,并没有改变,这说明我们在子进程中对环境的修改并不能影响到父进程。 
 
5. 在当前环境下运行程序
- 
我们在前面一再强调,
shell在执行一个程序的时候会先fork一个子进程,然后在子进程中执行程序,这实际上是shell为执行一个程序新建立了一个环境,然后在这个环境中执行程序,当然这个新环境继承了父进程的环境; - 
其实,
shell也可以不fork一个子进程,而是直接在当前进程下执行你的程序,shell下有一个内建命令source就是为此而设计的,我们先来看看这个命令的手册:
图10:source命令的help手册  
- 
说明已经很清楚了,要说明的是
source命令只能执行脚本文件; - 
我们提出的问题是,既然
source命令是在当前shell下执行程序,那是不是意味着上面那个改变环境变量的脚本文件可以改变当前shell下的环境变量了呢?我们执行一下试试; - 
我们在前面执行脚本时使用的命令是:
./chg_envvar.sh,我们已经解释过"./"的含义以及为什么要有"./",这次我们执行这个脚本准备用. ./chg_envvar.sh来执行,只是在原来命令的前面多了". ",点后面有个空格,其实这个"."就等同于source,所以这个命令就相当于source ./chg_envvar.sh1whowin@ubuntu:~$ . ./chg_envvar.sh - 
当我们用这种方法执行这个脚本的时候,我们发现意外出现了,整个
shell都退出了,这是为什么呢?这是因为在我们的脚本的最后一行有一个 exit 0 语句,正常情况下,如果我们不使用
source去运行时,exit 会退出shell为这个脚本建立的子进程,所以一点问题都没有,但是当用source去运行这个脚本时,没有建立子进程,那么退出的就是当前shell进程,所以你的shell就没有了,因为被你运行的脚本退出了;但是如果我们不使用 exit 而使用 return 退出确实是可以解决在使用source命令运行的问题,但是不使用source运行就要出问题了,大家自己可以试一下;那么是不是可以不写 exit 和 return 呢?当然可以,但是这不是写
shell脚本的好习惯,因为执行完你的脚本后,可能还要执行下一个脚本,而下一个脚本可能要判断你的这个脚本的返回值,所以在写脚本时返回一个有意义的值是非常良好的习惯;其实我们修改一下这个脚本就可以解决这个问题,这里仅提供源码,解释超出了本文涉及的内容:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16whowin@ubuntu:~$ cat chg_envvar.sh #!/bin/bash echo "Print environment variable - ENV_VAR_1" printenv ENV_VAR_1 echo "Change ENV_VAR_1 to 'second_value'" ENV_VAR_1="second value" echo "Again, print environment variable - ENV_VAR_1" printenv ENV_VAR_1 if [ $0 != "$BASH_SOURCE" ]; then return 0 else exit 0 fi whowin@ubuntu:~$ - 
用这种方法,也可以让某些必须用
source运行的程序如果没有在source下运行,可以给出提示并停止运行; - 
现在回到正题,这个脚本能不能改变当前
shell下的环境变量呢?答案是肯定的。1 2 3 4 5 6 7 8 9 10 11 12whowin@ubuntu:~$ export ENV_VAR_1="first value" whowin@ubuntu:~$ printenv ENV_VAR_1 first value whowin@ubuntu:~$ source ./chg_envvar.sh Print environment variable - ENV_VAR_1 first value Change ENV_VAR_1 to 'second_value' Again, print environment variable - ENV_VAR_1 second value whowin@ubuntu:~$ printenv ENV_VAR_1 second value whowin@ubuntu:~$ - 
很显然,脚本
chg_envvar.sh运行完毕后,我们发现,环境变量 ENV_VAR_1 已经发生了改变; - 
实际上这种方法是一种常用的方法,常被用于改变当前环境;
在嵌入式开发中,不同的开发板使用的
CPU可能不同,这样在交叉编译时的工具链也不同,不同的开发板即便是相同的CPU也可能使用不同的工具链进行编译,比如即便是相同的CPU可能有些需要用软浮点的编译器,有些使用硬浮点的编译器,这时我们可以用上面的方法为每一个交叉编译的工具链写一个脚本,脚本中为某个指定的工具链所需的环境,然后用source去运行,下面是我的环境下的一个例子:1 2 3 4 5whowin@ubuntu:~$ cat a8.sh #!/bin/bash #A8 arm-linux-gnueabi工具链 export PATH=/home/whowin/toolschain/4.5.1/bin:$PATH whowin@ubuntu:~$ 
6. 结语
- 启动终端程序时启动了 bash 进程,使我们可以在 shell 下输入命令;
 - 环境变量也是 
shell变量,但又与shell变量略有不同; - 环境变量与普通 
shell变量的主要区别是环境变量会传递给新建的子进程; - 环境变量和普通 
shell变量之间可以使用export或declare进行转换; shell可以在当前进程下运行脚本程序(不创建子进程),这种运行方式常被用于改变当前运行环境下的环境变量。
欢迎访问我的博客:https://whowin.cn
email: hengch@163.com

文章作者 whowin
上次更新 2022-04-10