bash 的环境变量和 shell 变量

本文简单介绍了 bash 的启动过程；shell 变量和环境变量的区别及相互转换；环境变量传递给子进程的过程；在当前环境下执行脚本及其实际应用，本文适合 Linux 初学者。

1. 导言

shell 是一个 Linux 的命令行解释器，Linux 下有很多 shell，其中 ubuntu 中默认的 shell 应该是 dash，因为我们看到 /bin/sh 被链接到了 dash

图1：/bin/sh指向dash

但是当你启动终端时(不管是在桌面还是远程)，默认启动的却是 bash(Bourne-Again SHell)，bash 是 GNU(Gnu's Not Unix) 开发的；
使用 cat /etc/shells 命令可以看到在你的 Linux 下有那些 shell；使用 echo $SHELL 可以看到当前你正在使用的 shell；
本文中如无特别说明，shell 指的是 bash，所有范例在 ubuntu 20.04 下完成，在更高版本的 ubuntu 上，可能会有些微区别；在较低版本的 ubuntu 上不能保证有相同的效果。

2. 终端是如何启动 shell 的

ubuntu 的 1 号进程是 systemd，这是 ubuntu 在加载完 Linux 内核后启动的第一个进程，是所有其它进程的祖宗；
你可能用 ps aux(ps -ef) 命令发现 1 号进程是 /sbin/init，而不是 systemd，但你用 ls -l /sbin/init 看一下就会恍然大悟；

图2：1号进程
图3：/sbin/init指向systemd

当你在 ubuntu 桌面版上启动一个终端时，会启动一个 gnome-terminal 进程，gnome-terminal 进程启动了 bash 进程，这样你就看到可爱的提示符了，这个过程使用 pstree 命令一目了然；

图4：gnome-terminal进程启动bash

当你使用 ssh 客户端远程登录到 Linux 系统时，bash 进程是由 sshd 进程启动的，这个也可以用 pstree 命令看到

图5：sshd进程启动bash

只有启动了 bash 你才拥有了一个 shell 环境，你才能够在终端上输入命令，你从键盘输入的任何内容都必须由 bash 进行解释并做出进一步的处理。

3. shell 变量和环境变量

shell 变量
- shell 管理着一个变量表，这使得用户可以自己定义变量，这些变量是在 shell 下建立，由 shell 管理，在 shell 下使用
- 在启动 shell(bash) 的时候，shell 会创建一些变量(不同的 shell 创建的变量会有所不同)，同时，shell 在启动过程中还会去执行一些可以由客户自定义的脚本，比如：在启动 bash 时会执行：/etc/bash.bashrc，在登录时会执行：~/.bashrc等，这些脚本通常也会建立一些变量；
- 由于有些脚本是在用户登录时执行的，比如：~/.bashrc，而这个脚本是放在用户的 home 目录下的，这就使得不同的用户在登录时可以执行不同的脚本，从而每个用户在登录后所建立的 shell 变量也可以是不一样的
- 在 shell 下，可以直接用：变量名=变量值 的方法定义或修改 shell 变量；也可以用：unset 变量名 来删除变量，按照惯例，shell 变量名使用 大写字母
- 使用 set 命令可以查看当前所有的 shell 变量；用 echo $变量名 可以显示指定变量名的值。
环境变量
- 环境变量也是 shell 变量，但环境变量却不等同于 shell 变量，我们暂时把不是环境变量的 shell 变量称作 普通 shell 变量，在 bash 内部，环境变量与普通 shell 变量的区别，仅仅是一个不同的标记而已；
- 环境变量和普通 shell 变量的最主要的区别是，在建立一个子进程时，环境变量会被传递给这个子进程，而普通 shell 变量不会，所以，环境变量可能会对一个子进程的行为产生影响，因为子进程可以根据环境变量的值做出不同的动作；
- 环境变量可以使用 export 变量名=变量值 进行设置，可以像普通 shell 变量一样用 unset 变量名 进行删除；
- 可以使用 printenv 命令查看所有的环境变量；用 echo $变量名 可以显示指定环境变量的值；也可以用 printenv 环境变量名 来显示一个环境变量的值；
- env 如果不带参数的话，也是可以显示环境变量的，但这个命令主要用于在指定环境下执行命令。

关于 env 命令的两个例子

env 环境变量名=变量值命令 和 env -u 环境变量名命令 都只能临时在一个新的环境中改变或者删除一个变量，用于在一个指定的环境中执行命令，这一点在很多文章中都没有明确说明；

下面的例子设置了一个临时环境变量 ENV_VAR_1，并且在这个临时环境中将这个变量的值打印出来：

1
2
3
4
5


$ printenv ENV_VAR_1                           # 当前环境下，不存在环境变量 ENV_VAR_1
$ env ENV_VAR_1=first_value printenv ENV_VAR_1 # 临时设置环境变量并打印出值
first_value                                    # 临时设置的环境变量ENV_VAR_1的值
$ printenv ENV_VAR_1                           # 当前环境下，仍然不存在环境变量 ENV_VAR_1
$ 

下面的例子中在临时环境中删除一个在当前环境中存在的环境变量，在临时环境中打印该环境变量为空，确定该环境变量在临时环境中已经不存在；

1
2
3
4
5
6
7
8
9


$ export ENV_VAR_2=second_value                  # 当前环境下设置环境变量
$ printenv ENV_VAR_2                             # 打印该环境变量的值
second_value
$ env -u ENV_VAR_2 printenv SHELL ENV_VAR_2 USER # 临时删除该环境变量，并在临时环境中打印该变量
/bin/bash                                        # SHELL变量的值
demouser                                         # USER变量的值，偏偏没有变量ENV_VAR_2的值
$ printenv ENV_VAR_2                             # 当前环境下打印环境变量ENV_VAR_2
second_value
$ 

环境变量和普通 shell 变量的转换

普通 shell 变量，通过 export 变量名 可以转变成环境变量；

1
2
3
4
5
6
7
8
9


$ set|grep VAR_TO_ENVVAR                # 没有VAR_TO_ENVVAR这个shell变量
$ VAR_TO_ENVVAR=convert_var_to_envvar   # 设置VAR_TO_ENVVAR
$ set|grep VAR_TO_ENVVAR                # VAR_TO_ENVVAR是一个shell变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR不是一个环境变量
$ export VAR_TO_ENVVAR                  # 执行export命令
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR已经变成一个环境变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ 

普通 shell 变量，通过 declare -x 变量名 可以转变成环境变量：

1
2
3
4
5
6
7
8
9


$ unset VAR_TO_ENVVAR                   # 删除变量VAR_TO_ENVVAR
$ VAR_TO_ENVVAR=convert_var_to_envvar   # 设置VAR_TO_ENVVAR
$ set|grep VAR_TO_ENVVAR                # VAR_TO_ENVVAR是一个shell变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR不是一个环境变量
$ declare -x VAR_TO_ENVVAR              # 执行declare命令
$ printenv|grep VAR_TO_ENVVAR           # VAR_TO_ENVVAR已经变成一个环境变量
VAR_TO_ENVVAR=convert_var_to_envvar
$ 

环境变量，通过 declare +x 变量名 可以转变成普通shell变量：

1
2
3
4
5
6
7
8


$ export ENV_VAR_1=testing    # 设置一个环境变量
$ printenv|grep ENV_VAR_1     # 确认设置成功
ENV_VAR_1=testing
$ declare +x ENV_VAR_1        # 执行declare +x命令
$ printenv|grep ENV_VAR_1     # 该变量已经不再是环境变量
$ set|grep ENV_VAR_1          # 该变量仍然是一个普通shell变量
ENV_VAR_1=testing
$ 

declare 变量名=变量值 可以用来设置或修改一个普通 shell 变量的值；declare -x 变量名=变量值 可以用来设置或修改一个环境变量的值；declare -x 变量名 可以将普通 shell 变量变成环境变量；declare +x 变量名 可以将环境变量变成普通shell变量；

在 Bourne Shell 家族中(bash - Bourne-Again SHell)对变量和环境变量的区分确实不是很严格，很容易混为一谈，比如：两者按惯例都是用大写字母表示，设置和删除方法相同；但是在 C Shell(csh) 是进行了严格区分的，在 csh 中，按惯例 shell 变量使用小写字母，环境变量使用大写字母，shell 变量使用 set 和 unset 命令进行设置和删除，而环境变量必须用 setenv 和 unsetenv 命令进行设置和删除。

4. bash 如何将环境变量传给子进程

bash 如何执行一个命令
- shell 在收到一个换行符(new line，ASCII 码 0x0A)时开始解释命令行的命令；
- shell 查找命令是否有别名(alias)，如果有则用别名代替命令；
- 如果命令中不包含 "/"，shell 首先查找同名函数，如果有，执行这个函数即可；
- 如果没有同名函数则查找内建命令，如果是内建命令，则在 bash 内部执行即可；
- 如果也不是内建命令，则根据环境变量 PATH 的顺序查找命令文件；
- 如果找不到命令文件，则显示错误信息并回到提示符接收下面的命令；
- 如果找到命令文件或者命令中有 "/" 字符，bash 会 fork 一个子进程，自身进程执行 wait() 等待子进程结束，然后在子进程中执行 execve()，一切的其他工作交给 execve() 来处理；
环境变量的传递
- 我们看一下 execve() 的手册
  
  图6：execve()手册
- 在执行 execve() 时，需要传递三个参数过去，filename - 要执行的程序文件名；argv[] - 执行这个程序需要的参数；envp - 环境变量；环境变量就是这样传递给了可执行程序；
- 大家可能注意到，shell 不仅可以执行一个二进制的程序，也可以执行一个 shell 脚本(ASCII 文本文件)，我们并不需要告诉 shell 我们在执行那种文件，而 shell 却不会搞错，其实这个识别过程也是 execve() 的功劳；
  
  execve() 在执行程序时首先要读出文件的前 128 个字节，用以分析文件的类别，以便用适当的方式执行这个文件；比如：shell 脚本文件的前两个字符是 "#!"，这一点在手册中有明确说明；ELF 文件的前四个字符是：0x45 0x4c 0x46 0x7c 等，还有其它不同的可执行格式，这个过程其实还是比较复杂的，但是和 shell 变量毫无关系，所以不在本文讨论的范围内；

一个打印环境变量的C程序

该程序只是验证传递给子进程的环境变量不包括普通 shell 变量

源代码，文件名：print_env.c

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12


#include<stdio.h>

extern char **environ;

int main() {
    int i;

    for (i = 0; environ[i]; i++)
        printf("*%s\n", environ[i]);

    return 0;
}

编译执行

1
2


$ gcc print_env.c -o print_env
$ ./print_env

本程序打印出的环境变量与 printenv 命令打印出的结果一致。

跟踪程序的执行
- 用 strace ./print_env 可以清楚地看到环境变量被传递给了程序 print_env
  
  图7：跟踪程序print_env
- 我们先用 printenv|wc -l 打印出环境变量的数量，然后我们看到有相同数量的变量被传递给了我们的程序 print_env；
环境变量对启动程序的影响
- 上面这个小程序我们在运行时是使用 ./print_env 的方式运行的，其中 "./" 表示当前路径，但是这个程序其实就在当前目录下，我们为什么一定要指定路径呢？我们试一下不指定路径会怎样
  
  图8：命令执行失败
- 这是因为 shell 是沿着环境变量 PATH 的顺序来查找命令文件的，而当前目录 ./ 并不在当前的 PATH 中，我们可以试着把 ./ 加入到环境变量 PATH 中，然后再运行一下试试；
  
  图9：执行print_env成功
- 正如我们所期待的，执行成功了

子进程中无法修改父进程环境的环境变量

shell 传递给的程序的环境仅仅是父进程环境的一个副本，所以我们在程序中改变这个副本中的变量都无法改变父进程的环境，当程序运行结束时，这个环境副本将被销毁；

下面这个例子我们首先在 shell 下定义一个环境变量 ENV_VAR_1，然后编写一个脚本修改这个环境变量，在脚本退出后我们再次打印这个环境变量；

脚本文件名为：chg_envvar.sh，脚本的代码如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


#!/bin/bash

echo "Print environment variable - ENV_VAR_1"
printenv ENV_VAR_1
echo "Change ENV_VAR_1 to 'second_value'"
ENV_VAR_1="second value"
echo "Again, print environment variable - ENV_VAR_1"
printenv ENV_VAR_1

exit 0

下面我们完成这个测试

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


whowin@ubuntu:~$ chmod +x chg_envvar.sh
whowin@ubuntu:~$ export ENV_VAR_1="first value"
whowin@ubuntu:~$ printenv ENV_VAR_1
first value
whowin@ubuntu:~$ ./chg_envvar.sh
Print environment variable - ENV_VAR_1
first value
Change ENV_VAR_1 to 'second_value'
Again, print environment variable - ENV_VAR_1
second value
whowin@ubuntu:~$ printenv ENV_VAR_1
first value
whowin@ubuntu:~$

我们看到，在脚本内部执行 printenv ENV_VAR_1 时，打印出来的结果已经是 second value，说明我们已经修改成功了这个环境变量的值，但当脚本退出，我们再次打印这个变量时，其值仍然是 first value，并没有改变，这说明我们在子进程中对环境的修改并不能影响到父进程。

5. 在当前环境下运行程序

我们在前面一再强调，shell 在执行一个程序的时候会先 fork 一个子进程，然后在子进程中执行程序，这实际上是 shell 为执行一个程序新建立了一个环境，然后在这个环境中执行程序，当然这个新环境继承了父进程的环境；
其实，shell 也可以不 fork 一个子进程，而是直接在当前进程下执行你的程序，shell 下有一个内建命令 source 就是为此而设计的，我们先来看看这个命令的手册：

图10：source命令的help手册

说明已经很清楚了，要说明的是 source 命令只能执行脚本文件；
我们提出的问题是，既然 source 命令是在当前 shell 下执行程序，那是不是意味着上面那个改变环境变量的脚本文件可以改变当前 shell 下的环境变量了呢？我们执行一下试试；
我们在前面执行脚本时使用的命令是：./chg_envvar.sh，我们已经解释过 "./" 的含义以及为什么要有 "./"，这次我们执行这个脚本准备用 . ./chg_envvar.sh 来执行，只是在原来命令的前面多了 ". "，点后面有个空格，其实这个 "." 就等同于 source，所以这个命令就相当于 source ./chg_envvar.sh
1

whowin@ubuntu:~$ . ./chg_envvar.sh

当我们用这种方法执行这个脚本的时候，我们发现意外出现了，整个 shell 都退出了，这是为什么呢？

这是因为在我们的脚本的最后一行有一个 exit 0 语句，正常情况下，如果我们不使用 source 去运行时，exit 会退出 shell 为这个脚本建立的子进程，所以一点问题都没有，但是当用 source 去运行这个脚本时，没有建立子进程，那么退出的就是当前 shell 进程，所以你的 shell 就没有了，因为被你运行的脚本退出了；但是如果我们不使用 exit 而使用 return 退出确实是可以解决在使用 source 命令运行的问题，但是不使用 source 运行就要出问题了，大家自己可以试一下；

那么是不是可以不写 exit 和 return 呢？当然可以，但是这不是写 shell 脚本的好习惯，因为执行完你的脚本后，可能还要执行下一个脚本，而下一个脚本可能要判断你的这个脚本的返回值，所以在写脚本时返回一个有意义的值是非常良好的习惯；

其实我们修改一下这个脚本就可以解决这个问题，这里仅提供源码，解释超出了本文涉及的内容：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16


whowin@ubuntu:~$ cat chg_envvar.sh 
#!/bin/bash

echo "Print environment variable - ENV_VAR_1"
printenv ENV_VAR_1
echo "Change ENV_VAR_1 to 'second_value'"
ENV_VAR_1="second value"
echo "Again, print environment variable - ENV_VAR_1"
printenv ENV_VAR_1

if [ $0 != "$BASH_SOURCE" ]; then
    return 0
else
    exit 0
fi
whowin@ubuntu:~$ 

用这种方法，也可以让某些必须用 source 运行的程序如果没有在 source 下运行，可以给出提示并停止运行；

现在回到正题，这个脚本能不能改变当前 shell 下的环境变量呢？答案是肯定的。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12


whowin@ubuntu:~$ export ENV_VAR_1="first value"
whowin@ubuntu:~$ printenv ENV_VAR_1
first value
whowin@ubuntu:~$ source ./chg_envvar.sh 
Print environment variable - ENV_VAR_1
first value
Change ENV_VAR_1 to 'second_value'
Again, print environment variable - ENV_VAR_1
second value
whowin@ubuntu:~$ printenv ENV_VAR_1
second value
whowin@ubuntu:~$ 

很显然，脚本 chg_envvar.sh 运行完毕后，我们发现，环境变量 ENV_VAR_1 已经发生了改变；
实际上这种方法是一种常用的方法，常被用于改变当前环境；

在嵌入式开发中，不同的开发板使用的 CPU 可能不同，这样在交叉编译时的工具链也不同，不同的开发板即便是相同的CPU也可能使用不同的工具链进行编译，比如即便是相同的CPU可能有些需要用软浮点的编译器，有些使用硬浮点的编译器，这时我们可以用上面的方法为每一个交叉编译的工具链写一个脚本，脚本中为某个指定的工具链所需的环境，然后用 source 去运行，下面是我的环境下的一个例子：
1 2 3 4 5

whowin@ubuntu:~$ cat a8.sh #!/bin/bash #A8 arm-linux-gnueabi工具链 export PATH=/home/whowin/toolschain/4.5.1/bin:$PATH whowin@ubuntu:~$

6. 结语

启动终端程序时启动了 bash 进程，使我们可以在 shell 下输入命令；
环境变量也是 shell 变量，但又与 shell 变量略有不同；
环境变量与普通 shell 变量的主要区别是环境变量会传递给新建的子进程；
环境变量和普通 shell 变量之间可以使用 export 或 declare 进行转换；
shell 可以在当前进程下运行脚本程序(不创建子进程)，这种运行方式常被用于改变当前运行环境下的环境变量。

欢迎访问我的博客：https://whowin.cn

email: hengch@163.com

donation

文章目录