在数学 里,特别是将线性代数 套用到物理 时,爱因斯坦求和约定 (Einstein summation convention )是一种标记的约定,又称为爱因斯坦标记法 (Einstein notation ),在处理关于坐标 的方程式时非常有用。这约定是由阿尔伯特·爱因斯坦 于1916年提出的[1] 。后来,爱因斯坦与友人半开玩笑地说[2] :“这是数学史上的一大发现,若不信的话,可以试着返回那不使用这方法的古板日子。”
按照爱因斯坦求和约定,当一个单独项目内有标号变量出现两次,一次是上标,一次是下标时,则必须总和所有这单独项目的可能值。通常而言,标号的标值为1、2、3(代表维度为三的欧几里得空间 ),或0、1、2、3(代表维度为四的时空 或闵可夫斯基时空 )。但是,标值可以有任意值域,甚至(在某些应用案例里)无限集合 。这样,在三维空间里,
y
=
c
i
x
i
{\displaystyle y = c_i x^i\,\!}
的意思是
y
=
∑
i
=
1
3
c
i
x
i
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
{\displaystyle y = \sum_{i=1}^3 c_i x^i = c_1 x^1 + c_2 x^2 + c_3 x^3\,\!}
。
请特别注意,上标并不是指数 ,而是标记不同坐标。例如,在直角坐标系里,
x
1
{\displaystyle x^1\,\!}
、
x
2
{\displaystyle x^2\,\!}
、
x
3
{\displaystyle x^3\,\!}
分别表示
x
{\displaystyle x\,\!}
坐标、
y
{\displaystyle y\,\!}
坐标、
z
{\displaystyle z\,\!}
坐标,而不是
x
{\displaystyle x\,\!}
、
x
{\displaystyle x\,\!}
的平方、
x
{\displaystyle x\,\!}
的立方。
简介
爱因斯坦标记法的基本点子是余向量 与向量 可以形成标量 :
y
=
c
1
x
1
+
c
2
x
2
+
c
3
x
3
+
⋯
+
c
n
x
n
{\displaystyle y = c_1 x^1+c_2x^2+c_3x^3+ \cdots + c_nx^n\,\!}
。
通常会将这写为求和公式 形式:
y
=
∑
i
=
1
n
c
i
x
i
{\displaystyle y = \sum_{i=1}^n c_ix^i\,\!}
。
在基底 变换之下,标量保持不变。当基底改变时,一个向量的线性变换 可以用矩阵 来描述,而余向量的线性变换则需用其逆矩阵 来描述。这样的设计为的是要保证,不论基底为何,伴随余向量的线性函数 (即上述总和)保持不变。由于只有总和不变,而总和所涉及的每一个项目都有可能会改变,所以,爱因斯坦提出了这标记法,重复标号表示总和,不需要用到求和符号 :
y
=
c
i
x
i
{\displaystyle y = c_i x^i \,\,\!}
采用爱因斯坦标记法,余向量都是以下标来标记,而向量都是以上标来标记。标号的位置具有特别意义。请不要将上标与指数 混淆在一起,大多数涉及的方程式都是线性,不超过变量的一次方。在方程式里,单独项目内的标号变量最多只会出现两次,假若多于两次,或出现任何其它例外,则都必须特别加以说明,才不会造成含意混淆不清。
向量的表示
在线性代数 里,采用爱因斯坦标记法,可以很容易的分辨向量和余向量 (又称为1-形式 )。向量的分量是用上标来标明,例如,
a
i
{\displaystyle a^i\,\!}
。给予一个
n
{\displaystyle n\,\!}
维向量空间
V
{\displaystyle \mathbb{V}\,\!}
和其任意基底
e
=
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle \mathbf{e}=(\mathbf{e}_1,\mathbf{e}_2,\dots,\mathbf{e}_n)\,\!}
(可能不是标准正交基 ),那么,向量
a
{\displaystyle \mathbf{a}\,\!}
表示为
a
=
a
i
e
i
=
[
a
1
a
2
⋮
a
n
]
{\displaystyle \mathbf{a}= a^i \mathbf{e}_i= \begin{bmatrix}a^1\\a^2\\\vdots\\a^n\end{bmatrix}\,\!}
。
余向量的分量是用下标来标明,例如,
α
i
{\displaystyle \alpha_i\,\!}
。给予
V
{\displaystyle \mathbb{V}\,\!}
的对偶空间
V
∗
{\displaystyle \mathbb{V}^*\,\!}
和其任意基底
ω
=
(
ω
1
,
ω
2
,
…
,
ω
n
)
{\displaystyle \boldsymbol{\omega}=(\boldsymbol{\omega}^1,\boldsymbol{\omega}^2,\dots,\boldsymbol{\omega}^n)\,\!}
(可能不是标准正交基),那么,余向量
α
{\displaystyle \boldsymbol{\alpha}\,\!}
表示为
α
=
α
i
ω
i
=
[
α
1
α
2
⋯
α
n
]
{\displaystyle \boldsymbol{\alpha}= \alpha_i \boldsymbol{\omega}^i= \begin{bmatrix}\alpha_1 & \alpha_2 & \cdots & \alpha_n\end{bmatrix}\,\!}
。
采用向量的共变和反变 术语,上标表示反变向量 (向量)。对于基底的改变,从
e
{\displaystyle \mathbf{e}\,\!}
改变为
e
¯
{\displaystyle \overline{\mathbf{e}}\,\!}
,反变向量会变换为
a
¯
i
=
∂
x
¯
i
∂
x
j
a
j
{\displaystyle {\overline{a}}^{i}= \frac{\partial {\overline{x}}^{i}}{\partial x^j} a^j\,\!}
;
其中,
a
¯
i
{\displaystyle {\overline{a}}^{i}\,\!}
是改变基底后的向量的分量,
x
¯
i
{\displaystyle {\overline{x}}^{i}\,\!}
是改变基底后的坐标,
x
j
{\displaystyle x^j\,\!}
是原先的坐标,
下标表示共变向量 (余向量)。对于基底的改变,从
ω
{\displaystyle \boldsymbol{\omega}\,\!}
改变为
ω
¯
{\displaystyle \overline{\boldsymbol{\omega}}\,\!}
,共变向量会会变换为
α
¯
i
=
∂
x
i
∂
x
¯
j
α
j
{\displaystyle \overline{\alpha}_i= \frac{\partial x^i}{\partial {\overline{x}}^{j}} \alpha_j\,\!}
。
一般运算
矩阵
A
{\displaystyle A\,\!}
的第
m
{\displaystyle m\,\!}
横排,第
n
{\displaystyle n\,\!}
竖排的元素,以前标记为
A
m
n
{\displaystyle A_{mn}\,\!}
;现在改标记为
A
n
m
{\displaystyle A_n^m\,\!}
。各种一般运算都可以用爱因斯坦标记法来表示如下:
内积
给予向量
a
{\displaystyle \mathbf{a}\,\!}
和余向量
α
{\displaystyle \boldsymbol{\alpha}\,\!}
,其向量和余向量的内积为标量:
a
⋅
α
=
a
i
α
i
{\displaystyle \mathbf{a}\cdot\boldsymbol{\alpha}=a^i \alpha_i\,\!}
。
向量乘以矩阵
给予矩阵
A
{\displaystyle A\,\!}
和向量
a
{\displaystyle \mathbf{a}\,\!}
,它们的乘积是向量
b
{\displaystyle \mathbf{b}\,\!}
:
b
i
=
A
j
i
a
j
{\displaystyle b^i=A^i_j a^j\,\!}
。
类似地,矩阵
A
{\displaystyle A\,\!}
的转置矩阵
B
=
A
T
{\displaystyle B=A^\mathrm{T}\,\!}
,其与余向量
α
{\displaystyle \boldsymbol{\alpha}\,\!}
的乘积是余向量
β
{\displaystyle \boldsymbol{\beta}\,\!}
:
β
j
=
B
j
i
α
i
=
α
i
B
j
i
{\displaystyle \beta_j=B^i_j \alpha_i=\alpha_i B^i_j\,\!}
。
矩阵乘法
矩阵乘法 表示为
C
k
i
=
A
j
i
B
k
j
{\displaystyle C^i_k = A^i_j \, B^j_k \,\!}
。
这公式等价于较冗长的普通标记法:
C
i
k
=
(
A
B
)
i
k
=
∑
j
=
1
N
A
i
j
B
j
k
{\displaystyle C_{ik} = (A \, B)_{ik} = \sum_{j=1}^N A_{ij} B_{jk}\,\!}
。
迹
给予一个方块矩阵
A
j
i
{\displaystyle A^i_j\,\!}
,总和所有上标与下标相同的元素
A
i
i
{\displaystyle A^i_i\,\!}
,可以得到这矩阵的迹
t
{\displaystyle t\,\!}
:
t
=
A
i
i
{\displaystyle t=A^i_i\,\!}
。
外积
M维向量
a
{\displaystyle \mathbf{a}\,\!}
和N维余向量
α
{\displaystyle \boldsymbol{\alpha}\,\!}
的外积 是一个M×N矩阵
A
{\displaystyle A\,\!}
:
A
=
a
α
{\displaystyle A= \mathbf{a} \, \boldsymbol{\alpha} \,\!}
。
采用爱因斯坦标记式,上述方程式可以表示为
A
j
i
=
a
i
α
j
{\displaystyle A^i_j = a^i \, \alpha_j\,\!}
由于
i
{\displaystyle i\,\!}
和
j
{\displaystyle j\,\!}
代表两个不同的标号,在这案例,值域分别为M和N,外积不会除去这两个标号,而使这两个标号变成了新矩阵
A
{\displaystyle A\,\!}
的标号。
向量的内积
一般力学 及工程学 会用互相标准正交基 的基底向量
i
^
{\displaystyle \hat{\mathbf{i}}\,\!}
、
j
^
{\displaystyle \hat{\mathbf{j}}\,\!}
及
k
^
{\displaystyle \hat{\mathbf{k}}\,\!}
来描述三维空间的向量。
u
=
u
x
i
^
+
u
y
j
^
+
u
z
k
^
{\displaystyle \mathbf{u} = u_x\hat{\mathbf{i}} + u_y\hat{\mathbf{j}} + u_z\hat{\mathbf{k}}\,\!}
。
把直角坐标系 的基底向量
i
^
{\displaystyle \hat{\mathbf{i}}\,\!}
、
j
^
{\displaystyle \hat{\mathbf{j}}\,\!}
及
k
^
{\displaystyle \hat{\mathbf{k}}\,\!}
写成
e
^
1
{\displaystyle \hat{\mathbf{e}}_1\,\!}
、
e
^
2
{\displaystyle \hat{\mathbf{e}}_2\,\!}
及
e
^
3
{\displaystyle \hat{\mathbf{e}}_3\,\!}
,所以一个向量可以写成:
u
=
u
1
e
^
1
+
u
2
e
^
2
+
u
3
e
^
3
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf{u} = u_1 \hat{\mathbf{e}}_1 + u_2 \hat{\mathbf{e}}_2 + u_3 \hat{\mathbf{e}}_3
= \sum_{i = 1}^3 u_i \hat{\mathbf{e}}_i\,\!}
。
根据爱因斯坦求和约定 ,若单项中有标号出现两次且分别位于上标及下标,则此项代表着所有可能值之总和:
u
=
u
i
e
^
i
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf{u} =u^i \hat{\mathbf{e}}_i = \sum_{i = 1}^3 u^i \hat{\mathbf{e}}_i \,\!}
。
由于基底是标准正交基,
u
{\displaystyle \mathbf{u}\,\!}
的每一个分量
u
i
=
u
i
{\displaystyle u^i= u_i \,\!}
,所以,
u
=
∑
i
=
1
3
u
i
e
^
i
{\displaystyle \mathbf{u}= \sum_{i = 1}^3 u_i \hat{\mathbf{e}}_i \,\!}
。
两个向量
u
{\displaystyle \mathbf{u}\,\!}
与
v
{\displaystyle \mathbf{v}\,\!}
的内积 是
u
⋅
v
=
(
u
i
e
^
i
)
⋅
(
v
j
e
^
j
)
=
(
∑
i
=
1
3
u
i
e
^
i
)
⋅
(
∑
j
=
1
3
v
j
e
j
)
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
(
e
^
i
⋅
e
^
j
)
{\displaystyle \mathbf{u} \cdot \mathbf{v} = (u^i\hat{\mathbf{e}}_i) \cdot (v^j
\hat{\mathbf{e}}_j) = \left( \sum_{i = 1}^3 u_i\hat{\mathbf{e}}_i \right) \cdot \left(
\sum_{j = 1}^3 v_j \mathbf{e}_j \right)=\sum_{i = 1}^3 \sum_{j = 1}^3 u_i v_j ( \hat{\mathbf{e}}_i \cdot \hat{\mathbf{e}}_j ) \,\!}
。
由于基底是标准正交基,基底向量相互正交归一:
e
^
i
⋅
e
^
j
=
δ
i
j
{\displaystyle \hat{\mathbf{e}}_i \cdot \hat{\mathbf{e}}_j = \delta_{ij} \,\!}
;
其中,
δ
i
j
{\displaystyle \ \delta_{ij}\,\!}
就是克罗内克函数 。当
i
=
j
{\displaystyle i=j\,\!}
时,则
δ
i
j
=
1
{\displaystyle \delta_{ij}=1\,\!}
,否则
δ
i
j
=
0
{\displaystyle \delta_{ij}=0\,\!}
。
逻辑上,在方程式内的任意项目,若遇到了克罗内克函数
δ
i
j
{\displaystyle \ \delta_{ij}\,\!}
,就可以把方程式中的标号
i
{\displaystyle i\,\!}
转为
j
{\displaystyle j\,\!}
或者把标号
j
{\displaystyle j\,\!}
转为
i
{\displaystyle i\,\!}
。所以,
u
⋅
v
=
∑
i
=
1
3
∑
j
=
1
3
u
i
v
j
δ
i
j
=
∑
i
=
1
3
u
i
v
i
{\displaystyle \mathbf{u} \cdot \mathbf{v} =\sum_{i = 1}^3 \sum_{j = 1}^3 u_i v_j\delta_{ij}= \sum_{i = 1}^3 u_i v_i \,\!}
。
向量的叉积
采用同样的标准正交基
e
^
1
{\displaystyle \hat{\mathbf{e}}_1\,\!}
、
e
^
2
{\displaystyle \hat{\mathbf{e}}_2\,\!}
及
e
^
3
{\displaystyle \hat{\mathbf{e}}_3\,\!}
,两个向量
u
{\displaystyle \mathbf{u}\,\!}
与
v
{\displaystyle \mathbf{v}\,\!}
的叉积 ,以方程式表示为
u
×
v
=
(
u
j
e
^
j
)
×
(
v
k
e
^
k
)
=
(
∑
j
=
1
3
u
j
e
^
j
)
×
(
∑
k
=
1
3
v
k
e
^
k
)
{\displaystyle \mathbf{u} \times \mathbf{v}= (u^j \hat{\mathbf{e}}_j ) \times (v^k
\hat{\mathbf{e}}_k)= \left( \sum_{j = 1}^3 u_j \hat{\mathbf{e}}_j \right) \times
\left( \sum_{k = 1}^3 v_k \hat{\mathbf{e}}_k \right) \,\!}
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
(
e
j
×
e
k
)
=
∑
j
=
1
3
∑
k
=
1
3
u
j
v
k
ϵ
i
j
k
e
i
{\displaystyle =\sum_{j = 1}^3 \sum_{k = 1}^3 u_j v_k (\mathbf{e}_j \times \mathbf{e}_k ) = \sum_{j = 1}^3 \sum_{k = 1}^3 u_j v_k\epsilon_{ijk} \mathbf{e}_i
\,\!}
。
注意到
e
^
j
×
e
^
k
=
ϵ
i
j
k
e
^
i
{\displaystyle \hat{\mathbf{e}}_j \times \hat{\mathbf{e}}_k = \epsilon_{ijk} \hat{\mathbf{e}}_i\,\!}
;
其中,张量
ϵ
i
j
k
{\displaystyle \ \epsilon_{ijk}\,\!}
是列维-奇维塔符号 ,定义为
ϵ
i
j
k
=
ϵ
i
j
k
=
d
e
f
{
+
1
−
1
0
{\displaystyle \epsilon_{ijk} = \epsilon^{ijk}\ \stackrel{def}{=}
\begin{cases}
+1 \\
-1 \\
0
\end{cases} \,\!}
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
1
,
2
,
3
}
{\displaystyle \{1,2,3\}\,\!}
、
{
2
,
3
,
1
}
{\displaystyle \{2,3,1\}\,\!}
或
{
3
,
1
,
2
}
{\displaystyle \{3,1,2\}\,\!}
(偶置换 )
,若
(
i
,
j
,
k
)
=
{\displaystyle (i,j,k)=\,\!}
{
3
,
2
,
1
}
{\displaystyle \{3,2,1\}\,\!}
、
{
2
,
1
,
3
}
{\displaystyle \{2,1,3\}\,\!}
或
{
1
,
3
,
2
}
{\displaystyle \{1,3,2\}\,\!}
(奇置换)
,若
i
=
j
{\displaystyle i=j\,\!}
、
j
=
k
{\displaystyle j=k\,\!}
或
i
=
k
{\displaystyle i=k\,\!}
所以,
u
×
v
=
(
u
2
v
3
−
u
3
v
2
)
e
^
1
+
(
u
3
v
1
−
u
1
v
3
)
e
^
2
+
(
u
1
v
2
−
u
2
v
1
)
e
^
3
{\displaystyle \mathbf{u} \times \mathbf{v} = (u^2 v^3 - u^3 v^2) \hat{\mathbf{e}}_1 + (u^3 v^1 - u^1 v^3) \hat{\mathbf{e}}_2 + (u^1 v^2 - u^2 v^1) \hat{\mathbf{e}}_3\,\!}
。
设定
w
=
u
×
v
{\displaystyle \mathbf{w} = \mathbf{u} \times \mathbf{v}\,\!}
,那么,
w
i
e
^
i
=
ϵ
i
j
k
u
j
v
k
e
^
i
{\displaystyle w^i \hat{\mathbf{e}}_i= \epsilon^{ijk} u_j v_k\hat{\mathbf{e}}_i \,\!}
。
所以,
w
i
=
ϵ
i
j
k
u
j
v
k
{\displaystyle \ w^i = \epsilon^{ijk} u_j v_k \,\!}
。
向量的共变分量和反变分量
在欧几里得空间
V
{\displaystyle \mathbb{V}\,\!}
里,共变向量和反变向量之间的区分很小。这是因为能够使用内积 运算从向量求得余向量;对于所有向量
b
{\displaystyle \mathbf{b}\,\!}
,通过下述方程式,向量
a
{\displaystyle \mathbf{a}\,\!}
唯一地确定了余向量
α
{\displaystyle \boldsymbol{\alpha}\,\!}
:
α
(
b
)
=
a
⋅
b
{\displaystyle \boldsymbol{\alpha}(\mathbf{b})=\mathbf{a}\cdot\mathbf{b}\,\!}
。
逆过来,通过上述方程式,每一个余向量
α
{\displaystyle \boldsymbol{\alpha} \,\!}
唯一地确定了向量
a
{\displaystyle \mathbf{a}\,\!}
。由于这向量与余向量的相互辨认,我们可以提到向量的共变分量和反变分量;也就是说,它们只是同样向量对于基底和其对偶基底的不同表现。
给予
V
{\displaystyle \mathbb{V}\,\!}
的一个基底
f
=
(
X
1
,
X
2
,
…
,
X
n
)
{\displaystyle \mathfrak{f}=(X_1,X_2,\dots,X_n)\,\!}
,则必存在一个唯一的对偶基底
f
♯
=
(
Y
1
,
Y
2
,
…
,
Y
n
)
{\displaystyle \mathfrak{f}^{\sharp}=(Y^1,Y^2,\dots,Y^n)\,\!}
,满足
Y
i
⋅
X
j
=
δ
j
i
{\displaystyle Y^i \cdot X_j = \delta^i_j\,\!}
;
其中,张量
δ
j
i
{\displaystyle \delta^i_j\,\!}
是克罗内克函数 。
以这两种基底,任意向量
a
{\displaystyle \mathbf{a}\,\!}
可以写为两种形式
a
=
∑
i
a
i
[
f
]
X
i
=
f
a
[
f
]
=
∑
i
a
i
[
f
]
Y
i
=
f
♯
a
[
f
♯
]
{\displaystyle \begin{align}
\mathbf{a} &= \sum_i a^i[\mathfrak{f}]X_i = \mathfrak{f}\,\mathbf{a}[\mathfrak{f}]\\
&=\sum_i a_i[\mathfrak{f}]Y^i = \mathfrak{f}^\sharp\,\mathbf{a}[\mathfrak{f}^\sharp]
\end{align}
\,\!}
;
其中,
a
i
[
f
]
{\displaystyle a^i[\mathfrak{f}]\,\!}
是向量
a
{\displaystyle \mathbf{a}\,\!}
对于基底
f
{\displaystyle \mathfrak{f}\,\!}
的反变分量,
a
i
[
f
]
{\displaystyle a_i[\mathfrak{f}]\,\!}
是向量
v
{\displaystyle \mathbf{v}\,\!}
对于基底
f
{\displaystyle \mathfrak{f}\,\!}
的共变分量,
欧几里得空间
将向量
a
{\displaystyle \mathbf{a}\,\!}
投影 于坐标轴
e
i
{\displaystyle \mathbf{e}^i\,\!}
,可以求得其反变分量
a
i
{\displaystyle a^i\,\!}
;将向量
a
{\displaystyle \mathbf{a}\,\!}
投影于坐标曲面 的法线
e
i
{\displaystyle \mathbf{e}_i\,\!}
,可以求得其共变分量
a
i
{\displaystyle a_i\,\!}
。
在欧几里得空间
R
3
{\displaystyle \mathbb{R}^3\,\!}
里,使用内积 运算,能够从向量求得余向量。给予一个可能不是标准正交基 的基底,其基底向量为
e
1
{\displaystyle \mathbf{e}_1\,\!}
、
e
2
{\displaystyle \mathbf{e}_2\,\!}
、
e
3
{\displaystyle \mathbf{e}_3\,\!}
,就可以计算其对偶基底的基底向量:
e
1
=
e
2
×
e
3
τ
;
e
2
=
e
3
×
e
1
τ
;
e
3
=
e
1
×
e
2
τ
{\displaystyle \mathbf{e}^1 = \frac{\mathbf{e}_2 \times \mathbf{e}_3}{\tau} ; \qquad \mathbf{e}^2 = \frac{\mathbf{e}_3 \times \mathbf{e}_1}{\tau}; \qquad \mathbf{e}^3 = \frac{\mathbf{e}_1 \times \mathbf{e}_2}{\tau}\,\!}
;
其中,
τ
=
e
1
⋅
(
e
2
×
e
3
)
{\displaystyle \tau=\mathbf{e}_1\cdot(\mathbf{e}_2 \times \mathbf{e}_3)\,\!}
是基底向量
e
1
{\displaystyle \mathbf{e}_1\,\!}
、
e
2
{\displaystyle \mathbf{e}_2\,\!}
、
e
3
{\displaystyle \mathbf{e}_3\,\!}
共同形成的平行六面体 的体积。
反过来计算,
e
1
=
e
2
×
e
3
τ
′
;
e
2
=
e
3
×
e
1
τ
′
;
e
3
=
e
1
×
e
2
τ
′
{\displaystyle \mathbf{e}_1 = \frac{\mathbf{e}^2 \times \mathbf{e}^3}{\tau'} ; \qquad \mathbf{e}_2 = \frac{\mathbf{e}^3 \times \mathbf{e}^1}{\tau'}; \qquad \mathbf{e}_3 = \frac{\mathbf{e}^1 \times \mathbf{e}^2}{\tau'}\,\!}
;
其中,
τ
′
=
e
1
⋅
(
e
2
×
e
3
)
=
1
/
τ
{\displaystyle \tau'=\mathbf{e}^1\cdot(\mathbf{e}^2 \times \mathbf{e}^3)=1/\tau\,\!}
是基底向量
e
1
{\displaystyle \mathbf{e}^1\,\!}
、
e
2
{\displaystyle \mathbf{e}^2\,\!}
、
e
3
{\displaystyle \mathbf{e}^3\,\!}
共同形成的平行六面体的体积。
虽然
e
i
{\displaystyle \mathbf{e}_i\,\!}
与
e
j
{\displaystyle \mathbf{e}^j\,\!}
并不相互标准正交,它们相互对偶:
e
i
⋅
e
j
=
δ
i
j
{\displaystyle \mathbf{e}_i \cdot \mathbf{e}^j = \delta_i^j\,\!}
。
虽然
e
i
{\displaystyle \mathbf{e}^i\,\!}
与
e
j
{\displaystyle \mathbf{e}_j\,\!}
并不相互标准正交,它们相互对偶:
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf{e}^i \cdot \mathbf{e}_j = \delta^i_j\,\!}
。
这样,任意向量
a
{\displaystyle \mathbf{a}\,\!}
的反变分量为
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a^1 = \mathbf{a} \cdot \mathbf{e}^1; \qquad a^2 = \mathbf{a} \cdot \mathbf{e}^2; \qquad a^3 = \mathbf{a} \cdot \mathbf{e}^3\,\!}
。
类似地,共变分量为
a
1
=
a
⋅
e
1
;
a
2
=
a
⋅
e
2
;
a
3
=
a
⋅
e
3
{\displaystyle a_1 = \mathbf{a} \cdot \mathbf{e}_1; \qquad a_2 = \mathbf{a} \cdot \mathbf{e}_2; \qquad a_3 = \mathbf{a} \cdot \mathbf{e}_3\,\!}
。
这样,
a
{\displaystyle \mathbf{a}\,\!}
可以表示为
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf{a} = a_i \mathbf{e}^i = a_1 \mathbf{e}^1 + a_2 \mathbf{e}^2 + a_3 \mathbf{e}^3 \,\!}
,
或者,
a
=
a
i
e
i
=
a
1
e
1
+
a
2
e
2
+
a
3
e
3
{\displaystyle \mathbf{a} = a^i \mathbf{e}_i = a^1 \mathbf{e}_1 + a^2 \mathbf{e}_2 + a^3 \mathbf{e}_3\,\!}
。
综合上述关系式,
a
=
(
a
⋅
e
i
)
e
i
=
(
a
⋅
e
i
)
e
i
{\displaystyle \mathbf{a} = (\mathbf{a} \cdot \mathbf{e}_i) \mathbf{e}^i = (\mathbf{a} \cdot \mathbf{e}^i) \mathbf{e}_i \,\!}
。
向量
a
{\displaystyle \mathbf{a}\,\!}
的共变分量为
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a_i = \mathbf{a}\cdot \mathbf{e}_i = (a^j \mathbf{e}_j)\cdot \mathbf{e}_i = (\mathbf{e}_j\cdot\mathbf{e}_i) a^j=g_{ji}a^j\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g_{ji}=\mathbf{e}_j\cdot\mathbf{e}_i\,\!}
是度规张量 。
向量
a
{\displaystyle \mathbf{a}\,\!}
的反变分量为
a
i
=
a
⋅
e
i
=
(
a
j
e
j
)
⋅
e
i
=
(
e
j
⋅
e
i
)
a
j
=
g
j
i
a
j
{\displaystyle a^i = \mathbf{a}\cdot \mathbf{e}^i = (a_j \mathbf{e}^j)\cdot \mathbf{e}^i = (\mathbf{e}^j\cdot\mathbf{e}^i) a_j =g^{ji}a_j\,\!}
;
其中,
g
j
i
=
e
j
⋅
e
i
{\displaystyle g^{ji}=\mathbf{e}^j\cdot\mathbf{e}^i\,\!}
是共轭度规张量 。
共变分量的标号是下标,反变分量的标号是上标。假若共变基底向量组成的基底是标准正交基,或反变基底向量组成的基底是标准正交基,则共变基底与反变基底相互等价。那么,就没有必要分辨共变分量和反变分量,所有的标号都可以用下标来标记。
抽象定义
思考维度为
n
{\displaystyle n\,\!}
的向量空间
V
{\displaystyle \mathbb{V}\,\!}
。给予一个可能不是标准正交基的基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf{e}_1,\mathbf{e}_2,\dots,\mathbf{e}_n)\,\!}
。那么,在
V
{\displaystyle \mathbb{V}\,\!}
内的向量
v
{\displaystyle \mathbf{v}\,\!}
,对于这基底,其分量为
v
1
{\displaystyle v^1\,\!}
、
v
2
{\displaystyle v^2\,\!}
、...
v
n
{\displaystyle v^n\,\!}
。以方程式表示,
v
=
v
i
e
i
.
{\displaystyle \mathbf{v} = v^i\mathbf{e}_i.\,\!}
。
在这方程式右手边,标号
i
{\displaystyle i\,\!}
在同一项目出现了两次,一次是上标,一次是下标,因此,从
i
{\displaystyle i\,\!}
等于
1
{\displaystyle 1\,\!}
到
n
{\displaystyle n\,\!}
,这项目的每一个可能值都必须总和在一起。
爱因斯坦约定的优点是,它可以应用于从
V
{\displaystyle \mathbb{V}\,\!}
用张量积 和对偶性 建立的向量空间。例如,
V
⊗
V
{\displaystyle \mathbb{V}\otimes \mathbb{V}\,\!}
,
V
{\displaystyle \mathbb{V}\,\!}
与自己的张量积,拥有由形式为
e
i
j
=
e
i
⊗
e
j
{\displaystyle \mathbf{e}_{ij} = \mathbf{e}_i \otimes \mathbf{e}_j\,\!}
的张量组成的基底。任意在
V
⊗
V
{\displaystyle \mathbb{V}\otimes \mathbb{V}\,\!}
内的张量
T
{\displaystyle \mathbf{T}\,\!}
可以写为
T
=
T
i
j
e
i
j
{\displaystyle \mathbf{T} = T^{ij}\mathbf{e}_{ij}\,\!}
。
向量空间
V
{\displaystyle \mathbb{V}\,\!}
的对偶空间
V
∗
{\displaystyle \mathbb{V}^*\,\!}
拥有基底
(
e
1
,
e
2
,
…
,
e
n
)
{\displaystyle (\mathbf{e}^1,\mathbf{e}^2,\dots,\mathbf{e}^n)\,\!}
,遵守规则
e
i
⋅
e
j
=
δ
j
i
{\displaystyle \mathbf{e}^i \cdot\mathbf{e}_j = \delta^i_j\,\!}
;
其中,
δ
j
i
{\displaystyle \delta^i_j\,\!}
是克罗内克函数 。
范例
为了更明确地解释爱因斯坦求和约定,在这里给出几个简单的例子。
思考四维时空,标号的值是从0到3。两个张量,经过张量缩并 (tensor contraction )运算后,变为一个标量:
c
=
a
μ
b
μ
=
a
0
b
0
+
a
1
b
1
+
a
2
b
2
+
a
3
b
3
{\displaystyle c=a^\mu b_\mu = a^0 b_0 + a^1 b_1 + a^2 b_2 + a^3 b_3\,\!}
。
c
ν
=
a
μ
ν
b
μ
+
f
ν
=
a
0
ν
b
0
+
a
1
ν
b
1
+
a
2
ν
b
2
+
a
3
ν
b
3
+
f
ν
{\displaystyle c^\nu=a^{\mu\nu} b_\mu +f^\nu= a^{0\nu} b_0 + a^{1\nu} b_1 + a^{2\nu} b_2 + a^{3\nu} b_3+f^\nu\,\!}
。
由于运算结果与标号
μ
{\displaystyle \mu\,\!}
和
ν
{\displaystyle \nu\,\!}
无关,可以被其它标号随意更换,所以,
μ
{\displaystyle \mu\,\!}
和
ν
{\displaystyle \nu\,\!}
称为傀标号 。
自由标号 是没有被总和的标号。自由标号应该出现于方程式的每一个项目里,而且在每一个项目里只出现一次。在上述方程式里,
ν
{\displaystyle \nu\,\!}
是自由标号,每一个项目都必须有同样的自由标号。注意到在项目
a
μ
ν
b
μ
{\displaystyle a^{\mu\nu} b_\mu\,\!}
里,标号
μ
{\displaystyle \mu\,\!}
出现了两次,一次是上标,一次是下标,所以,这项目的所有可能值都必须总和在一起。称
μ
{\displaystyle \mu\,\!}
为求和标号 。
思考在黎曼空间 的弧线元素长度
d
s
{\displaystyle ds\,\!}
:
d
s
2
=
g
i
j
d
x
i
d
x
j
=
g
0
j
d
x
0
d
x
j
+
g
1
j
d
x
1
d
x
j
+
g
2
j
d
x
2
d
x
j
+
g
3
j
d
x
3
d
x
j
{\displaystyle ds^2=g_{ij}dx^i dx^j=g_{0j}dx^0 dx^j+g_{1j}dx^1 dx^j+g_{2j}dx^2 dx^j+g_{3j}dx^3 dx^j\,\!}
。请将这两种标号跟自由变量和约束变量 相比较。
进一步扩展,
d
s
2
=
g
00
d
x
0
d
x
0
+
g
10
d
x
1
d
x
0
+
g
20
d
x
2
d
x
0
+
g
30
d
x
3
d
x
0
{\displaystyle ds^2=g_{00}dx^0 dx^0+g_{10}dx^1 dx^0+g_{20}dx^2 dx^0+g_{30}dx^3 dx^0\,\!}
+
g
01
d
x
0
d
x
1
+
g
11
d
x
1
d
x
1
+
g
21
d
x
2
d
x
1
+
g
31
d
x
3
d
x
1
{\displaystyle \qquad +g_{01}dx^0 dx^1+g_{11}dx^1 dx^1+g_{21}dx^2 dx^1+g_{31}dx^3 dx^1\,\!}
+
g
02
d
x
0
d
x
2
+
g
12
d
x
1
d
x
2
+
g
22
d
x
2
d
x
2
+
g
32
d
x
3
d
x
2
{\displaystyle \qquad +g_{02}dx^0 dx^2+g_{12}dx^1 dx^2+g_{22}dx^2 dx^2+g_{32}dx^3 dx^2\,\!}
+
g
03
d
x
0
d
x
3
+
g
13
d
x
1
d
x
3
+
g
23
d
x
2
d
x
3
+
g
33
d
x
3
d
x
3
{\displaystyle \qquad +g_{03}dx^0 dx^3+g_{13}dx^1 dx^3+g_{23}dx^2 dx^3+g_{33}dx^3 dx^3\,\!}
。
注意到
d
s
2
{\displaystyle ds^2\,\!}
是
d
s
{\displaystyle ds\,\!}
乘以
d
s
{\displaystyle ds\,\!}
,是
(
d
s
)
2
{\displaystyle (ds)^2\,\!}
,而不是
(
s
2
)
{\displaystyle (s^2)\,\!}
坐标的微小元素。当有疑虑时,可以用括号 来分歧义。
参阅
参考文献
↑ Einstein, Albert, The Foundation of the General Theory of Relativity (PDF ) , Annalen der Physik, 1916 [2006-09-03 ]
↑ Byron, Frederick; Fuller, Robert, Mathematics of classical and quantum physics, Courier Dover Publications: pp. 5, 1992, ISBN 9780486671642
外部链接