添加的内容 删除的内容
小 (机器人:自动替换模板(来源模板)) |
(// Edit via Wikiplus) |
||
(未显示3个用户的6个中间版本) | |||
第12行: | 第12行: | ||
|name = ''m''-by-''n'' matrix |
|name = ''m''-by-''n'' matrix |
||
|cn = <math>m</math>行<math>n</math>列矩阵 |
|cn = <math>m</math>行<math>n</math>列矩阵 |
||
|tw = <math>m</math>列<math>n</math>行矩 |
|tw = <math>m</math>列<math>n</math>行矩阵 |
||
}} |
}} |
||
{{各地中文名 |
{{各地中文名 |
||
第24行: | 第24行: | ||
|tw = 行 |
|tw = 行 |
||
}} |
}} |
||
{{Image|zh-hans=Matrix zh-hans.png|zh-hant=Matrix zh-hant.png|thumb|247px|矩 |
{{Image|zh-hans=Matrix zh-hans.png|zh-hant=Matrix zh-hant.png|thumb|247px|矩阵}} |
||
[[ |
[[数学]]上,一个<math>m \times n</math>的'''矩阵'''是一个由<math>m</math>-{zh-cn:行; zh-tw:列;}-(row)<math>n</math>-{zh-cn:列; zh-tw:行;}-(column)元素排列成的[[矩形]]阵列。矩阵{{里}}的元素可以是[[数|数字]]、[[符号]]或数学式。 |
||
:<math>\begin{bmatrix} a_{1 1} & a_{1 2} & a_{1 3} & \dots & a_{1 j} & \dots & a_{1 n} \\ a_{2 1} & a_{2 2} & a_{2 3} & \dots & a_{2 j} & \dots & a_{2 n} \\ a_{3 1} & a_{3 2} & a_{3 3} & \dots & a_{3 j} & \dots & a_{3 n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i 1} & a_{i 2} & a_{i 3} & \dots & a_{i j} & \dots & a_{i n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots\\ a_{m 1} & a_{n 2} & a_{m 3} & \dots & a_{m j} & \dots & a_{m n}\end{bmatrix}</math> |
:<math>\begin{bmatrix} a_{1 1} & a_{1 2} & a_{1 3} & \dots & a_{1 j} & \dots & a_{1 n} \\ a_{2 1} & a_{2 2} & a_{2 3} & \dots & a_{2 j} & \dots & a_{2 n} \\ a_{3 1} & a_{3 2} & a_{3 3} & \dots & a_{3 j} & \dots & a_{3 n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i 1} & a_{i 2} & a_{i 3} & \dots & a_{i j} & \dots & a_{i n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots\\ a_{m 1} & a_{n 2} & a_{m 3} & \dots & a_{m j} & \dots & a_{m n}\end{bmatrix}</math> |
||
第32行: | 第32行: | ||
大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,[[当且仅当]]第一个矩阵的-{zh-cn:列; zh-tw:行;}-数等于第二个矩阵的-{zh-cn:行; zh-tw:列;}-数。矩阵的乘法满足[[结合律]]和[[分配律]],但不满足[[交换律]]。 |
大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,[[当且仅当]]第一个矩阵的-{zh-cn:列; zh-tw:行;}-数等于第二个矩阵的-{zh-cn:行; zh-tw:列;}-数。矩阵的乘法满足[[结合律]]和[[分配律]],但不满足[[交换律]]。 |
||
矩阵的一个重要用途是解[[线性方程组]]。线性方程组中未知量的[[系数]]可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示[[线性变换]],即是诸如<math>f(x)=4x</math>之类的[[ |
矩阵的一个重要用途是解[[线性方程组]]。线性方程组中未知量的[[系数]]可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示[[线性变换]],即是诸如<math>f(x)=4x</math>之类的[[线性函数]]的推广。设定[[基底]]后,某个向量<math>\mathrm{v}</math>可以表示为<math>m \times 1</math>的矩阵,而线性变换<math>f</math>可以表示为-{zh-cn:列; zh-tw:行;}-数为<math>m</math>的矩阵<math>A</math>,使得经过变换后得到的向量<math>f(\mathrm{v})</math>可以表示成<math>A\mathrm{v}</math>的形式。矩阵的[[特征值]]和[[特征向量]]可以揭示线性变换的深层特性。 |
||
矩 |
矩阵是高等代数学中的常见工具,也常见于[[统计学|统计]]分析等[[应用数学]]学科中。在[[物理学]]中,矩阵在[[力学]]、[[电路学]]、[[光学]]和[[量子力学|量子物理]]等领域中都有应用;[[计算机科学]]中,[[三维动画]]制作也需要用到矩阵。矩阵的运算是[[数值分析]]领域的重要问题。将[[矩阵分解]]为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如[[稀疏矩阵]]和[[准对角矩阵]],有特定的快速运算[[算法]]。关于矩阵相关理论的发展和应用,请参考[[矩阵理论]]。在[[天体物理学|天体物理]]、[[量子力学]]等领域,也会出现无穷维的矩阵,是矩阵的一种推广。 |
||
== 词源 == |
== 词源 == |
||
中文中矩阵的概念最早见于1922年。1922年,[[北京师范大学附属中学]] |
中文中矩阵的概念最早见于1922年。1922年,[[北京师范大学附属中学]]数学老师[[程廷熙]]在一篇介绍文章中将矩阵译为“纵横阵”。1925年,科学名词审查会算学名词审查组在《科学》第十卷第四期刊登的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。1949年,中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,[[中国自然科学名词审定委员会]]公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今<ref name="hist"/>。 |
||
== |
== 发展 == |
||
作 |
作为解決线性方程的工具,矩阵也有不短的历史。成书最迟在[[东汉]]前期的《[[九章算术]]》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可视为矩阵的雏形<ref>{{Harvard citations |last1=Shen |last2=Crossley |last3=Lun |year=1999 |nb=yes }}</ref>。矩阵正式作为数学中的研究对象出现,则是在[[行列式]]的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在历史上则恰好相反。日本数学家[[关孝和]](1683年)与微积分的发现者之一[[戈特弗里德·威廉·莱布尼茨]](1693年)近乎同时独立建立了[[行列式|行列式论]]。其后行列式作为解线性方程组的工具逐步发展。1750年,[[加布里尔·克拉默]]发现了[[克莱姆法则]]<ref name="autogenerated2002">{{Harvard citations |last1=克莱因|year=2002 |nb=yes |loc=第33章第4节}}</ref>。 |
||
[[File:Arthur Cayley.jpg| |
[[File:Arthur Cayley.jpg|thumb|180px|阿瑟·凯莱被认为是矩阵论的奠基人]] |
||
进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。[[ |
进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。[[奥古斯丁·路易·柯西]]是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论<ref>{{Harvard citations |last1=Hawkins |year=1975 |nb=yes }}</ref>。其后,[[詹姆斯·约瑟夫·西尔维斯特]]注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容<ref name="autogenerated2002"/>。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的[[子式]],即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母-{}-体”: |
||
{{quote|width=70% |
{{quote|width=70% |
||
|我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母-{}-体的子宫中孕育出来一样。<ref>The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, |
|我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母-{}-体的子宫中孕育出来一样。<ref>The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, Paper 37, p. 247</ref>}} |
||
[[阿瑟·凯莱]]被公认为矩阵论的奠基人<ref name="autogenerated2002"/>。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过[[四元数]]而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。<ref name="autogenerated2002"/>”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文<ref>{{Harvard citations |last1=Cayley |year=1889 |nb=yes |loc=vol. II, p. 475–496 }}</ref><ref>{{Harvard citations |editor1-last=Dieudonné |year=1978 |loc=Vol. 1, Ch. III, p. 96 |nb=yes }}</ref>,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的<ref name="autogenerated2002"/>。 |
[[阿瑟·凯莱]]被公认为矩阵论的奠基人<ref name="autogenerated2002"/>。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过[[四元数]]而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。<ref name="autogenerated2002"/>”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文<ref>{{Harvard citations |last1=Cayley |year=1889 |nb=yes |loc=vol. II, p. 475–496 }}</ref><ref>{{Harvard citations |editor1-last=Dieudonné |year=1978 |loc=Vol. 1, Ch. III, p. 96 |nb=yes }}</ref>,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的<ref name="autogenerated2002"/>。 |
||
第60行: | 第60行: | ||
3 & 9 & 2 \\ |
3 & 9 & 2 \\ |
||
6 & 0 & 7 \end{bmatrix}</math> |
6 & 0 & 7 \end{bmatrix}</math> |
||
排列成的形状是矩形,所以称为矩阵。在[[中 |
排列成的形状是矩形,所以称为矩阵。在[[中国大陆]],橫向的元素组称为“-{行}-”,縱向称为“-{列}-”,而在[[台湾]]则相反,橫向称为“-{列}-”,縱向称为“-{行}-”<ref name="zjh">{{cite book|author=周建华|title=《矩阵》|year=2002|publisher=中央图书出版社|location=台湾|isbn=9789576374913|language=zh}}</ref>。矩阵一般用大写[[拉丁字母]]表示,需要具体写出其中元素时,一般用方括号或圆括号括起。以上的矩阵<math>\mathbf{A}</math>是一个4-{zh-cn:行; zh-tw:列;}-3-{zh-cn:列; zh-tw:行;}-的矩阵。 |
||
行数是1或列数是1的矩阵又可分别称为[[行向量 |
行数是1或列数是1的矩阵又可分别称为[[行向量与列向量|'''行向量'''和'''列向量''']]。这是因为一个[[向量]]可以表示成行数或列数是1的矩阵形式。矩阵的任一行/列都是一个行/列向量,例如矩阵<math>\mathbf{A}</math>的第一-{zh-cn:行; zh-tw:列;}-<math>\begin{bmatrix} |
||
9 & 13 & 5 \end{bmatrix}</math>就是一个-{zh-cn:行; zh-tw:列;}-向量。行/列向量可以看成一个向量,因此可以称矩阵的两行/列相等,或者某一行等于某一列,表示其对应的向量相等。 |
9 & 13 & 5 \end{bmatrix}</math>就是一个-{zh-cn:行; zh-tw:列;}-向量。行/列向量可以看成一个向量,因此可以称矩阵的两行/列相等,或者某一行等于某一列,表示其对应的向量相等。 |
||
=== 标记 === |
=== 标记 === |
||
一个矩阵<math>\mathbf{A}</math> |
一个矩阵<math>\mathbf{A}</math>从左上角数起的第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math>-{zh-cn:列; zh-tw:行;}-上的元素称为第<math>i,j</math>项,通常记为<math>\mathbf{A}_{i,j}</math>、<math>\mathbf{A}_{i j}</math>、<math>\mathrm{a}_{i j}</math>或<math>\mathbf{A}_{[i,j]}</math>。在上述例子中<math>\mathbf{A}_{4,3}=7</math>。如果不知道矩阵<math>\mathbf{A}</math>的具体元素,通常也会将它记成<math>\mathbf{A} = [\mathbf{a}_{i j}]_{m \times n}</math>或<math>\mathbf{A} = [\mathbf{a}_{i,j}]_{m \times n}</math>。反之,如果<math>\mathbf{A}</math>的元素可以写成只与其-{zh-cn:行; zh-tw:列;}-数<math>i</math>和-{zh-cn:列; zh-tw:行;}-数<math>j</math>有关的统一函数<math>f</math>,那么也可以用<math>\mathbf{A} = \left[ f(i,j) \right]_{m \times n}</math>作为<math>\mathbf{A}</math>的简写。例如<math>\mathbf{B} = \left[ i+2j \right]_{2 \times 3}</math>是矩阵 |
||
::<math>\mathbf{B} = \begin{bmatrix} |
::<math>\mathbf{B} = \begin{bmatrix} |
||
第74行: | 第74行: | ||
的简写。要注意的是,在计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵<math>\mathbf{B}</math>就要改写成<math>\mathbf{B} = \left[ i+2j+3 \right]_{2 \times 3}</math>。 |
的简写。要注意的是,在计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵<math>\mathbf{B}</math>就要改写成<math>\mathbf{B} = \left[ i+2j+3 \right]_{2 \times 3}</math>。 |
||
矩阵的元素可以是数字、符号或数学表达式。一般为了-{zh-cn:支持; zh-tw:支援;}-矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个[[环 (代数)|环]]{{里}}的元素。最常见的是元素属于[[实数]]域或[[复数 (数学)|复数]]域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环<math>\mathbf{R}</math>,所有由<math>\mathbf{R}</math>中元素排成的<math>m \times n</math>矩 |
矩阵的元素可以是数字、符号或数学表达式。一般为了-{zh-cn:支持; zh-tw:支援;}-矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个[[环 (代数)|环]]{{里}}的元素。最常见的是元素属于[[实数]]域或[[复数 (数学)|复数]]域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环<math>\mathbf{R}</math>,所有由<math>\mathbf{R}</math>中元素排成的<math>m \times n</math>矩阵的[[集合 (数学)|集合]]写作<math>\mathcal{M}(m,n,\mathbf{R})</math>或<math>\mathcal{M}_{m \times n}(\mathbf{R})</math>。若<math>m=n</math>,则通常记以<math>\mathcal{M}(m,\mathbf{R})</math>或<math>\mathcal{M}_m (\mathbf{R})</math>,称其为<math>n</math>维矩阵或[[方块矩阵|方阵]]。 |
||
== 矩 |
== 矩阵的基本运算 == |
||
{{main|矩阵加法|转置矩阵|初等矩阵}} |
{{main|矩阵加法|转置矩阵|初等矩阵}} |
||
矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose) }}</ref>,其中最基本最常用的定义如下: |
矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose) }}</ref>,其中最基本最常用的定义如下: |
||
第87行: | 第87行: | ||
|- |
|- |
||
| style="text-align: center;" | 加(减)法 |
| style="text-align: center;" | 加(减)法 |
||
|<math>m \times n</math>矩 |
|<math>m \times n</math>矩阵<math>\mathbf{A}</math>和<math>\mathbf{B}</math>的和(差):<math>\mathbf{A}\pm\mathbf{B}</math>为一个<math>m \times n</math>矩阵,其中每个元素是<math>\mathbf{A}</math>和<math>\mathbf{B}</math>相应元素的和(差), |
||
:<math>(\mathbf{A}\pm\mathbf{B})_{i,j}=\mathbf{A}_{i,j}\pm\mathbf{B}_{i,j}</math>, |
:<math>(\mathbf{A}\pm\mathbf{B})_{i,j}=\mathbf{A}_{i,j}\pm\mathbf{B}_{i,j}</math>, |
||
第115行: | 第115行: | ||
|- |
|- |
||
| style="text-align: center;" | 数乘 |
| style="text-align: center;" | 数乘 |
||
| 标量<math>c</math>与矩 |
| 标量<math>c</math>与矩阵<math>\mathbf{A}</math>的数乘:<math>c \mathbf{A}</math>的每个元素是<math>\mathbf{A}</math>的相应元素与<math>c</math>的乘积, |
||
:<math>(c \mathbf{A})_{i,j}=c\cdot\mathbf{A}_{i,j}</math> |
:<math>(c \mathbf{A})_{i,j}=c\cdot\mathbf{A}_{i,j}</math> |
||
第157行: | 第157行: | ||
:<math>c(\mathbf{A}+\mathbf{B})=c\mathbf{A}+c\mathbf{B}</math> |
:<math>c(\mathbf{A}+\mathbf{B})=c\mathbf{A}+c\mathbf{B}</math> |
||
矩阵加法和数乘 |
矩阵加法和数乘两种运算使得<math>\mathcal{M}(m,n,\mathbb{R})</math>成为一个<math>m n</math>维的实数[[线性空间]]。而转置和数乘运算满足类似于结合律的规律: |
||
:<math>c(\mathbf{A}^\mathrm{T})=c(\mathbf{A})^\mathrm{T}</math> |
:<math>c(\mathbf{A}^\mathrm{T})=c(\mathbf{A})^\mathrm{T}</math> |
||
第164行: | 第164行: | ||
== 矩阵乘法 == |
== 矩阵乘法 == |
||
{{main|矩阵乘法}} |
{{main|矩阵乘法}} |
||
[[File:Matrix multiplication diagram 2.svg| |
[[File:Matrix multiplication diagram 2.svg|thumb|239x239px|矩阵{{math|'''A'''}}和{{math|'''B'''}}相乘得到{{math|'''AB'''}}的示意图|替代=]] |
||
两个矩阵的乘法仅当第一个矩 |
两个矩阵的乘法仅当第一个矩阵<math>\mathbf{A}</math>的-{zh-cn:列; zh-tw:行;}-数(column)和另一个矩阵<math>\mathbf{B}</math>的-{zh-cn:行; zh-tw:列;}-数(row)相等时才能定义。如<math>\mathbf{A}</math>是<math>m \times n</math>矩阵和<math>\mathbf{B}</math>是<math>n \times p</math>矩阵,它们的'''乘积'''<math>\mathbf{AB}</math>是一个<math>m \times p</math>矩阵,它的一个元素 |
||
:<cite id=matrix_product><math> [\mathbf{AB}]_{i,j} = A_{i,1}B_{1,j} + A_{i,2}B_{2,j} + \cdots + A_{i,n}B_{n,j} = \sum_{r=1}^n A_{i,r}B_{r,j}</math></cite> |
:<cite id=matrix_product><math> [\mathbf{AB}]_{i,j} = A_{i,1}B_{1,j} + A_{i,2}B_{2,j} + \cdots + A_{i,n}B_{n,j} = \sum_{r=1}^n A_{i,r}B_{r,j}</math></cite> |
||
第202行: | 第202行: | ||
:<math>(\mathbf{AB})^\mathrm{T}=\mathbf{B}^\mathrm{T}\mathbf{A}^\mathrm{T}</math> |
:<math>(\mathbf{AB})^\mathrm{T}=\mathbf{B}^\mathrm{T}\mathbf{A}^\mathrm{T}</math> |
||
矩阵乘法'''不满足'''[[交换律]]。一般来说,矩 |
矩阵乘法'''不满足'''[[交换律]]。一般来说,矩阵<math>\mathbf{A}</math>及<math>\mathbf{B}</math>的乘积<math>\mathbf{AB}</math>存在,但<math>\mathbf{BA}</math>不一定存在,即使存在,大多数时候<math>\mathbf{AB}\neq\mathbf{BA}</math>。比如下面的例子: |
||
<center><math>\begin{bmatrix} |
<center><math>\begin{bmatrix} |
||
第246行: | 第246行: | ||
:<math>\mathbf{A} \mathbf{x} = \mathbf{b}</math> |
:<math>\mathbf{A} \mathbf{x} = \mathbf{b}</math> |
||
其中,<math>\mathbf{A}</math>是由方程组里未知量的系数排成的<math>m \times n</math> |
其中,<math>\mathbf{A}</math>是由方程组里未知量的系数排成的<math>m \times n</math>矩阵,<math>\mathbf{x}</math>是含有<math>n</math>个元素的-{zh-cn:行; zh-tw:列;}-向量,<math>\mathbf{b}</math>是含有<math>m</math>个元素的-{zh-cn:行; zh-tw:列;}-向量<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=I.2.21 and 22 }}</ref>。 |
||
: <math> |
: <math> |
||
第276行: | 第276行: | ||
=== 线性变换 === |
=== 线性变换 === |
||
{{main|线性变换}} |
{{main|线性变换}} |
||
矩 |
矩阵是线性变换的便利表达法。矩阵乘法的本质在联系到线性变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系: |
||
以<math> \mathbb{R}^n</math>表示所有 |
以<math> \mathbb{R}^n</math>表示所有长度为<math>n</math>的-{zh-cn:行; zh-tw:列;}-向量的集合。每个<math>m \times n</math>的矩阵<math>\mathbf{A}</math>都代表了一个从<math> \mathbb{R}^n</math>射到<math> \mathbb{R}^m</math>的线性变换。反过来,对每个线性变换<math>f : \mathbb{R}^n \rightarrow \mathbb{R}^m</math>,都存在唯一{{math|''m''×''n''}}矩阵<math>\mathbf{A}_f</math>使得对所有<math> \mathbb{R}^n</math>中的元素<math>x</math>,<math>f(x) = A_f x</math>。这个矩阵<math>\mathbf{A}_f</math>第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math>-{zh-cn:列; zh-tw:行;}-上的元素是[[正则基]]向量<math>\mathbf{e}_j = (0, \cdots ,0, 1,0, \cdots 0)^T</math>(第{{math|''j''}}个元素是1,其余元素是0的向量)在<math>f</math>映射后的向量<math>f(\mathbf{e}_j)</math>的第<math>i</math>个元素。 |
||
也就是说,从<math> \mathbb{R}^n</math>射到<math>\mathbb{R}^m</math>的线性变换构成的向量空间<math>\mathcal{L} \left( \mathbb{R}^n , \mathbb{R}^m \right)</math>上存在一个到<math>\mathcal{M}(m,n,\mathbb{R})</math>的[[双射|一一映射]]:<math>f \mapsto A_f </math> |
也就是说,从<math> \mathbb{R}^n</math>射到<math>\mathbb{R}^m</math>的线性变换构成的向量空间<math>\mathcal{L} \left( \mathbb{R}^n , \mathbb{R}^m \right)</math>上存在一个到<math>\mathcal{M}(m,n,\mathbb{R})</math>的[[双射|一一映射]]:<math>f \mapsto A_f </math> |
||
第285行: | 第285行: | ||
|- |
|- |
||
| [[错切|推移]],<br>幅度m=1.25. |
| [[错切|推移]],<br>幅度m=1.25. |
||
| 水平[[镜面反射 (数学)| |
| 水平[[镜面反射 (数学)|镜射]]变换 |
||
| “[[挤压]]”变换,<br>压缩程度r=3/2 |
| “[[挤压]]”变换,<br>压缩程度r=3/2 |
||
|[[相似|伸 |
|[[相似|伸缩]],3/2倍 |
||
|<cite id=rotation_matrix>[[旋 |
|<cite id=rotation_matrix>[[旋转]],左转30°</cite> |
||
|- |
|- |
||
| <math>\begin{bmatrix} |
| <math>\begin{bmatrix} |
||
第311行: | 第311行: | ||
|} |
|} |
||
设有<math>k \times m</math>的矩 |
设有<math>k \times m</math>的矩阵<math>\mathbf{B}</math>代表綫性变换<math>g:\mathbf{R}^m\rightarrow\mathbf{R}^k</math>,则矩阵积<math>\mathbf{BA}</math>代表了綫性变换的复合<math>g\circ f</math><ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.2 }}</ref>,因为 |
||
:<math>(g\circ f)(x)=g(f(x))=g(\mathbf{Ax})=\mathbf{B}(\mathbf{Ax})=(\mathbf{BA})\mathbf{x}</math> |
:<math>(g\circ f)(x)=g(f(x))=g(\mathbf{Ax})=\mathbf{B}(\mathbf{Ax})=(\mathbf{BA})\mathbf{x}</math> |
||
[[矩阵的秩]]是指矩阵中[[线性相关性|线性无关]]的行/列向量的最大个数<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition II.3.3 }}</ref>,同时也是矩阵对应的线性变换的[[像 ( |
[[矩阵的秩]]是指矩阵中[[线性相关性|线性无关]]的行/列向量的最大个数<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition II.3.3 }}</ref>,同时也是矩阵对应的线性变换的[[像 (数学)|像空间]]的维度<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.1 }}</ref>。[[秩-零化度定理]]说明矩阵的-{zh-cn:列; zh-tw:行;}-数量等于矩阵的秩与[[零空间]]维度之和<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem II.3.22 }}</ref>。 |
||
== 方块矩阵 == |
== 方块矩阵 == |
||
第350行: | 第350行: | ||
=== 行列式 === |
=== 行列式 === |
||
{{main|行列式}} |
{{main|行列式}} |
||
[[File:Determinant Example.png| |
[[File:Determinant Example.png|thumb|300px|{{math|'''R'''<sup>2</sup>}}{{里}}的一个线性变换f将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量{{math|''x''}}1和{{math|''x''}}2的变成了逆时针排布。对应的矩阵行列式是-1.]] |
||
方块矩阵<math>\mathbf{A}</math>的行列式是一个将其映射到标量的函数,记作<math>\det(\mathbf{A})</math>或<math>\mathbf{|A|}</math>,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵<math>\mathbf{A}</math>的行列式的[[绝对值]]表示单位面积(体积)的图形经过<math>\mathbf{A}</math>对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。 |
方块矩阵<math>\mathbf{A}</math>的行列式是一个将其映射到标量的函数,记作<math>\det(\mathbf{A})</math>或<math>\mathbf{|A|}</math>,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵<math>\mathbf{A}</math>的行列式的[[绝对值]]表示单位面积(体积)的图形经过<math>\mathbf{A}</math>对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。 |
||
第357行: | 第357行: | ||
3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.2.1 }}</ref>,或使用[[拉普拉斯展开]]由低一维的矩阵行列式[[迭代|递推]]得出<ref>{{Harvard citations |last1=Mirsky |year=1990 |nb=yes |loc=Theorem 1.4.1 }}</ref>。 |
3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.2.1 }}</ref>,或使用[[拉普拉斯展开]]由低一维的矩阵行列式[[迭代|递推]]得出<ref>{{Harvard citations |last1=Mirsky |year=1990 |nb=yes |loc=Theorem 1.4.1 }}</ref>。 |
||
两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:<math>\det (\mathbf{AB})=\det(\mathbf{A})\cdot\det(\mathbf{B})</math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.2.12 }}</ref>。将矩阵的一行/列乘以某个系数加到另一行/列上不改变矩阵的行列式,将矩阵的两行/列互换则使得其行列式变号<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.2.16 }}</ref>。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见[[克 |
两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:<math>\det (\mathbf{AB})=\det(\mathbf{A})\cdot\det(\mathbf{B})</math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.2.12 }}</ref>。将矩阵的一行/列乘以某个系数加到另一行/列上不改变矩阵的行列式,将矩阵的两行/列互换则使得其行列式变号<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.2.16 }}</ref>。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见[[克莱姆法则]])<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.3.18 }}</ref>。 |
||
=== 特征值与特征向量 === |
=== 特征值与特征向量 === |
||
第372行: | 第372行: | ||
另一个等价的特征值定义是:标量<math>\lambda</math>为特征值,如果矩阵<math>\mathbf{A} - \lambda \mathbf{I}_n</math>是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:<math>\lambda</math>为特征值,如果 |
另一个等价的特征值定义是:标量<math>\lambda</math>为特征值,如果矩阵<math>\mathbf{A} - \lambda \mathbf{I}_n</math>是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:<math>\lambda</math>为特征值,如果 |
||
:<math>\det(\lambda \mathbf{I}_n - \mathbf{A}) = 0.\ </math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.9 }}</ref>这个定义中的行列式可以展开成一个关于<math>\lambda</math>的''n''阶[[多项式]],叫做矩阵{{math|'''A'''}}的[[特征多项式]],记为<math>p_{\mathbf{A}}</math>。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵<math>\mathbf{A}</math>特征值<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.4.10 }}</ref>。[[ |
:<math>\det(\lambda \mathbf{I}_n - \mathbf{A}) = 0.\ </math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.9 }}</ref>这个定义中的行列式可以展开成一个关于<math>\lambda</math>的''n''阶[[多项式]],叫做矩阵{{math|'''A'''}}的[[特征多项式]],记为<math>p_{\mathbf{A}}</math>。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵<math>\mathbf{A}</math>特征值<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.4.10 }}</ref>。[[凯莱-哈密顿定理|哈密尔顿-凯莱定理]]说明,如果用矩阵<math>\mathbf{A}</math>本身代替多项式中的不定元<math>\lambda</math>,那么多项式的值是零矩阵<ref>{{Harvard citations |last1=王萼芳|year=1997 |nb=yes|loc=4.2,定理3,第247页}}</ref>: |
||
<center><math>p_{\mathbf{A}}(\mathbf{A}) = 0</math>。</center> |
<center><math>p_{\mathbf{A}}(\mathbf{A}) = 0</math>。</center> |
||
第416行: | 第416行: | ||
某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵<math>\mathbf{A}</math>的线性方程组<math>\mathbf{Ax}=\mathbf{b}</math>时,可以使用一些专用于稀疏矩阵的特殊算法(比如[[共轭梯度法]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapters 9 and 10, esp. section 10.2 }}</ref>),减低计算复杂度。 |
某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵<math>\mathbf{A}</math>的线性方程组<math>\mathbf{Ax}=\mathbf{b}</math>时,可以使用一些专用于稀疏矩阵的特殊算法(比如[[共轭梯度法]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapters 9 and 10, esp. section 10.2 }}</ref>),减低计算复杂度。 |
||
算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算[[逆矩 |
算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算[[逆矩阵|矩阵的逆]]时,可以用以下的算法(其中<math>\mathrm{adj}(\mathbf{A})</math>表示<math>\mathbf{A}</math>的[[伴随矩阵]],<math>\mathrm{det}(\mathbf{A})</math>表示<math>\mathbf{A}</math>的[[行列式]]) |
||
:<math>\mathbf{A}^{-1}=\frac{\operatorname{adj}(\mathbf{A})}{\det(\mathbf{A})}</math> |
:<math>\mathbf{A}^{-1}=\frac{\operatorname{adj}(\mathbf{A})}{\det(\mathbf{A})}</math> |
||
第427行: | 第427行: | ||
[[LU分解]]将矩阵分解为一个下三角矩阵<math>\mathbf{L}</math>和一个上三角矩阵<math>\mathbf{U}</math>的乘积<ref>{{Harvard citations |last1=Press |last2=Flannery |last3=Teukolsky |year=1992 |nb=yes }}</ref>。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵<math>\mathbf{A}</math>分解成<math>\mathbf{A}=\mathbf{LU}</math>的形式,那么方程的求解可以分解为求解<math>\mathbf{Ly}=\mathbf{b}</math>和<math>\mathbf{Ux}=\mathbf{y}</math>两步,而后两个方程可以十分简洁地求解(详见[[三角矩阵]]中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵<math>\mathbf{A}</math>的行列式,需要计算大约<math>(n+1)!</math>次加法和乘法;而如果先对矩阵做<math>\mathbf{LU}</math>分解,再求行列式,就只需要大约<math>n^3</math>次加法和乘法,大大降低了计算次数。这是因为做<math>\mathbf{LU}</math>分解的复杂度大约是<math>n^3</math>次,而后注意到<math>\mathbf{L}</math>和<math>\mathbf{U}</math>是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。 |
[[LU分解]]将矩阵分解为一个下三角矩阵<math>\mathbf{L}</math>和一个上三角矩阵<math>\mathbf{U}</math>的乘积<ref>{{Harvard citations |last1=Press |last2=Flannery |last3=Teukolsky |year=1992 |nb=yes }}</ref>。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵<math>\mathbf{A}</math>分解成<math>\mathbf{A}=\mathbf{LU}</math>的形式,那么方程的求解可以分解为求解<math>\mathbf{Ly}=\mathbf{b}</math>和<math>\mathbf{Ux}=\mathbf{y}</math>两步,而后两个方程可以十分简洁地求解(详见[[三角矩阵]]中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵<math>\mathbf{A}</math>的行列式,需要计算大约<math>(n+1)!</math>次加法和乘法;而如果先对矩阵做<math>\mathbf{LU}</math>分解,再求行列式,就只需要大约<math>n^3</math>次加法和乘法,大大降低了计算次数。这是因为做<math>\mathbf{LU}</math>分解的复杂度大约是<math>n^3</math>次,而后注意到<math>\mathbf{L}</math>和<math>\mathbf{U}</math>是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。 |
||
[[File:Jordan blocks.svg| |
[[File:Jordan blocks.svg|thumb|若尔当矩阵,其中灰色框内的是若尔当块]] |
||
高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为[[阶梯形矩阵]],而每个操作可以看做是将矩阵乘上一个特定的[[初等矩阵]]<ref>{{Harvard citations |last1=Stoer |last2=Bulirsch |year=2002 |nb=yes |loc=Section 4.1 }}</ref>。[[奇异值分解]]则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:<math>\mathbf{A}=\mathbf{UDV}</math>。其中<math>\mathbf{U}</math>和<math>\mathbf{V}</math>是[[酉矩阵]],<math>\mathbf{D}</math>是[[对角矩阵]]。 |
高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为[[阶梯形矩阵]],而每个操作可以看做是将矩阵乘上一个特定的[[初等矩阵]]<ref>{{Harvard citations |last1=Stoer |last2=Bulirsch |year=2002 |nb=yes |loc=Section 4.1 }}</ref>。[[奇异值分解]]则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:<math>\mathbf{A}=\mathbf{UDV}</math>。其中<math>\mathbf{U}</math>和<math>\mathbf{V}</math>是[[酉矩阵]],<math>\mathbf{D}</math>是[[对角矩阵]]。 |
||
第437行: | 第437行: | ||
== 矩阵的推广 == |
== 矩阵的推广 == |
||
矩阵的元素除了可以是实数和复数以外,也可以任意环或[[域 ( |
矩阵的元素除了可以是实数和复数以外,也可以任意环或[[域 (数学)|域]]中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的[[线性算子]],则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是[[张量]]。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维张量,而更高维方式排列的数据方式就是高维张量<ref>{{Harvard citations |last1=Coburn |year=1955 |nb=yes |loc=Ch. V }}</ref>。 |
||
=== 一般域和环上的矩阵 === |
=== 一般域和环上的矩阵 === |
||
第444行: | 第444行: | ||
: <math> p_{X_{\alpha} } = \left( \operatorname{min}_{\mathbf{K}} (\alpha) \right)^r \,</math>。其中的<math>r</math>是扩域[[代数扩张|<math>\mathbf{L/K}</math>]] <math>(\alpha)</math>的阶数<ref>{{Harvard citations |last1= Ash |year= 2012|nb=yes |loc= Chapter II }}</ref>。 |
: <math> p_{X_{\alpha} } = \left( \operatorname{min}_{\mathbf{K}} (\alpha) \right)^r \,</math>。其中的<math>r</math>是扩域[[代数扩张|<math>\mathbf{L/K}</math>]] <math>(\alpha)</math>的阶数<ref>{{Harvard citations |last1= Ash |year= 2012|nb=yes |loc= Chapter II }}</ref>。 |
||
更一般的情况是矩阵的元素属于某个环<math>\mathbf{R}</math><ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Chapter XIII }}</ref>。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环<math>\mathbf{R}</math>,<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵之间可以相互加减以及相乘,所以<math>\mathcal{M}(m,n,\mathbf{R})</math>关于矩阵的加法和乘法也构成一个环,称为[[矩阵环]]。<math>n</math>维方阵的环<math>\mathcal{M}(n,\mathbf{R})</math> |
更一般的情况是矩阵的元素属于某个环<math>\mathbf{R}</math><ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Chapter XIII }}</ref>。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环<math>\mathbf{R}</math>,<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵之间可以相互加减以及相乘,所以<math>\mathcal{M}(m,n,\mathbf{R})</math>关于矩阵的加法和乘法也构成一个环,称为[[矩阵环]]。<math>n</math>维方阵的环<math>\mathcal{M}(n,\mathbf{R})</math>与左<math>\mathbf{R}</math>-[[模|模<math>\mathbf{R}^n</math>]]的[[自同态]]环[[同构]]<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=XVII.1, p. 643 }}</ref>。 |
||
若<math>\mathbf{R}</math>是[[交换环]], |
若<math>\mathbf{R}</math>是[[交换环]],则<math>\mathcal{M}(m,\mathbf{R})</math>是一个带[[单位元]]的<math>\mathbf{R}</math>-[[代数 (环论)|代数]],满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定义[[行列式]]。一个矩阵可逆当且仅当其行列式为环<math>\mathbf{R}</math>中的[[可逆元]](域上的矩阵可逆只需行列式不等于0)<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Proposition XIII.4.16 }}</ref>。 |
||
=== 矩阵与线性变换 === |
=== 矩阵与线性变换 === |
||
第479行: | 第479行: | ||
空矩阵是指行数或列数为零的矩阵。空矩阵的定义可以完善一些关于[[零维空间]]的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个<math>n \times 0</math>和<math>0 \times p</math>的空矩阵相乘是一个<math>n \times p</math>的零矩阵(所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己<ref>{{Harvard citations|last1= Faliva |last2=Zoia |year= 2008 |nb=yes|第18页}}</ref>。 |
空矩阵是指行数或列数为零的矩阵。空矩阵的定义可以完善一些关于[[零维空间]]的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个<math>n \times 0</math>和<math>0 \times p</math>的空矩阵相乘是一个<math>n \times p</math>的零矩阵(所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己<ref>{{Harvard citations|last1= Faliva |last2=Zoia |year= 2008 |nb=yes|第18页}}</ref>。 |
||
=== 分 |
=== 分块矩阵 === |
||
'''[[分 |
'''[[分块矩阵]]'''是指一个大矩阵分割成“矩阵的矩阵”。举例,以下的矩阵 |
||
:<math>P = \begin{bmatrix} |
:<math>P = \begin{bmatrix} |
||
1 & 2 & 3 & 2\\ |
1 & 2 & 3 & 2\\ |
||
第487行: | 第487行: | ||
6 & 1 & 5 & 8\end{bmatrix}</math> |
6 & 1 & 5 & 8\end{bmatrix}</math> |
||
可分割成4 |
可分割成4个2×2的矩阵 |
||
:<math>P_{11} = \begin{bmatrix} |
:<math>P_{11} = \begin{bmatrix} |
||
1 & 2 \\ |
1 & 2 \\ |
||
第516行: | 第516行: | ||
这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对[[四元数]]也有类似的矩阵表达<ref>{{Harvard citations |last1=Ward |year=1997 |loc=Ch. 2.8 |nb=yes }}</ref>。 |
这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对[[四元数]]也有类似的矩阵表达<ref>{{Harvard citations |last1=Ward |year=1997 |loc=Ch. 2.8 |nb=yes }}</ref>。 |
||
早期的[[密碼 (密碼 |
早期的[[密碼 (密碼学)|密码]]技术如[[希尔密码]]也用到矩阵。然而,矩阵的线性性质使这类密码相对容易破解<ref>{{Harvard citations |last1=Stinson |year=2005 |loc=Ch. 1.1.5 and 1.2.4 |nb=yes }}</ref>。[[计算机图像处理]]也会用到矩阵来表示处理对象,并且用放射旋转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影<ref>{{Harvard citations |last1=Association for Computing Machinery |year=1979 |loc=Ch. 7 |nb=yes }}</ref>。[[多项式环]]上的矩阵在[[控制论]]中有重要作用。 |
||
[[化学]]中也有矩阵的应用,特别在使用[[量子力学|量子理论]]讨论[[化学键|分子键]]和[[光谱]]的时候。具体例子有解[[罗特汉方程]]时用[[重叠矩阵]]和[[福柯矩阵]]来得到[[哈特里-福克]]方法中的[[分子轨道]]。 |
[[化学]]中也有矩阵的应用,特别在使用[[量子力学|量子理论]]讨论[[化学键|分子键]]和[[光谱]]的时候。具体例子有解[[罗特汉方程]]时用[[重叠矩阵]]和[[福柯矩阵]]来得到[[哈特里-福克]]方法中的[[分子轨道]]。 |
||
=== 图论 === |
=== 图论 === |
||
[[File:Labelled undirected graph.svg|150px| |
[[File:Labelled undirected graph.svg|150px|thumb|一个无向图的邻接矩阵<math>\begin{bmatrix} |
||
1 & 1 & 0 \\ |
1 & 1 & 0 \\ |
||
1 & 0 & 1 \\ |
1 & 0 & 1 \\ |
||
第531行: | 第531行: | ||
在多元函数微积分学中,对二阶偏导数存在的函数<math>f:\mathbf{R}^n\rightarrow\mathbf{R}</math>,可以定义其[[海森矩阵]]<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.6 }}</ref>: |
在多元函数微积分学中,对二阶偏导数存在的函数<math>f:\mathbf{R}^n\rightarrow\mathbf{R}</math>,可以定义其[[海森矩阵]]<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.6 }}</ref>: |
||
:<math>H(f)(x) = \left[ \frac {\partial^2 f}{\partial x_i \, \partial x_j}(x) \right ]</math>。 |
:<math>H(f)(x) = \left[ \frac {\partial^2 f}{\partial x_i \, \partial x_j}(x) \right ]</math>。 |
||
[[File:Saddle point.png| |
[[File:Saddle point.png|left|thumb|<math>n=2</math>时,海森矩阵<math>\begin{bmatrix} |
||
2 & 0 \\ |
2 & 0 \\ |
||
0 & -2 |
0 & -2 |
||
第575行: | 第575行: | ||
矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的[[运动方程]]可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过[[对角化]]等方式),称为系统的[[简正模式]]。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加<ref>{{Harvard citations|last1=Wherrett |year=1987 |nb=yes |loc=part II }}</ref>。描述力学振动或电路振荡时,也需要使用简正模式求解<ref>{{Harvard citations |last1=Riley |last2=Hobson |last3=Bence |year=1997 |nb=yes|loc=7.17 }}</ref>。 |
矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的[[运动方程]]可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过[[对角化]]等方式),称为系统的[[简正模式]]。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加<ref>{{Harvard citations|last1=Wherrett |year=1987 |nb=yes |loc=part II }}</ref>。描述力学振动或电路振荡时,也需要使用简正模式求解<ref>{{Harvard citations |last1=Riley |last2=Hobson |last3=Bence |year=1997 |nb=yes|loc=7.17 }}</ref>。 |
||
=== |
=== 几何光学 === |
||
在[[ |
在[[几何光学]]裏,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了[[波粒二象性|光波波动性]]的近似理论,这理论的模型将光线视为几何[[射线]]。采用[[近轴近似]],假若光线与[[光轴 (光学)|光轴]]之间的夾角很小,则[[透镜]]或[[反射 (物理学)|反射]]元件对于光线的作用,可以表达为2×2矩阵与向量的乘积。这向量的两个分量是光线的几何性质(光线的[[斜率]]、光线跟光轴之间在{{link-en|主平面|principal plane}}的垂直距离)。这矩阵称为[[光线传输矩阵]],内中元素编碼了光学元件的性质。对于折射,这矩阵又細分为两种:“折射矩阵”与“平移矩阵”。折射矩阵描述光线遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移行为。 |
||
由一系列透 |
由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述其光线传播路径。<ref>{{Harvard citations |last1=Guenther |year=1990 |nb=yes |loc=Ch. 5 }}</ref> |
||
=== |
=== 电子学 === |
||
在[[ |
在[[电子学]]裏,传统的{{link-en|网目分析|mesh analysis}}或[[节点分析]]会获得一个[[线性方程组]],这可以以矩阵来表示与计算。 |
||
很多 |
很多种电子元件的电路行为可以用矩阵来描述。设定<math>A</math>为输入向量,其两个分量为输入电压<math>v_1</math>与输入电流<math>i_1</math>。设定<math>B</math>为输出向量,其两个分量为输出电压<math>v_2</math>与输出电流<math>i_2</math>。这电子元件的电路行为可以描述为<math>B=H\cdot A</math>;其中,<math>H</math>是2×2矩阵,内有一个[[阻抗]]元素<math>h_{12}</math>、一个[[导纳]]元素<math>h_{21}</math>、两个[[无量纲]]元素<math>h_{11}</math>与<math>h_{22}</math>。这样,电路的计算可以约化为矩阵计算。 |
||
== 参见 == |
== 参见 == |
||
* [[矩 |
* [[矩阵论专有名词表]]:有关矩阵论所用到的名词的定义 |
||
* [[方块矩阵]] |
* [[方块矩阵]] |
||
* [[矩 |
* [[矩阵范数]] |
||
* [[雅可比矩阵]] |
* [[雅可比矩阵]] |
||
第628行: | 第628行: | ||
* {{Citation |last1=Manning |first1=Christopher D. |last2=Schütze |first2=Hinrich |title=Foundations of statistical natural language processing |publisher=MIT Press |isbn=978-0-262-13360-9 |year=1999 }} |
* {{Citation |last1=Manning |first1=Christopher D. |last2=Schütze |first2=Hinrich |title=Foundations of statistical natural language processing |publisher=MIT Press |isbn=978-0-262-13360-9 |year=1999 }} |
||
* {{Citation |last1=Mehata |first1=K. M. |last2=Srinivasan |first2=S. K. |title=Stochastic processes |publisher=McGraw–Hill |location=New York, NY |isbn=978-0-07-096612-3 |year=1978 }} |
* {{Citation |last1=Mehata |first1=K. M. |last2=Srinivasan |first2=S. K. |title=Stochastic processes |publisher=McGraw–Hill |location=New York, NY |isbn=978-0-07-096612-3 |year=1978 }} |
||
* {{Citation |last1=Mirsky |first1=Leonid |title=An Introduction to Linear Algebra | |
* {{Citation |last1=Mirsky |first1=Leonid |title=An Introduction to Linear Algebra ||publisher=Courier Dover Publications |isbn=978-0-486-66434-7 |year=1990 }} |
||
* {{Citation |last1=Nocedal |first1=Jorge |last2=Wright |first2=Stephen J. |title=Numerical Optimization |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=2nd |isbn=978-0-387-30303-1 |year=2006 |page=449 }} |
* {{Citation |last1=Nocedal |first1=Jorge |last2=Wright |first2=Stephen J. |title=Numerical Optimization |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=2nd |isbn=978-0-387-30303-1 |year=2006 |page=449 }} |
||
* {{Citation |last=Bohm |first=Arno |title=Quantum Mechanics: Foundations and Applications |publisher=Springer |year=2001 |isbn=0-387-95330-2 }} |
* {{Citation |last=Bohm |first=Arno |title=Quantum Mechanics: Foundations and Applications |publisher=Springer |year=2001 |isbn=0-387-95330-2 }} |
||
第641行: | 第641行: | ||
* {{Citation| title = 与给定矩阵A的可交换子环C(A)的一些探讨| last1 =林志兴| last2 = 杨忠鹏| publisher =莆田学院学报,2010年, 17(2)|year = 2010}} |
* {{Citation| title = 与给定矩阵A的可交换子环C(A)的一些探讨| last1 =林志兴| last2 = 杨忠鹏| publisher =莆田学院学报,2010年, 17(2)|year = 2010}} |
||
* {{Citation |last1=Oualline |first1=Steve |title=Practical C++ programming |publisher=[[O'Reilly Media|O'Reilly]] |isbn=978-0-596-00419-4 |year=2003 }} |
* {{Citation |last1=Oualline |first1=Steve |title=Practical C++ programming |publisher=[[O'Reilly Media|O'Reilly]] |isbn=978-0-596-00419-4 |year=2003 }} |
||
* {{Citation |last1=Press |first1=William H. |last2=Flannery |first2=Brian P. |last3=Teukolsky |first3=Saul A. |last4=Vetterling |first4=William T. |title=Numerical Recipes in FORTRAN: The Art of Scientific Computing |url=http://www.mpi-hd.mpg.de/astrophysik/HEA/internal/Numerical_Recipes/f2-3.pdf |publisher=Cambridge University Press |edition=2nd |year=1992 |chapter=LU Decomposition and Its Applications |pages=34–42 | |
* {{Citation |last1=Press |first1=William H. |last2=Flannery |first2=Brian P. |last3=Teukolsky |first3=Saul A. |last4=Vetterling |first4=William T. |title=Numerical Recipes in FORTRAN: The Art of Scientific Computing |url=http://www.mpi-hd.mpg.de/astrophysik/HEA/internal/Numerical_Recipes/f2-3.pdf |publisher=Cambridge University Press |edition=2nd |year=1992 |chapter=LU Decomposition and Its Applications |pages=34–42 |||}} |
||
* {{Citation |last1=Punnen |first1=Abraham P. |last2=Gutin |first2=Gregory |title=The traveling salesman problem and its variations |publisher=Kluwer Academic Publishers |location=Boston, MA |isbn=978-1-4020-0664-7 |year=2002 }} |
* {{Citation |last1=Punnen |first1=Abraham P. |last2=Gutin |first2=Gregory |title=The traveling salesman problem and its variations |publisher=Kluwer Academic Publishers |location=Boston, MA |isbn=978-1-4020-0664-7 |year=2002 }} |
||
* {{Citation |last1=Reichl |first1=Linda E. |title=The transition to chaos: conservative classical systems and quantum manifestations |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-0-387-98788-0 |year=2004 }} |
* {{Citation |last1=Reichl |first1=Linda E. |title=The transition to chaos: conservative classical systems and quantum manifestations |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-0-387-98788-0 |year=2004 }} |
||
第672行: | 第672行: | ||
; 历史 |
; 历史 |
||
* [http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Matrices_and_determinants.html MacTutor: Matrices and determinants] |
* [http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Matrices_and_determinants.html MacTutor: Matrices and determinants] |
||
* [http://www.economics.soton.ac.uk/staff/aldrich/matrices.htm Matrices and Linear Algebra on the Earliest Uses Pages] |
* [http://www.economics.soton.ac.uk/staff/aldrich/matrices.htm Matrices and Linear Algebra on the Earliest Uses Pages] |
||
* [http://jeff560.tripod.com/matrices.html Earliest Uses of Symbols for Matrices and Vectors] |
* [http://jeff560.tripod.com/matrices.html Earliest Uses of Symbols for Matrices and Vectors] |
||
; 在线书籍 |
; 在线书籍 |
||
第682行: | 第682行: | ||
; 线上矩阵计算器 |
; 线上矩阵计算器 |
||
* {{Citation |title=Matrix Calculator (DotNumerics) |url=http://www.dotnumerics.com/MatrixCalculator/ |access-date=2015-01-10 | |
* {{Citation |title=Matrix Calculator (DotNumerics) |url=http://www.dotnumerics.com/MatrixCalculator/ |access-date=2015-01-10 |||}} |
||
* {{Citation |last1=Xiao |first1=Gang |title=Matrix calculator |url=http://wims.unice.fr/wims/wims.cgi?module=tool/linear/matrix.en |accessdate=2008-12-10 }} |
* {{Citation |last1=Xiao |first1=Gang |title=Matrix calculator |url=http://wims.unice.fr/wims/wims.cgi?module=tool/linear/matrix.en |accessdate=2008-12-10 }} |
||
* {{Citation |title=Online matrix calculator |url=http://www.bluebit.gr/matrix-calculator/ |accessdate=2008-12-10 | |
* {{Citation |title=Online matrix calculator |url=http://www.bluebit.gr/matrix-calculator/ |accessdate=2008-12-10 |||}} |
||
* {{Citation |title=Online matrix calculator (ZK framework) |url=http://matrixcalc.info/MatrixZK/ |accessdate=2009-11-26 | |
* {{Citation |title=Online matrix calculator (ZK framework) |url=http://matrixcalc.info/MatrixZK/ |accessdate=2009-11-26 |||}} |
||
* {{Citation |title=MacAnova |url=http://www.stat.umn.edu/macanova/macanova.home.html |last1=Oehlert |first1=Gary W. |last2=Bingham |first2=Christopher |publisher=[[明尼苏达大学|University of Minnesota]], School of Statistics |accessdate=2008-12-10 }}, a freeware package for matrix algebra and statistics |
* {{Citation |title=MacAnova |url=http://www.stat.umn.edu/macanova/macanova.home.html |last1=Oehlert |first1=Gary W. |last2=Bingham |first2=Christopher |publisher=[[明尼苏达大学|University of Minnesota]], School of Statistics |accessdate=2008-12-10 }}, a freeware package for matrix algebra and statistics |
||
* {{Citation |title=Online matrix calculator |url=http://www.idomaths.com/matrix.php |accessdate=2009-12-14 }} |
* {{Citation |title=Online matrix calculator |url=http://www.idomaths.com/matrix.php |accessdate=2009-12-14 }} |
||
* [http://www.elektro-energetika.cz/calculations/matreg.php?language=english Operation with matrices in R (determinant, track, inverse, adjoint, transpose)] |
* [http://www.elektro-energetika.cz/calculations/matreg.php?language=english Operation with matrices in R (determinant, track, inverse, adjoint, transpose)] |
||
{{线性代数的相关概念}} |
{{线性代数的相关概念}} |
||
{{FA|B1}} |
|||
[[Category: |
[[Category:线性代数|J]] |
||
[[Category:矩 |
[[Category:矩阵论|J]] |