Author: Eiko

Tags: Algebra, Group, Ring, Module, Field, Linear Algebra, Symmetry, Group Action, Group Representation, Sylow's Theorem, Commutative Algebra, PID, Number Theory, Vector Space, Jordan Canonical Form, Classification of Linear Endomorphisms, Tensor Product, Dual Space

Time: 2024-12-07 04:00:00 - 2024-12-07 04:00:00 (UTC)

本书的目的是带领读者了解并理解群,环,模等代数结构。本书希望以原理性的方式讲述,使读者明白基本的原理,并能理解整个理论,而不是完全的平铺直叙。其中穿插了许多练习,可以帮助读者熟悉概念并检查自己的理解。有一定难度的问题我们用难度星级 标示出来了,的个数代表它们的难度(难度分为0,1,2,3,4,5星)。0星的题目都是可以立即想出来的,读者看几眼就能知道答案的那种。看到0星题目时一定要立即想一想,这可以用于检查对概念的理解,想不出来就应该回顾前面的内容。有些练习事实上是简单而有一定重要性或有用的结论,读者通过自己的思考,可以对它们有更好的理解和印象。

最后更新:2024年2月12日

对称现象与群

认识对称

在浩瀚无边的宇宙中,存在着无数缤纷复杂的对称现象。对称这个词我们不陌生,比如我们常说圆既是个轴对称图形,又是个中心对称图形,它还是“旋转”对称的;(等边)三角形是轴对称的,它有三条对称轴,不仅如此,事实上我们感觉到:三角形从三个不同的方向看过去,是一样的,这似乎也是一种对称性……那么什么是对称呢?

我们需要把对称现象作一个高度的概括。不难发现,可以以一种统一的方式来重新理解上面的几个例子:对圆作对称轴反射变换、旋转变换,或者是中心对称变换,即映射(x,y)(x,y),整个圆又回到了原来的样子。对(等边)三角形作对称轴反射变换、120度旋转变换,三角形没有发生变化。

于是我们可以说,所谓某个对象的某种对称,就是指某种变换(映射),它保持整个对象不变。但是一般来说,这种变换要有所限制,通常是只考虑从某个大的比较正常/自然的映射空间中选取一些保持它不变的映射。不能是太烂的映射,要不然可选的映射太多了。对于这整个三角形来说,我们所考虑的仅仅是把它看做不可切割的刚体的变换,那些会割裂三角形的映射按照这种说法也可以看成某种对称,但是我们不予考虑。在这种考虑下,一个(等边)三角形的对称事实上只需要看它的三个顶点1,2,3如何运动。比如(1,2,3)(2,3,1)的变换就是某种旋转,而(1,2,3)(1,3,2)则是某种轴对称。

对称的本质属性

我们现在用数学抽象的记号来书写我们刚才的讨论。我们首先有一个可能具有某些对称性的对象X,在上面有一些对称,也就是一些变换T1,T2,。 它们作用在X上使整个X不变,也就是说 Ti(X)=X. 一个自然的道理是任何对象都有一种对称,其实就是啥也不干。这个啥也不干的恒等映射我们记作1。这是对称的本质属性之一。 既然是变换(映射)的话,它们之间必然可以复合,复合运算也必然满足结合律。我们很容易发现,对称之间的复合一定也是对称。用稍微抽象一点的语言来说,这个朴素(这是对称的本质属性之二)的道理就是 TiTj(X)=Ti(Tj(X))=Ti(X)=X (后面的大部分时间里,我们将省略复合的符号,直接写成TiTj.)这个简单的式子说明如何用两个对称来“制造”新的对称:把它们复合起来一定还是X 的对称!作为最简单的例子,我们还是可以考察一下等边三角形。我们知道,旋转120度的变换可以作用两次,即σσ=σ2,这事实上是某种旋转240 度的变换。作用三次,这事实上就相当于什么也没干。不妨用σ 来表示旋转(不妨说是逆时针)120度的变换,我们已经发现σσσ=1即单位映射,这也就是 σ3=1 值得注意的是,就像映射的复合不一定交换一样,没有任何理由表明对称的复合一定会交换,即不一定有TiTj=TjTi。对称还有一种本质属性。那就是每一种对称变换一定可以反过来进行!也就是任意一种对称T,有一种对应于它的反对称,我们把它记作T1,称它为T 的逆,使得T1T=1。 互逆是相互的关系,你是我的逆,我也是你的逆,所以必须也有TT1=(T1)1T1=1。 比如说σ 的反操作就是顺时针旋转120 度。而这事实上与σ2无异,这一点可以通过对式子σ3=1两边同时复合一个σ1看出来: σ1σ3=σ1=σ2. 如果我们用S(X)来表示X上的所有对称变换的集合的话,以上讨论就是说:

  1. 1S(X).

  2. a,bS(X)abS(X).

  3. a(bc)=(ab)c.

  4. aS(X)存在a的逆bS(X),ab=ba=1.

事实上,我们把这样一个集合S(X)称为,即X的对称群。

等边三角形的对称群

等边三角形的对称,有旋转,也有轴对称,事实上它有三种不同的轴对称,不妨记其中以纵轴为对称轴的反射变换是τ。也有两种不同的旋转σ,σ2=σ1 (一个逆时针转120度,一个顺时针转120度),还有一个啥也不干的对称1。如前,我们以1,2,3记三角形的三个顶点(不妨把等边三角形平放,上面的顶点定为1,右下的为2,左下的为3)。那么每一个对称事实上都是一个从{1,2,3}{1,2,3}的映射f。别忘了,作为一个对称,f需要有逆,所以f 得是单满射。这样的f有多少个呢?这只需要决定f(1),f(2),f(3)的值就好了。一共有6种可能的排列,所以三角形上最多只能有6个对称!那实际上它有多少个呢?每一个这样的f都是三角形的一个对称吗?的确是!我们将用如下记号 (123abc) 来表示把1映到a,把2映到b,把3映到c的映射。很容易发现 σ=(123312)τ=(123132) 别忘了我们说过,对称变换可以复合,我们试着复合一下στ,看看会发生什么?通过计算给出 στ=(123312)(123132)=(123321) 有趣的是这次复合没有产生新的东西,στ这个对称是另一种轴对称,保持顶点2不变的轴对称。值得注意的是σττσ,读者可以验证这一点。 我们可以验证,整个三角形的对称群有如下6个不同的元素:(这刚好构成了{1,2,3}到{1,2,3}的所有单满射。) 1,σ,σ2,τ,τσ,τσ2 这样一个群具有良好的运算性质:有一个恒等元素1、每个元素都有逆、任何两个元素的复合(也称为元素的乘积)仍然属于这个群,也就是乘法运算具有封闭性。事实上,这个群我们一般记作D3,叫做二面体群。二面体群这个词事实上包括了一整个系列的群DnDn是指作用在正n边形上的所有对称组成的群。(注:有些书上用D2n记我们这里的Dn,这是记号的差别,不幸的是这两种记号都有广泛使用。)

另一个简单的但重要的群的例子:置换群

我们考虑集合{1,2,,n},我们研究这个集合的对称。作用在上面的变换是啥呢?就是从它到它自身的所有单满射(必须是单满射,因为对称变换要求有逆)。这个群我们记作Sn,叫做n元置换群。其间的元素称为置换 Sn={单满射 f:{1,2,,n}{1,2,,n}}. 容易知道,|Sn|=n!。置换群具有基本的重要性,所以对它引入简单而方便的记号是重要的。我们还是以 f=(12nf(1)f(2)f(n)) 表示置换。特别的,我们把如下置换形状的置换 (a1a2anb1bka2a3a1b1bk) 称为轮换,把它记为(a1a2a3an)。可以有长度小于n的轮换,比如(12)表示把1映到2,把2映到1,其它元素不动的轮换。

置换的轮换表示

一个有趣的事实是每个置换事实上都可以用轮换的乘积(复合)表示出来!为了从一个置换得到它的轮换表示,只需要这样操作:它可能把a1映到a2,把a2映到a3,……这样下去直到又把某个ak映回a1,我们就找到了一个轮换(a1a2ak)。再从这个轮换没有包含的某一个元素出发,让f 不停地作用在它身上,直到循环,得到另一个轮换(b1b2bl),以此类推,我们最终能把该置换的所有元素穷尽,得到 f=(a1a2ak)(b1b2bl) 并且,表达式中所出现的轮换之间没有公共元素(故此时这些轮换复合(乘积)的顺序不重要)。比如,我们可以得到这个置换的轮换表示: (12344321)=(14)(23)=(23)(14) 只需要发现141,232.

练习 1.1. 计算(12)(34)(13)(24),直接将它表为不相交轮换的乘积。

练习 1.2. 将置换 (1234534152)

写为不相交的轮换乘积。

对称的本质框架:群

一个群本质上是指作用在某种对称物件X上的所有对称变换的集合S(X),这集合满足如下性质

  1. 1S(X).

  2. a,bS(X)abS(X).

  3. 乘法满足结合律,a(bc)=(ab)c.

  4. aS(X)存在a的逆bS(X),ab=ba=1.

事实上,抽象地考察群,我们可以发现其运算结构与X并没有什么关系,其所有运算信息完全包含在了乘法运算里。以上条件是所有对称现象都具有的,为了研究宇宙中所有的对称现象的本质结构,我们不妨去繁就简,作出如下定义

定义 1.1. 一个群(Group)是指一个集合G以及上面附带的一种二元运算:G×GG称为乘法,满足:

  1. a,bGabG

  2. 存在一个元素eG(称为幺元素),它满足对任意元素aG都有ea=ae=a.

  3. 对任意的aG,存在bG,称为a的逆,满足ab=ba=e.

  4. 乘法满足结合律,对任意的a,b,cG(ab)c=a(bc).

特别地,如果这个运算还满足交换律,ab=ba,则称它为Abel群(Abelian Group)

练习 1.3. 验证在一个群中,幺元素是唯一的。一个元素的逆也是唯一的。

在这个群的定义里我们没有提到任何对称变换,甚至只看这个定义的话看不出来这是要干什么1,还以为这只是某种运算封闭的集合。群确实也可以代表这种运算封闭的集合,比如说全体整数在加法运算下成群。(事实上,这种运算封闭的集合,比如全体整数在加法下成的群,也是某种对称变换:它是作用在整数集上的所有平移变换。)但请记住群的由来,和群最本质的属性是对称。这样一来,研究了所有群,我们就相当于研究了作用在任何可能的物件/对象上的所有可能的对称。

我们只研究有限群,即元素个数有限的群。我们称一个群的元素个数为这个群的阶数。在第二章我们会为大家证明,对于每个有限群,都可以构造一个对象X,使得这个群恰好是该对象的对称群,也即,每个群都是对称群。所以说群的本质是对称:群即对称,对称即群!

群的一些例子

除了我们已经介绍的SnDn以外,还有一些简单的群。 最简单的群的例子应该是Z,即全体整数在加法下组成的群,我们可以把这个群想象成全体整数的平移对称群。容易验证,全体偶数在加法下也成群。事实上,全体n的倍数在加法下都能组成群(因为n的倍数在加法下封闭)。

如果我们把Dn中的所有旋转{1,σ,σ2,,σn1}拿出来单独组成一团,容易验证这也构成一个群(因为旋转之间的复合还是旋转),这种群也是最基本的群之一,我们把它记作Zn,叫它n 阶循环群2,这是一个Abel群。

关于循环群,事实上还有另一种算术的描述:全体整数按照模n分成n 个不同的剩余类,就是按除以n之后的余数分别为0,1,2,,n1划分为n类。剩余类之间可以进行加法运算,比方说在模5下,有2+4=1.这样,这些不同的剩余类按加法就组成了一个群,这个群看起来跟之前的Zn好像是不同的,因为一个是旋转变换{1,σ,σ2,,σn1},一个是剩余类{0,1,2,3,,n1}。但是不难看出这两个群在结构上没有什么本质上的区别,也即如果我们把剩余类kσk等同起来,两边进行的任何群运算都是一样的。这也就是说,在一个对应ff:{0,1,2,3,,n1}{1,σ,σ2,,σn1}kσk 左边的各种运算可以与右边对应的元素的对应运算相对应。这时,我们说这两个群同构。同构的群没有本质的区别,可以视为同一个。关于同构的具体描述将在下一章给出。

练习 1.4. 考虑由所有n次单位根{1,e2πin,e4πin,,e2(n1)πin},验证它在通常的复数乘法下组成一个群,也即验证它满足群的定义。这个群跟Zn 同构吗?

本章我们用简单的方法探索群3的基本结构。

元素上的结构信息

元素的阶数

gG,如果有正整数n使得gn=1,那么我们说g是有限阶的,把最小的这样的正整数n称作g的阶,否则说它是无限阶的。对于有限群G来讲,任一个元素gG,不停地作乘法,得到序列g,g2,g3, 由于G 有限,这个序列一定会重复,不妨设gk=gl,k>l,那么有gkl=1。 也即有限群中任何元素都是有限阶的。

练习 1.5. gG中的n阶元素并且gN=1.证明Nn的倍数。

命题 1.1. g是群G中的n阶元素,那么gm的阶数是n(m,n),其中(m,n)表示m,n的最大公因数。

Proof. 首先由(gm)n(m,n)=gmn(m,n)=1我们知道,gm的阶数n(m,n).而若有(gm)k=1=gmk,则必有mkn的倍数,因此k必然是n(m,n)的倍数。这就表明了gm的阶数一定是n(m,n). ◻

在Abel群中,如果已知a,b的阶数,那么ab的阶数就被约束住了。

练习 1.6. G是Abel群,a,bG阶数分别为m,n,则ab的阶数是[m,n]的因数。

练习 1.7 (). 如上题,若还有m,n互素,证明ab的阶数就是mn.

值得注意的是,对于非Abel群,仅仅已知a,b的阶数是不能得到与ab 阶数有关的任何信息的,可以证明存在群使得ab的阶数取到任意给定的正整数。我们举个例子,在S5中,令a=(12)(34),b=(135)ab=(14352)是五阶的。

练习 1.8 (). 证明,如果一个群中只有1,2阶元素,那么这个群是Abel群。

练习 1.9 (). G是一个偶数阶群,则g2=1有偶数个解。由此知群G中一定有二阶元素。

子群与商结构

不难发现,D6,即正六边形的对称群,里面也包含了正三角形的所有对称!比方说旋转120度的对称,这个在正六边形的对称群里也有。三角形的三条轴对称也构成正六边形的三条轴对称,当然正六边形有更多轴对称(反射对称)。这种时候我们说D3D6的子群4。数学的历史告诉我们,研究一个结构的子结构是重要的:我们作出如下定义

定义 1.2. 设G是一个群,SG是一个子集,若它在群G的乘法下仍然满足群的定义性质,则称SG的一个子群。记为SG

我们有很多子群的例子,比方说全体偶数的加法群2Z就是Z的一个子群。再比如说,Z6={1,σ,σ2,σ3,σ4,σ5}有子群{1,σ2,σ4} 和子群{1,σ3},其实就是Z3Z2.

1.1. {1,(12)(34),(13)(24),(14)(23)}构成S4的一个子群,叫做Klein 四元群,有时它记作VZ22.这个群是Abel群,但是跟同阶的Abel 群Z4不同构。

练习 1.10. 证明,子群的(任意)交仍然是子群。

陪集与拉格朗日定理

G是一个群,给定了它的一个子群HG后,我们可以在群G上规定一个等价关系: aba1bH. 由于H本身是个群,容易验证这样确实定义了一个等价关系5,按照这个等价关系,整个群G 划分成一些不相交的等价类的并。容易发现,与b等价的元素的全体就是bH,因为bab1aHabH. 这样,所有的等价类都形如bH,并且它们的大小相等,都是|bH|=|H|. 我们称形如bH 这样的子集叫做G关于H的左陪集,简称陪集6。我们以[G:H] 记这个等价关系下,等价类的个数,也即陪集的个数,称它为子群H指数(index).我们有 G=i=1[G:H]biH 由于不同的等价类不相交,那么我们已经得到了

定理 1.1 (拉格朗日定理). H是群G的子群,那么 |G|=[G:H]|H|

通过连续运用陪集分解,我们可以得到

练习 1.11 (). ABG.则有 [G:A]=[G:B][B:A].

这个定理还表明,子群的阶数一定是|G|的因数。比方说,借助拉格朗日定理,我们就能知道12阶群一定没有5阶子群。

1.2. 对于群 D3={1,σ,σ2,τ,τσ,τσ2} 以及它的子群H={1,σ,σ2},我们有如下陪集分解: D3=HτH. 此时有[D3:H]=2.

练习 1.12. HG.证明gHgH=H,从而得知abaH=bH.

定理 1.2. gG是有限群G中的一个n阶元素,那么n|G|的因数。

Proof. 由于gn阶元素,我们很容易验证,H={1,g,g2,,gn1}构成G的一个n阶子群,因而由拉格朗日定理知一定有n|G|的因数。 ◻

商群与正规子群

就像线性空间(向量空间)可以对子空间构作商空间一样,群也存在商结构。

给定HG,我们试图把陪集集合G/H={H,b1H,,bk1H} 看成一个群,我们所期望的群运算是这样的: a,bG(aH)(bH)=(ab)H 不幸的是,对于某些子群H,这个等式不成立。也就是说,不是所有子群都可以用来构作商群G/H。我们作如下推理: (aH)(bH)=(ab)HHbH=bH(b1Hb)H=Hb1HbH,而对所有b都满足b1HbH等价于对所有b都满足b1Hb=H. 所以,若要构作商群G/H,子群H必须满足条件:bG,b1Hb=H,这引出如下定义:

定义 1.3. 设NG,若 gGg1Ng=N 则称NG正规子群,记作NG.如果一个群G除了1G以外没有别的正规子群,则称G单群

1.3. G是Abel群,则G的任何子群都是正规子群。

1.4. 我们有Z3D3,这只需验证τ1στ=σ1.容易看出{1,τ}D3的子群,但{1,τ}并不是D3的正规子群,因为σ1τσ=σ2τ{1,τ}.

1.5. 我们有{1,(12)(34),(13)(24),(14)(23)}=VS4.这一点在我们谈到置换群的共轭概念后大家能马上得到。

值得注意的是,正规子群不具有传递性,即ABC推不出AC.反例将在后面的学习中给出。

练习 1.13. NHG并且NG.证明NH.

练习 1.14. 证明:NG等价于说对任意的gGNg=gN.

练习 1.15 (). M,NGMN={1},证明MN之间的元素可交换。即mM,nNmn=nm.

练习 1.16 (). HG[G:H]=2.证明HG.

练习 1.17 (). 找出所有的有限交换单群。

子群之间的乘积

N,HG.我们记集合 NH={nh|nN,hH}G. 这个集合在大群G赋予的运算下,能成一个群吗?答案是不一定。但是当NH至少有一个是正规子群时这是对的。不妨设NG,我们计算 n1h1n2h2=n1(h1n2h11)h1h2NH (n1h1)1=(h11n11h1)h11NH 1NH 而群NH的结合律也以从大群中的结合律遗传过来,因而此时NH构成子群。

另外,就算N,H中没有一个是正规子群,通过运用陪集分解的方法我们仍然能够计算集合NH中的元素个数。

命题 1.2. A,BG,则有 |AB|=|A||B||AB|

Proof. 显然,AB可以写成一些不相交的关于B的陪集的并(尽管AB可能不是子群),我们有 AB=aAaB 另外,对A作关于子群AB的陪集分解有 A=aAaAB 我们发现, a1B=a2Ba11a2Ba11a2ABa1AB=a2AB 也就是说,AB关于B的陪集个数等于A关于AB的陪集个数,所以有 |AB||B|=|A||AB|. (这个等式与线性代数中的第二同构定理是否很相似?) ◻

练习 1.18 (). A,BG.证明 [G:AB][G:A][G:B]. 特别的,如果[G:A][G:B]互素,证明等号一定成立,并且有G=AB.

练习 1.19 (). A,BG是子集(注意,没说是子群),如果|A|+|B|>|G|,证明一定有 G=AB.

群映射

线性空间之间的映射一般只考虑与其线性结构有关的线性映射。而群与群之间的映射也是这样,一般只考虑与其群结构有关的群映射,我们要找的这群映射便是群同态。

定义 1.4 (群同态). 设G,H都是群,f:GH是映射,若 f(ab)=f(a)f(b) 则称f群同态群映射,简称同态。若f是单射,则称它为单同态。若f是满射,则称满同态。若f既是单同态又是满同态,则称f是一个同构,称GH同构的,记作GH.

值得注意的是,在等式f(ab)=f(a)f(b)中,ab所用的是群G中的乘法运算,而f(a)f(b)处所用的是群H中的乘法运算。

1.6. 如第一章,通过对三角形顶点编号,我们发现事实上有S3D3. 对于n>3SnDn并不相同。

1.7. 一个群同构于它自身。这只需要取f(g)=g即可。有趣的是一个群可以有不同于恒等映射的同构映射,比如 f:Z3Z3gg2 就是一个同构映射,但它不同于恒等映射,我们把它们(包括1)称为Z3的自同构。事实上,这种(非平凡)同构映射的存在说明了群G的结构本身具有某种对称性,而群G的所有自同构,也就是作用在G上的所有对称变换,也构成一个群,称为G的自同构群,记作Aut(G).

练习 1.20. 验证同态一定把G中的1对应到H中的1,把g1对应到f(g)1,也就是说f(1)=1以及f(g1)=f(g)1.

练习 1.21. 验证Z4有一个二阶子群,并证明它对这个二阶子群的商群同构于Z2.

练习 1.22. gn阶元素,证明f(g)必是有限阶元素,而且阶数是n的因数。

练习 1.23. 求出Aut(Z4).

定义 1.5 (核与像). 设有群同态f:GH,我们称集合 kerf=f1(1)={gG|f(g)=1}f的核,集合 Imf={f(g)|gG}f的像。

值得注意的是kerfImf分别是GH的子群,而且事实上有kerfG.

练习 1.24. 证明

  1. kerf={1}f是单射。

  2. kerfG.

练习 1.25 (). 找出所有的阶数5的群。包含只有一个元素的平凡群在内,阶数不超过5的群一共有6个。(同构的群视为同一个)

简单重要而典型的群映射

单同态

最简单的群映射应该属于单同态。一个单同态f:HG本质上是把H 给对应到了G中的一个子群f(H)G,而f(H)H是同构的。换而言之,单同态就是把H以同构的方式“塞”进了G.

1.8. 考虑群的单同态 f:Z3={1,a,a2}Z6={1,b,b2,b3,b4,b5} 容易发现,这个同态完全被f(a)的值确定下来了,因为f(1)=1f(a2)=f(a)2.由于a3阶元素,f(a)必须是13阶元素。Z6中的三阶元素只有b2,b4。因此我们知道,f(a)只可能取1,b2,b4。由于我们只考虑单同态,可能的选择只剩下两个:f(a)=b2f(a)=b4.

如果f(a)=b2,那么就有f(a2)=b4,整个群Z3={1,a,a2}被映射成了{1,b2,b4}。如果选择f(a)=b4,那么就有f(a2)=(b4)2=b8=b2,整个群Z3={1,b4,b2}.我们知道{1,b2,b4}Z6的同构于Z3的子群,但是却有两种不同的将Z3嵌入到Z6的方式。但在任何一种方式下,这个单同态都建立了Hf(H)的同构。尽管G=Z6中只有一个子群同构于H=Z3,但之所以会有多种不同的将H 嵌入到f(H) 的方式,是因为存在从HH 的自同构(1,a,a2)(1,a2,a).换而言之,这种现象发生是因为H自身具有的对称性导致的。 rendering math failed o.o

投射与同态的分解

另一种简单而重要的映射是投射。 我们说过,对于群G的正规子群N,可以构作商群G/N.我们可以考虑一种把G中的元素g对应到G/Ng所在的陪集的自然的映射 p:GG/NggN 这个映射显然是同态,因为p(ab)=abN=aNbN=p(a)p(b).而且还是满同态。那它的核是什么呢?回忆商群G/N中的单位元素就是N,也即G 中的单位元素所在的陪集,因此p(a)=aN=NaN,我们得出kerp=N.

投射的重要性和基本性在于,对于任何同态f:GH 我们去考虑这个同态的kerf.一件值得注意的事情是,a1bkerf等价于说f(a1b)=1f(a)=f(b).换而言之,若是把Gkerf作商群(也即陪集分解),每个陪集bkerf的中的元素都被f映射到同一个f(b),而不同的陪集一定被映射到了不同的元素(因为只要两个陪集akerfbkerf被映射到了相同的元素,就有f(a1b)kerfakerf=bkerf).既然akerf中所有元素都被映为同一个f(a)(给我们一种浪费的感觉),不如定义一个新映射,把akerf视为商群中G/kerf的一个元素,让它对应到f(a).

换而言之,我们发现,任何具有kerf的同态f:GH都可以分解成两个映射的复合: rendering math failed o.o 这个图的意思就是我们可以将映射af(a)对应成两步:aakerff(a).第一步是将a对应到它所在的陪集akerf(即从GG/kerf 的自然投射),第二步是将akerf 映射到f(a).唯一可能存在的问题是第二步映射是不是一个同态?答案是是。验证这一点是极为容易的。任何群映射可以分解成两种基本映射的复合:即一个投射,和一个单同态的复合。顺便,事实上我们可以在这个基础上再加一步,也是最水的一步:aakerff(a)f(a),也即先将f(a)映入H的子群Imf,再将Imf通过平凡单射对应到H. rendering math failed o.o 这样,第二步G/kerfakerff(a)就是一个同态且是单满射,因此是同构。于是我们得出,我们得出了如下重要的定理:

定理 1.3 (同态基本定理). f:GH是同态,那么kerfG,ImfH且有同构 G/kerfImf

Proof. 如上,构作映射 h:G/kerfImfakerff(a) 易验证这个映射的定义是良好的,因为只要bkerf=akerf就有f(b)=f(a). 现在来证明这是同态: h((akerf)(bkerf))=h(abkerf)=f(ab)=f(a)f(b) 第一个等号是因为kerf正规。h是单射,因为h(akerf)=f(a)=1akerf. 另外,h显然是满射,故h是同构。 ◻

同构定理

同态基本定理又叫第一同构定理。由同态基本定理我们很容易导出许多同构定理,它们和我们在线性代数中学过的同构定理是类似的。

定理 1.4 (第二同构定理). NGHG.则有NNHNHH并且有 NH/NH/NH

Proof. 由于NG以及NNHG容易得出NNH.对任意的nNH,hHh1nhNHNHH. 现在,构作映射 f:HNH/NhhN 先证明这个映射是同态。因为NNH,我们有 f(ab)=abN=aNbN=f(a)f(b). 这显然是个满同态。现在我们计算kerf,设hkerf,则 hN=NhNhNHkerf=NH.现在同态基本定理给出 H/NHNH/N. ◻

下面的这个对应定理是基本的,它描述了G/N的子群与G的包含了N的子群存在着对应关系

定理 1.5 (对应定理). NG,记ρ:GG/N是自然投射,则有如下从所有G中包含N的子群到所有G/N的子群的一一对应 Hρ(H)=H/NG/N 即把H映射到所有形如hN的陪集集合。其逆映射为Tρ1(T), 这里TG/N的子群。

Proof.

  • 注意到HGG/N的像就是H/N, 因而是同态的像,故为一个G/N的子群。同理对任意子群TG/N,原象ρ1(T)也是一个子群。

  • 现在只需验证这两个映射互为逆映射,即验证 ρ1(ρ(H))=Hρ(ρ1(T))=T. 后者是显然的,因为ρ是满射。对于前者,设有陪集分解H=hN,则 ρ1(ρ(H))=ρ1(ρ(h))=hN=H.

 ◻

循环群,生成元与群的表现

循环群是最简单、最基本的一类群,但仍然十分重要。循环群Zn有多种描述方法,比如可以描述成正n边形的旋转变换群,也可以描述成模n的余数类的加法群。循环群的本质特点是,它可以仅由一个元生成。这就是说,可以找到其中一个元素a,通过不断的作逆a1和乘法1,a,a2,a3,可以得到群G 中的所有元素。我们把话说得更明白一点:

定义 1.6. 设G是一个群,SGG的一个子集。则G中所有包含S的子群的交,也即包含S的最小子群,称为由S生成的子群,记为S. 如果G=S ,则称G是由S生成的群,称SG的一组生成元。若一个群可由其中一个元素生成,即存在aG使得G=a,就称G循环群

按照这个定义,除了有限循环群Zn以外,可以有无限循环群,而那本质上就是Z.

于是,循环群Zn可以想象成一个由抽象字母a生成的,满足关系an=1的群,这种用生成元与约束关系描述群的方法叫做群的表现,这个例子我们记作 Zn=a|an=1.

1.9. 类似的,我们容易想象,群D3可以抽象地描述成由抽象字母στ生成,满足约束关系σ3=τ2=1以及στ=τσ1 的群。我们可以试试列出一系列这两个字母生成的元素 1,σ,σ2,τ,τσ,τσ2 在群D3这个特例中,任何抽象字母生成的元素,比如στσ2,都可以写成上面的形式,也即τiσj的形式。这是因为 στσ2=τσ1σ2=τσ. 我们把这记为 D3=σ,τ|σ3=τ2=(στ)2=1 (条件στ=τσ1可以简化为(στ)2=1).这容易推广成一般的Dn的定义 Dn=σ,τ|σn=τ2=(στ)2=1. 这个定义是抽象的,它完全没有涉及对称,却把群的结构简单明了地确定下来了!

练习 1.26. 接上例,请计算 στσ1τστ1.

本节的描述算是启发性,非正式的。我们今后会严格地对待这种群的表示方法。

n阶循环群有多少个生成元?问题的答案是明显的,设a是一个生成元,则ai是生成元当且仅当in互质。也就是说,一共有φ(n)个生成元,这里φ(n)表示1n中与n互素的数的个数,也即数论中的欧拉函数。关于这个欧拉函数,有一个有趣的恒等式 d|nφ(d)=n 其中符号d|n表示d整除n, 求和号d|n表示对n的所有正因数d求和。这个等式可以由如下观察得出:对于每一个d|n,循环群Zn中有且仅有一个d阶子群,而这d阶子群的生成元有φ(d)个。每个gZn都恰好是某一个Zd的生成元。

关于循环群,有一个刻画了循环群的性质的重要命题:

定理 1.6. G是有限群。若对n=|G|的任何因数dG中至多只有一个d阶子群,则G是循环群,反之显然也成立。

Proof. 注意到,任何gG都有一个由它生成的循环子群g。由假设,这个阶数的子群至多只有一个。对于d|n若有一个d阶循环子群,则记它的生成元集合为gen(d),若没有,则令gen(d)表空集。由于任何gG都是某个d阶循环群的生成元,我们有 G=d|ngen(d)d阶循环群有φ(d)个生成元,因此 nd|n|gen(d)|d|nφ(d)=n 我们发现等号成立,故对每个d|n它恰有一个d阶循环子群,这对d=n也是对的,因此它是循环群。 ◻

练习 1.27 (). (没有听说过域的可以跳过)证明,域F的乘法群F×=F{0}的任何有限子群必是循环群。

置换群与共轭

置换群是有限群中最重要的一类群,说是最基本也不为过,原因是:置换群事实上包含了所有的有限群,即任何有限群都是置换群的某个子群!(这一点我们将在后面给出)

置换的结构与共轭

置换群的基本要素当然是置换。对于置换来说,置换的(不相交的)轮换分解最能体现出它的结构。我们知道,每个置换都有一个不相交轮换的乘积分解,而且可以有很多轮换分解,但事实上,其中那个置换的不相交轮换分解在不记轮换之间的次序之下是唯一的。这一点比较直觉,证明只需用归纳法,没有太多可说的。

命题 1.3. 每个αSn都有不相交的轮换β1,,βk使得 α=β1βk. 而且这种分解是唯一的,在不记次序的情况下。

Proof.α有两个不相交的轮换分解 α=(α11α1k1)(α21α2k2) α=(β11β1l1)(β21β2l2) 如果α移动了α11,那么α11就会出现在另一个轮换分解式中的某个轮换中,不妨设β11=α11. 让α不停地作用在α11上,依次得到α11=β11,α12=β12显然必然有这两个分解式的第一个轮换相等。两个式子同时乘以该轮换的逆,我们得到一个轮换个数更少的式子。重复这个过程,不难得到命题。 ◻

于是每个置换都有一种唯一的轮换结构,比如说(123)(45)(234)(15)具有相同的轮换结构,只是数字不同而已。我们说它们的轮换结构是23.类似的,设α的轮换分解中长度为k的轮换有mk个,则我们说它的轮换结构是2m23m3kmk.

具有相同的轮换结构就像是矩阵具有完全相同的约当块一样,可以通过“换基”来实现“相似”,比如 (123)(45)=σ1(234)(15)σ 其中σ=(14).这种现象我们称之为共轭:

定义 1.7. 对于a,bG,若有gG使得 a=g1bg 我们称abG中共轭。易验证共轭是一个等价关系。只与自己共轭的元素7我们称为中心元素,所有中心元素记为C(G)Z(G),称为群G的中心.

练习 1.28. 证明群G的共轭类个数等于|G|当且仅当G是Abel群。

练习 1.29. gG是某个固定的元素,验证,共轭映射 fg(a)=gag1. 是群G的自同构。

练习 1.30 (). 接上一题,我们于是有从GAut(G)的映射 i:GAut(G)gfg 验证这也是一个群同态。证明keri=Z(G)从而得知Z(G)G的正规子群。
Imi=Inn(G)Aut(G),称它为群G的内自同构群,于是由同态基本定理 Inn(G)G/Z(G).

作为给大家看的一个例子,我们证明一个有用的命题。

命题 1.4. G/Z(G)是循环群,则G是Abel群。

Proof.a是循环群G/Z(G)的一个生成元在G中的原象,可作G关于Z(G)的陪集分解 G=i=0n1aiZ(G) 故每个元素形如aiz,显然有aiz1ajz2=ajz2aiz1. ◻

练习 1.31 (). 证明,若Aut(G)是循环群,则G是Abel群。

练习 1.32 (). |G|=p2,其中p是素数,证明G是Abel群。

练习 1.33 (). αAut(G),令I={gG|α(g)=g1}.证明:若 |I|>34|G|G是Abel群。

那么,既然共轭是一个群上的等价关系,群中的元素自然就会划分为一些等价类,这些等价类就称作共轭类。一般来说,群的共轭类的情况比较复杂,但是对于Sn 情况比较简单。

练习 1.34 (). D5的共轭类个数。

练习 1.35 (). p>2是素数,求Dp的共轭类个数。

定理 1.7. 两个置换α,βSnSn中是共轭的,当且仅当它们具有相同的轮换结构。

Proof. 设有两个具有相同轮换结构的置换 α=(α11α1k1)(α21α2k2) β=(β11β1k1)(β21β2k2) 显然可作置换σ使得σ(αij)=βij.则有 α=σ1βσ. 这等式可用下图8表示(其中若j=ki,下标i(j+1)应理解为i1.) rendering math failed o.o 由共轭推出轮换结构相同也是简单的,设α定义如上,则有 γαγ1=(γ(α11)γ(α1k1))(γ(α21)γ(α2k1)). ◻

容易看出,一个群G的子群H若是正规子群的话,那H一定是由一些完整的共轭类拼成的。反之,把一些共轭类拼起来,如果恰好也成一个子群的话,这个子群就是正规子群。

练习 1.36. 好好想一想上面那句话,并证明 {1,(12)(34),(13)(24),(14)(23)}S4.

练习 1.37 (). 观察 {1,(12)(34),(13)(24),(14)(23)}S4. 试说明正规子群不具有传递性。

练习 1.38 (). 我们称HGG的特征子群,如果每一个G的自同构α都将H中的元素映到H中。证明,若HNG并且HN的特征子群,则HG.即,正规子群的特征子群还是正规子群。

练习 1.39 (). p|G|的最小素因子。证明若有p阶子群AG,则必有AZ(G).

置换的奇偶性

置换有奇置换和偶置换之分,用符号sgnσ来表示:奇置换是1,偶置换是1.置换的符号sgnσ我们并不陌生,在线性代数中已经碰过了,它可以定义为1 的逆序数次方,也可以定义为使如下等式成立的函数。 1ijn(Xσ(j)Xσ(i))=sgnσ1ijn(XjXi). 任何置换都可以分解成对换的乘积,这是因为任何轮换都能分解成对换的乘积,即(12k)=(1k)(1,k1)(13)(12),我们还可以定义置换的符号为可分解成的对换的个数的奇偶性,可以证明,置换的任何对换分解的对换的个数的奇偶性不变。 按照这种说法,一个对换(12)是奇置换,奇数长度的对换如(123),(12345)都是偶置换。

我们将给出另外一种定义,我们先解释一下这个定义是怎么来的。我们知道,每个置换σSn都有一个唯一的不相交轮换分解,如果把被它固定的元素c 视为长度为1 的轮换(c),我们以t记该置换的不相交轮换分解中轮换的个数,包括长度1的轮换。那么定义 sgnσ=(1)nt. 首先,对恒等置换,t=n,因此sgn1=1.对于轮换(12k)t=nk+1, 故sgn(12k)=(1)k1.而nt事实上是对每一个轮换的长度l 减去1后再求和,其奇偶性将与轮换分解中奇置换的个数有关。 麻烦的地方是,我们需要证明这是一个同态。直接证明并不容易,所以我们走稍微简单一点的路线:即证明对任意对换τsgn(τσ)=sgn(τ)sgn(σ)=sgn(σ).

引理 1.1. 对任何对换τsgn(τσ)=sgn(τ)sgn(σ)=sgn(σ).

Proof.τ=(ab)σ的不相交轮换分解的任何一个轮换不相交,等式是显然的。 否则若有一个相交元素,容易计算出 (ab)(ac..d)=(ac..db) (ac..db)的长度相对(ac..d)增加了1,故符号改变了。 若有两个相交元素,考虑 (ab)(abc..d)=(ac..d) 计算轮换的长度减1之和,右边比左边的(abc..d)1.对于另一种情况 (ab)(ac..dbe..f)=(ac..d)(be..f) 计算轮换的长度减1之和,右边比左边的(ac..dbe..f)1. 故我们立即得出命题。 ◻

定理 1.8. sgn:Sn{1,1}Z2是一个同态。

Proof. 由第一章,可设α=τ1τ2τkα的对换分解,则 sgn(αβ)=sgn(τ1τ2τkβ)=sgn(τ1)sgn(τ2τkβ)=sgn(τ1)sgn(τk1)sgn(τk)sgn(β)=sgn(τ1)sgn(τk1τk)sgn(β)=sgn(τ1τ2τk)sgn(β)=sgn(α)sgn(β). ◻

同态sgn的核我们记作An,称作n交错群,也就是全体偶置换组成的群。作为一个推论,AnSn.

练习 1.40. 确定置换(132)(421)(12345)和置换 (12n1nnn121) 的奇偶性。

练习 1.41. 证明一个置换的阶等于它的不相交轮换分解中的所有轮换长度的最小公倍数。

练习 1.42 (). S4中所有的元素进行共轭类分类,并找出它所有的正规子群。

练习 1.43 (). 证明A2n有子群同构于Sn.

直积

我们可以用老群来构造新的群,一种非常简单的构造就是直积。设G1,G2都是群,我们要赋予笛卡尔乘积G1×G2群的结构,最简单的方法就是把它的乘法定义为分量乘法,即 (g1,g2)(h1,h2):=(g1h1,g2h2). 这样一来群中的幺元素就是(1,1),(g,h)的逆就是(g1,h1).这个群我们就记作G1×G2.如果G1,G2都是Abel群,有时这个构造记为直和G1G2,群运算用加号代替。

练习 1.44. 研究群Z2×Z2(也即群Z2Z2)并证明它同构于V={1,(12)(34),(13)(24),(14)(23)}.

练习 1.45 (). 证明有 D6D3×Z2. 事实上,当n是奇数时都有 D2nDn×Z2.

练习 1.46 (). 证明当m,n互质时有 Zm×ZnZmn

群的作用

基本术语

群本质上是对称群/变换群/作用群的抽象结构。本章我们就来研究群的作用,即将抽象的群的元素实现为具体的变换/作用。比方说,循环群这种对称结构如何作用在各种对象上?我们知道,它可以实现为正多边形的旋转,即有群同态 Zn{n边形的旋转群} 其中Zn的生成元被映射到某个单位旋转。也可以这样描述这种作用:将正n边形的旋转理解为顶点集{1,2,,n}上的一个置换,从而得到(单)同态 ZnSn 其中Zn的生成元被映射到轮换(123n). 我们研究群的尽可能广泛的作用,就是考虑群G到尽可能大的一类变换群的同态。一般考虑的大的一类变换群主要是两类:置换群和矩阵群。研究到矩阵群的同态的是群的线性表示论(简称群表示论)。我们研究群在集合上的作用时,就主要是研究的到置换群的同态。以Sym(X) 记集合X 上的所有置换9,即所有单满映射,称之为X 的对称群。那么我们称群G 在集合X 上的一个作用就是指一个同态(不要求是单同态或满同态) α:GSym(X). 这也称为群G的一个置换表示,简称表示。也就是说,α(g)将成为集合X上的一个变换(置换),单满射,即α(g):XX.这个变换可以作用在xX上得到α(g)(x)。这种记号比较严格,但过于冗长,给定了同态α后不妨把G想象为一堆“算子”,直接用gx表示α(g)(x).

我们先来给出群作用基本的术语。如果α是单同态,就称这个作用是忠实的(faithful),也就是说,这个作用不会把群中的两个不同元素变成相同的变换。对于xX,集合 Gx={gx|gG} 称为x轨道(Orbit)。容易证明,a,b属于同一个轨道,也就是存在g使得a=gb,是一个等价关系,这一点与G是群密切相关。如此而来,X中的元素划分为一些不相交的等价类的并,也就是不相交的轨道的并。如果X只有一个轨道,我们就称这个作用是传递的(transitive),这也就是说,任何一个x 都可以被G 中的某一个作用映到任何一个给定的y.

轨道公式

定义 2.1. 给定了群G在集合X上的作用,我们用 Stab(x)={gG|gx=x}G中所有保持x不动的变换。这是G的一个子群,称之为x稳定化子(Stabilizer).

练习 2.1 (). 有一个比传递更强的概念,叫双传递(doubly-transitive),它是指对任意的xy,zw,存在gG使得 (gx,gy)=(z,w). 证明:GX上是双传递的当且仅当对所有的xX都有Stab(x)G{x}上是传递的。

既然Stab(x)是个子群,我们就可以作陪集分解 G=igiStab(x) 其中,每个陪集在x上的作用全部一致,都是gix.并且不同的陪集显然给出在x上不同的作用,否则ax=bxa1bStab(x)aStab(x)=bStab(x).我们立马得到了如下简单而基本的轨道公式(计算轨道长度)

定理 2.1 (轨道公式). |Gx|=[G:Stab(x)]

由于X划分为一些轨道,我们以xi记每个轨道的代表元素,则显然必须有 |X|=|轨道|=i[G:Stab(xi)]. 不要小瞧这个轨道公式,有了它,我们就有了计算一些对称群的阶数的方法,因为|G|=|Gx||Stab(x)|.

2.1. 我们计算|Dn|.取正n边形的某一个顶点x,由于作用是传递的,|Gx|=n.而Dn中只有两个变换保持x不变,平凡变换和某个反射(轴对称)变换。故 |Dn|=|Gx||Stab(x)|=2n.

练习 2.2 (). 计算正四面体的对称群的阶数。

2.2. H,KG,aG, 我们计算如下双陪集集合的元素个数 HaK={hak|hH,kK}. 考虑H×KG上的如下作用: ρ:H×KSym(G)(h,k)(ghgk1) 不难看出,HaK就是a在该作用下的轨道。于是根据轨道公式, |HaK|=[H×K:Stab(a)]. 我们考虑 (h,k)Stab(a)hak=ah=ak1a1HaKa1.于是 |HaK|=|H||K||HaKa1|.

另外,我们马上能得到如下计算轨道个数的公式,对G的任何子集SG我们引入记号 XS={被所有S中元素固定的xX}. 则我们有

定理 2.2 (Burnside). 轨道的个数N有如下公式10 N=1|G|gG|Xg|.

Proof. N=xX1|Gx|=xX|Stab(x)||G|=1|G|xXgG1gx=x=1|G|gGxX1gx=x. ◻

练习 2.3 (). G传递地作用在X上,|X|>1.则一定存在一个gG没有不动点。

练习 2.4 (). G是一个阶数为pk的群。证明若G作用在集合X上,则有 |XG||X|modp.

表示的核

我们来求kerα,这一般是重要的,因为这样,由同态基本定理,G/kerα同构于置换群Sym(X)的某个子群。

kerα是什么呢?就是那些固定所有元素的g,因此 kerα=xXStab(x). 如果这个作用是传递的,就有 kerα=gGStab(gx). Stab(x)Stab(gx)有自然的关系。固定x的那些变换,稍微改一改,也可以拿去固定gx.这只需要先复合一个g1,再施加Stab(x),再复合g.换而言之我们发现 gStab(x)g1Stab(gx). 反过来一样有 g1Stab(gx)gStab(x). 因此我们发现 Stab(gx)=gStab(x)g1. 因而,在作用是传递的时,有 kerα=gGgStab(x)g1. 这是一个正规子群。这事实上也启示我们如下平凡的命题:设HG,则gGgHg1G

常见的作用(表示)

群不光可以作用在其它对象上,它很多时候可以自然地作用在自己的某些结构上。在群论的研究中,这是一种极为重要,朴素而强大的方法。我们举几个简单的例子。

共轭作用

G以共轭作用作用在群G上,也即 α:GSym(G)x(gxgx1)

练习 2.5 (). 能否将共轭作用定义为 α:GSym(G)x(gx1gx) 为什么这样定义不行?

关于这个作用的轨道就是共轭类,容易看出,作用的核kerα=Z(G).对于gG,其稳定化子Stab(g)我们记作CG(g)={hG|gh=hg}11,这是G 的一个子群。我们把这个情形下的轨道方程 |G|=i[G:CG(gi)] 称之为群G类方程。值得注意的是,有些元素gG可能轨道长度为1,也就是只与自己共轭的,中心元素,Z(G).如果设|G|=pn,其中p是某个素数,则有 pn=|Z(G)|+i,giZ(G)[G:CG(gi)] 易知[G:CG(gi)]必是p的倍数。故此时的|Z(G)|必须是p的倍数,因此|Z(G)|>1.换而言之我们得到了结论

命题 2.1. |G|=pn,n>1,则G有非平凡的中心Z(G).

练习 2.6 (). 若以c(G)记群G的共轭类的个数,证明,有 c(G×H)=c(G)c(H).

练习 2.7 (). 记号如上,本题中设G是非Abel群,证明有 c(G)58|G| 等号能取到吗?进一步,证明,若p|G|最小的素因子,则有 c(G)p2+p1p3|G|

练习 2.8 (). 上题中最后的不等式,对任意素数p,等号能取到吗?

正则表示(作用)

G以(左)12乘法作用在群G上,也即 α:GSym(G)g(aga) 即将g自然地视为一个G上的置换α(g).这是一个忠实表示。

练习 2.9. 证明这是一个忠实、传递的作用。

我们马上得出Cayley定理:每个群都同构于某个置换群的子群。这看起来似乎弱智无比,但是就是这样朴素的观点我们可以得到非平凡的结论,我们举一个例子。

命题 2.2. G4k+2阶群,那么它一定有一个指数为2的正规子群。

Proof. 考虑群的左正则作用 α:GSym(G) 由于这是忠实表示,我们可以把Gα(G)等同起来。 那么,每个α(g)都是一个G上的置换,由于群乘法具有逆的原因,除非g=1,这个置换不可能固定任何群中的元素(ga=ag=1.) 因此可以将α(g)写为一些长度大于1的不相交轮换的乘积。现取g为群中的一个二阶元素,由前面的习题我们知道在偶数阶群中这是一定可以取到的。因此,α(g)分解成2n+1个不相交的对换的乘积,因而是奇置换。于是我们证明了G中有奇置换,因而G中的所有偶置换构成一个指数为2的正规子群。 ◻

推论 2.1. k1,则4k+2阶群一定不是单群。

诱导表示(陪集上的表示/作用)

给定了群G的一个子群H后,有(左)陪集集合G/H,群G可以自然地作用在G/H上。 α:GSym(G/H)g(aHgaH) 这称为(左)诱导表示13。它显然是传递的。它的核是 kerα=gGgHg1 并注意事实上有kerαH.运用这个表示可以得到很多厉害(其实很简单)的结论。

2.3. H是无限群G的一个具有有限指数的真子群,那么G一定有一个具有有限指数的真正规子群。

Proof. 考虑G在陪集G/H上的诱导表示 ρ:GSym(G/H) 由于[G:kerρ]|Sym(G/H)|=[G:H]!是有限的,我们完成了命题的证明。 ◻

以下是另外一个典型的应用

命题 2.3. p|G|最小的素因子,那么若HG[G:H]=p则有HG.

Proof. 考虑在陪集集合G/H上的诱导表示 α:GSym(G/H) 由于有G/kerα同构于Sym(G/H)的一个子群,因而必须有|G/kerα|[G:H]!的因数。现在由于kerαH,我们有 |G/kerα|=|G||kerα|=|G||H|[H:kerα][G:H]=p的倍数。由于p|G|的最小素因子,我们知道[H:kerα]1p的倍数。若不是1,必有p2|p!,这不可能,故 H=kerαG. ◻

练习 2.10 (). G是大于3阶的单群,HG,证明[G:H]>4.

循环群的作用:Cauchy定理

本节我们看一个群作用的强大威力的例子,我们证明如下的柯西定理:

定理 2.3 (Cauchy). p|G|的一个素因数,则G中有p阶元素。

在开始看证明之前我们来理解一下思路。p=2的情形已经作为一道练习题做过了,还记得做法吗?大家的做法,估计就是对G中的元素配对,gg1配一对,二阶元素gg1是相同的,就无法配对,最后因为群的阶数是2的倍数,配了对的元素个数也是2的倍数,我们得出满足x2=1的元素个数有偶数个。由于12=1,我们知道一定有二阶元素。

不过,这个证明初看起来似乎并不能推广到p>2的情形。但是,如果你用群与对称的观点重新叙述上面的证明,你马上就可以看出如何作推广。我们要将上述证明中出现的现象理解为一种对称性,那么就一定要有对称变换。我们观察到的现象是什么呢?那就是在所有的有序对X={(g,g1)|gG}集合上,有一种对称变换(x,y)(y,x).这就是群Z2在该集合上的作用。那么X拆分为一些轨道的并。而在该作用下轨道的长度为1等价于说g=g1也就是g2=1,由轨道方程 |X|=|{(g,g)|g2=1}|+|其它长为2的轨道| 轨道公式表明轨道的长度只能是12,我们立刻得出|{g|g2=1}|2的倍数。现在,我想,如何推广这个证明已经至为显然。

Proof.X={(g1,g2,,gp)|g1g2gp=1},并设a是群Zp的生成元,考虑群ZpX上的如下作用 α:ZpSym(X)af 其中f:XX是把(g1,g2,,gp)映到(g2,g3,,gp,g1)的映射。

我们需要验证g2g3gpg1=1,这可由ab=1ba=1得到。现在由轨道方程 |G|p1=|X|=|{gG|gp=1}|+|其它长为p的轨道| 我们立得|{gG|gp=1}|p的倍数,由1p=1立即知道群G中存在p阶元素,而且至少有p1个。事实上,可以得到更强的结论:(p阶元素个数+1)p的倍数。 ◻

练习 2.11 (). |G|=mp,1<m<p,其中p是素数。证明ZpG.

练习 2.12 (). G6阶Abel群,按如下提示,证明GZ6.(由柯西定理,G中有2,3阶元素。从而GZ2×Z3Z6.)

练习 2.13 (). G6阶非Abel群。按如下提示,证明有GS3,从而只有两个6阶群:Z6S3.

  1. 先证明Z(G)=1.

  2. 证明G中必恰有32阶元素。

  3. 考虑G在集合X={a,b,c}上的共轭作用,其中a,b,c都是2阶元素。(需先证明这是X上的作用。)

  4. 证明{a,b,c}能生成群G,由此证明上述作用是忠实的。同态基本定理给出GS3.

在子群上的共轭作用

AG是一个子群,容易发现,g1Ag也是一个子群。因为映射xg1xg是自同构,而自同构限制在子群上还是同构,其像必然为群。我们称子群AB共轭,如果A=g1Bg.那么容易看出,G可以以共轭作用作用在它的一些子群上。容易看出,一个子群可以有很多个共轭子群,而G的正规子群就是那些在G 的共轭作用下不变的子群,也就是只与自己共轭的子群,这时它单独组成一个共轭类。

对于SG,我们以记号NG(S)表示{gG|gS=Sg},称为S正规化子。容易看出,AG的稳定化子是NG(A),从而有共轭类的大小为 [G:NG(A)].

练习 2.14 (). |G|=pn,证明G的非正规子群个数是p的倍数。

群在计数问题中的应用

如果要给一个立方体的两个面涂上红色,有多少种涂法呢?初看起来似乎有 (62)=6×52=15 种涂法,但是事实上很多种涂法都是相同的,它们之间只是差一个旋转而已。换而言之我们发现在对称的物件上涂色,只需考虑该物件的对称群,并让这个群作用在所有可能的涂色集合上。想知道两种涂法是不是一样的,只需看它们在不在一个轨道里。故,若要知道本质上不同的涂色有多少种,只需数轨道的个数就可以了!而Burnside定理提供了一种方案。

我们举一个简单的例子来说明这个方法。考虑这样一个计数问题:在长度为n的圆圈形项链上染色,有c种不同的颜色可用。两种染色如果在旋转,翻转(轴对称)下是相同的,则视为一种染色。有多少种不同的染色呢?我们考虑群作用的空间 X={(a1,a2,,an)|aic种颜色之一} 并让Dn以如下方式定义作用在该空间上:

  1. σ(a1,a2,,an1,an)=(a2,a3,,an,a1)

  2. τ(a1,a2,,an1,an)=(an,an1,,a2,a1).

容易看出由于Dn中的元素都能表示为σiτj的形式,只需定义σ,τX上的作用即可。不难验证上述定义确实给出了DnX上的一个作用(需要验证σn=τ2=(στ)2=1的作用是平凡的)。那么现在我们的问题就等价于计算X中的轨道数目N,由Burnside定理, N=1|Dn|gDn|Xg|. 现在来考虑Xg的大小。首先Dn可视为Sn的子群,它事实上是以下标置换的方式作用在X上。于是可设gDnSn中的不相交轮换分解: g=c1c2ck=(c11c12c1l1)(c21c22c2l2) 其中ci=(ci1ci2cili)是一些不相交的轮换,长度为li. 比如σ=(123n), τ=(1,n)(2,n1).

如果g要固定一个xX,即gx=x,我们可以得到 x=(a1,a2,,an)=(ag(1),ag(2),,ag(n))ai=ag(i).由gx=x自然有gkx=x, 从而ac11=ac12==ac1l1.这表明在轮换c1的所有分量中对应的位置必须为相同的涂色。类似的,在所有轮换上都能得到相同的结果,从而|Xg|=cg的轮换个数, 注意考虑轮换时要包含1轮换.

注意到在Dn的同一个共轭类中的元素的轮换分解形状是相同的,一般来说只需要找出Dn中所有共轭类并将其轮换分解算出即可。在本例中,我们可以考虑 Dn={1,σ,σ2,,σn1,τσ,τσ2,,τσn1} 注意到σj(τσi)σj=σjτσij=τσi2j, 因此当n为奇数时,所有τσi都是共轭的,于是与τ一样,形如 τ=(1,n)(2,n1)(n12,n+32)(n+12) 都有n12+1=n+12个轮换。当n为偶数时可能分为两个共轭类τσ2k+1τσ2k, 分别与τστ一样,分别具有n2n2+1个轮换。

对于ZnDn中的元素,σkkn互素时都是长度为n的轮换。当他们的最大公因数(k,n)=d时,是d个长度为nd的轮换之积。回忆我们之前在循环群一节说过对于n的因子d, nd阶子群dZnZn的生成元,也就是满足(k,n)=d的元素σk的个数为欧拉函数φ(nd),于是现在我们可以得出N的计算公式 N=1|Dn|gDn|Xg|=12n(k=1nc(k,n)+12|nn2cn2+12|nn2cn2+1+12|n+1ncn+12)=12nd|nφ(nd)cd+12|ncn2(c+1)4+12|n+1cn+122.

练习 2.15 (). 假定在长度为2n的项链上,要求只用两种颜色且每种颜色必须恰好使用n个珠子。有多少种不同的染色方法?

Sylow定理

Sylow(西罗)定理可能是初等群论中最重要的一个定理,它也是群的作用的一个精妙的应用。

定理 2.4 (Sylow). G是群,|G|=mpn,素数pm.那么有:

  1. 存在pn阶的子群PG,称为G的Sylow-p子群。

  2. N(pr)Gpr阶子群的个数,rn,有 N(pr)1modp.

  3. 所有Sylow-p子群互相共轭,因而有N(pn)=[G:NG(P)].

值得注意的是,一般的p子群未必是互相共轭的。

Proof.|G|=npr(没有要求np互素,即不要求r是极大的),我们来考虑G中所有pr元子集,其全体记为X,有|X|=(nprpr). 现在可以考虑GX上的左乘作用: ρ:GSym(X)g(SgS) 我们将X拆分为一些轨道的并 X=i=1mXi 并有|Xi|=[G:Stab(Si)]. 由于Stab(Si)Si=Si我们可以分解 Si=j=1kiStab(Si)gij 于是有ki|Stab(Si)|=pr以及 |Xi|=nki. 注意到ki一定形如p的某个次方,并且ki=1当且仅当Si形如Pg, 其中PGG的一个pr阶子群, gG.于是ki=1当且仅当Ti中恰好包含了一个pr阶子群,这表明 |X|=(nprpr)=i=1mnkinki=11modnp. 于是 1n(nprpr)N(pr)modp.

现在只需计算左边的数模p的余数。首先它等于(npr1pr1),于是等于表达式(1+x)npr1pr1次的系数。在模p的形式幂级数环Zp[[x]]中考虑该表达式,有 (1+x)npr1+x=(1+xpr)n1+x=(1+nxpr+)(1x++(1)pr1xpr1+) 我们得出所求系数模p(1)pr11,于是我们得到所需命题。当然,也可以用其它方法算出该数,比如直接计算,或者考虑G为循环群的特殊情形,我们知道此时必有N(pr)=1,但等式左边的数与群无关,只与群的阶数有关,这就直接给出了所需结果。

现在我们来证明所有Sylow-p子群是互相共轭的。首先,G在所有Sylow-p子群上有共轭作用,并且每个轨道的阶数[G:NG(P)]必然与p互素。取PG的一个Sylow-p子群,考虑P在全体Sylow-p子群上的共轭作用。于是QP的作用下不动等价于说PNG(Q).此时考虑投射PNG(Q)NG(Q)/Q,由于商群NG(Q)/Q的阶数里没有p,而P中的元素都是pk阶的,我们知道这个投射的像必然是1,于是得到PQ,因此P=Q. 这表明只有P自己在该共轭作用下不动,其它轨道都是长度为p的次方。但是G的共轭作用下每个轨道都不被p整除,因而其每个轨道限制在P上作用时,必然出现长度为1的轨道,而我们已经证明只有P自己在共轭作用下不动,于是只能有一个G-轨道。 ◻

推论 2.2. 如果|G|=npr, np互素,且有唯一的一个Sylow-p子群,则这个子群是正规子群。

推论 2.3. 如果|G|=npr, np互素,则N=N(pr)=[G:NG(P)]n的因数且形如pk+1.

2.4. 我们来证明,15阶群一定是循环群。根据Sylow定理可以考虑G的两个分别为35阶的Sylow子群P3P5.并且有 N(3)1mod3 并且N(3)5的因数。但满足同余式的数只有1.同理我们发现N(5)=1,因此对|G|的所有因数d都只有一个d阶子群,它必然是循环群。

练习 2.16. G40阶群。证明它有一个正规的5阶子群。

练习 2.17 (). PG的一个Sylow-p子群,证明,若NG或者PG,则NPN的一个Sylow-p子群。

练习 2.18 (). 证明,若HG, PG的一个Sylow-p子群,则存在gG使得HgPg1H的一个Sylow-p子群。

练习 2.19. 找出S3的所有Sylow-2子群和Sylow-3子群。

练习 2.20 (). 试找出S4的所有Sylow子群。

就像我们已经看到的那样,Sylow定理经常和共轭作用联合使用,这是因为它们之间有天然的关系:Sylow-p子群是互相共轭的。除了Sylow定理最常见的数字上的应用必须熟练掌握以外,和共轭作用联合使用往往能得出非平凡的结论。

运用Sylow定理寻找正规子群

寻找正规子群很重要,通常可以用来分类群的结构/证明一个群不是单群。 而Sylow定理一个常见的应用是用Sylow定理来寻找正规子群,以下是利用Sylow定理寻找正规子群的常见的方法。

  • |G|=npr使pn互素, 计算Sylow-p子群P的可能个数N,它满足{N1modpN|G|的因数

  • 如果N=1,则由Sylow定理我们知道PG.

  • r=1, 则可考虑对每个r=1的素数p,对应的所有P所占的元素个数至少为N(p1)+1, 有可能利用这一点说明不可能有这么多Sylow子群。

  • r=2, 还可考虑两个Sylow子群的交H=P1P2, 如果|P|2>|G|则一定有|H|=p(因为|P1P2|=|P|2/|P1P2|), 并且有P1,P2NG(H) 从而G=NG(H), HNG(H)=G.

  • 还可考虑群GX={P1,P2,,PN}上的共轭作用ρ:GSym(X),其核kerρ可能为G的非平凡正规子群。

2.5. 我们证明,36阶群不是单群。考虑它的9阶子群的个数N,有N=14.若N=4,考虑G在这四个Sylow-3子群上的共轭作用 ρ:GS4|S4|=24因此ρ不可能是单射,并且由Sylow子群在G的共轭作用下传递我们知道上述作用不是平凡作用,于是kerρG构成了G的一个非平凡正规子群。

还有另一种证明,若N=4,考虑H=P1P2.由于36|P1P2|=81/|H|我们知道必然有|H|=3.但是P1,P2NG(H),于是有NG(H)包含了P1,P2生成的群,故而G=NG(H)HG的非平凡正规子群。

练习 2.21 (). 证明150阶群不是单群。

运用Sylow定理与共轭作用

如何来综合运用Sylow定理与共轭作用呢?如下引理描述了共轭作用如何与Sylow子群相互作用。

引理 2.1. H是某个p子群,作用在所有的Sylow-p子群上,则Pi单独组成一个轨道HPi

Proof. 有一边是显然的,我们来证明另一边。设a1Pa=Papk阶元素,则aNG(P).由于PNG(P), 考虑a在投射 NG(P)NG(P)/P 下的像,由于|NG(P)/P|显然与p互素,其像只能为单位元,故aP. 这足以证明命题。 ◻

命题 2.4. G的每个p方幂阶的子群H被某个Sylow-p子群包含。

Proof. 考虑用H共轭作用在G的所有Sylow-p子群上,则其轨道长度为1p的倍数。由于Sylow-p子群的个数是1modp, 我们知道一定有一个P单独组成一个轨道,因而由引理HP. ◻

命题 2.5. H是一个p子群,则包含它的Sylow-p子群的个数a1modp.

Proof.H作用在所有Sylow-p子群上,HP等价于P的轨道长度为1. 由于所有Sylow-p子群的个数1modp, 我们有 aa+其它轨道=N1modp. ◻

有限生成Abel群的结构

我们来研究所有能被有限个元素生成的Abel群的结构。注意不是所有Abel群都是有限生成的,比如Q就无法被其中有限个元素生成。 最简单的有限生成Abel群的例子是所谓n元自由Abel群Zn=Z×Z××Z,其由n个元素生成:e1=(1,0,,0),e2=(0,1,0),,en.它也可以称为自由Z模:Z模和Abel群是同一个概念。

设Abel群G能被其中有限个元素g1,,gnG生成,那么可以定义如下群的满同态 φ:ZnGi=1naieii=1naigi. 那么,根据同态基本定理,就有GZn/kerφ.于是,我们的目标便在于研究,Zn的所有子群长什么样,由此我们可以知道所有可能的商群。

先看n=1的简单情形,我们知道Z的子群只有0nZ而已,n1.于是Z的非平凡子群都是同构于Z的。

我们将在第四章证明如下(本质是线性代数)的重要结果

定理 2.5. Zn的子群一定是自由Abel群,即同构于Zm并且有mn.事实上,设HZn则有一组αiG以及一组非负整数di使得di|di+1H=Zd1α1Zd2α2Zdnαn.

推论 2.4. 所有的有限生成Abel群都同构于某种 ZmZd1Zd2Zdk.

推论 2.5. 所有有限Abel群都是有限循环群的直和。

半直积

半直积是一个群论中常用的重要概念。如果NG, 则可以构作商群Q=G/N.我们可能会想,会不会有GN×Q成立?对于绝大部分情形,这是不成立的。例如,读者可以考虑G=Z4,N=2Z4的情形,显然Z4Z2×Z2.

如果Q能够自然的实现为G的一个子群,即存在QG在自然投射GG/N下刚好是同构的,即合成 QGG/N 是同构映射的话,我们可以断言一个稍弱的命题:GNQ的半直积,即GNQ. 让我们来说明这一点,我们可以从NQG重新构造出来:每个gGQ中有一个像q, 那么gq1N, 也就是说,g=nq,显然这样的表示法是唯一的. 由于NG, G=NQ上的乘法运算也可以由QN上的共轭作用恢复出来: (n1q1)(n2q2)=n1q1n2q11(q1q2). 这启发我们从NQ以及(共轭作用)同态θ:QAut(N) 在集合N×Q上定义一个如下的群结构: (n1,q1)(n2,q2)=(n1θq1(n2),q1q2). 群中的幺元是(1,1),逆元是(θq1(n1),n1). 可以验证这样的定义满足结合律,于是N×Q在上述乘法下构成一个群,我们记作NθQ,称作NQ的半直积。

练习 2.22 (). 验证上述定义中的结合律。

2.6. G=Z3θZ2 根据θ:Z2Aut(Z3)Z2的选取有两种可能:

  1. θ=1Z3为常单位值同态,则G=Z3×Z2Z6.

  2. θ 为将θ(1)映射到αAut(Z3)中唯一非平凡的自同构α(a)=a1的同态,则有 G=a,b|a3=b2=1,bab1=a1D3.

练习 2.23. 验证DnZnθZ2, 同态θ是什么?

我们给出下面一个简单的判别法

命题 2.6. NGQG并且G=NQ以及NQ=1则有 GNθQ 其中θ就是QN上的共轭作用。

Proof.G=NQ以及NQ=1可以看出每一个元素gG都可以唯一的表示成nq的形式。因此由半直积的构造我们知道,可以定义明显的同态 GNθQ 它显然是单满射。 ◻

练习 2.24 (). 验证G=NH中,NG.

值得注意的是,虽然在半直积NθQ中,θ的选取有很多种可能,但是不同的选取可能作出同构的群。(事实上,同一个群也有可能有不同的半直积表示。)为了应用中方便看出这些同构的群,我们给出以下两个判别法 来判断NθQNθQ.

命题 2.7 (N的对称). 如果存在αAut(N) 使得对所有的 n,q都有 θq(n)=α1(θq(α(n))) 或者等价的说,有交换图表 rendering math failed o.o 那么就有 NθQNθQ.

Proof. 构作同态 φ:NθQNθQ φ(n,q):=(α(n),q). 首先验证它是一个同态,我们有 φ((n1,q1)(n2,q2))=φ(n1θq1(n2),q1q2)=(α(n1)α(θq1(n2)),q1q2)=(α(n1)θq1(α(n2)),q1q2)=φ(n1,q1)φ(n2,q2). 它显然是单满射。 ◻

完全类似的我们有如下命题

命题 2.8 (Q的对称). 如果存在βAut(Q) 使得对所有的 n,q都有 θq(n)=θβ(q)(n) 或者等价的说,有交换图表 rendering math failed o.o 那么就有 NθQNθQ.

练习 2.25 (). 证明上述命题。

练习 2.26 (). 证明群同构 a,b|a3=b7=1,aba1=b2a,b|a3=b7=1,aba1=b4.

练习 2.27 (). 找出所有pq阶群,p,q都是素数。证明最多只有两个不同的同构类。

练习 2.28 (). G=ZpθZn,其中p是一个素数,证明G的共轭类个数c(G)满足 c(G)=n(1+p1h2). 其中h表示θ的阶,即使θh=1的最小数。

练习 2.29 (). Q是循环群,并且θ(Q)θ(Q)Aut(N)中共轭,证明 NθQNθQ. (提示:证明有αAut(N),βAut(Q)使α1θqα=θβ(q).)

|G|15的所有群

这一节将包含相当多的例子:我们将分类所有阶数不超过15的群,即在此中找出所有不同构的群。首先,应当注意到,p是素数时,p阶群仅有p阶循环群Zp这一个。于是还剩下n=4,6,8,9,10,12,14,15这些阶数。我们已经证明p2阶群只有两个,Zp2Zp2.现在考虑如下命题

命题 2.9 (|G|=pq的情况). 1<p<q是两个素数,Gpq阶群,则

  1. p|q1,则GZpqGZqZp.

  2. pq1,则GZpq.

Proof. 由Sylow定理指出q阶循环子群,记为Zq,是G的正规子群。取ZpG的一个Sylow-p子群,由于显然|ZqZp|=1以及G=ZpZq我们得到G=ZqθZp,其中 θ:ZpAut(Zq)Zq1. 这表明,若pq1, 上述映射必然是平凡的,于是GZq×ZpZpq.p|q1, 考虑非平凡θ的选取,这样θ就成了单同态。但ZpZq1中的嵌入像只有一个,于是这些非平凡态射之间只差Zp的一个自同构。于是使用Q的对称引理告诉我们它们导出的群都是同构的。 ◻

于是要讨论的主要难点集中在n=8,12这两个阶数上。

8阶群的分类

交换的8阶群只有Z8, Z4×Z2以及Z23.下面我们来研究非交换的8阶群。由Sylow定理可知G2k+14阶子群。不可能有5个,否则将至少占用5×(42)+2=12个元素。因此只能有1个或者3个。

如果只有一个4阶子群HG, 必然有HZ4,否则若HZ22, G中将没有4阶元素,推出G的元素都是1,2阶于是G是Abel的,这与我们讨论的情况无关。那么现在H=Z4.设aGH, 则必然有G=aHZ4Z2D4, 共轭作用的非平凡选择只有一种。但实际上D434阶子群σ,σ2,τ,τσ,σ2.

如果有34阶子群,注意指数为2的子群都是正规的。由柯西定理我们任意取一个2阶元素b,如果它不属于某一个4阶子群,G必然是半直积,于是可能为Z4Z2,这就是上面的D4.如果是Z22Z2=a,b,c|a2=b2=(ab)2=c2=1,cac1=b的情况,取a=τσ,b=τσ3,c=τ我们发现这还是D4.

现在设所有二阶元素b都属于所有4阶子群,由于这些4阶子群中至少有一个是Z4(否则G中只有二阶元素就Abel了),我们推出只有一个二阶元素bG.这将表明所有4阶子群都是形如Z4的。设i,j,k是它们分别的生成元,则有i2=j2=k2=b.现在考虑元素ij,它不可能属于ij, 否则若ij=ik就能推出ji,这将表明i=j,这不可能。于是必有ijk{b}, 如果ij=k则有ijk=b.如果ij=k1=kb,通过重新选择kk1我们可以化归到上一种情况。这些关系已经决定了群G,我们记这个群为Q8,称为四元数群。事实上,这个群正是由四元数体中的{i,j,k}所生成的 Q8={1,1,i,i,j,j,k,k}. 现在我们来说明Q8不同构于D4,这只需注意到Q8中有1个二阶元而D4中有5个。

12阶群的分类

对于12阶群,Abel群容易看出只有Z12,Z2×Z6这两个。现在只需考虑非Abel群的情形。对G用Sylow定理可知,G1个或3个正规的四阶子群H, 还有1个或4个三阶子群K.现在可以看出G=HKHθZ3, 其中HZ4或者Z22并且θ:Z3Aut(H)考虑为非平凡同态(平凡同态则得到直积,就是我们提到的两个Abel群了)。

先假设它有一个正规的4阶子群H. 若H=Z4, 考虑θ:Z3Aut(Z4)Z2,则θ必然是平凡的。

H=Z2×Z2, 我们知道Aut(H)S3H32阶元的置换群,则考虑映射θ:Z3Aut(H)=S3映到S3的唯一一个三阶子群A3Z3. 于是θ可看成Z3A3Z3的同构,从而不同的θ选取只差一个Aut(Z3)中的元素,由Q的对称引理可知它们导出的群G=Z22Z3是同构的。事实上,这个群并不是陌生的新群。

练习 2.30 (). 看出上述群就是A4.

现在来考虑它有34阶子群的情形,由于这3个四阶子群必定占掉(42)×3+1=7个元素,因此不可能有43阶子群,因为43阶子群将至少占去(31)×4+1=9个元素。我们推出此时只能有一个3阶子群K,因而它是正规的。 若H=Z4, 只有一种非平凡的半直积Z3Z4.

如果H=Z22, 那么θ:Z22Aut(Z3)Z2.容易看出只有三种非平凡的映射θ可以选取。但这三种选取只相差Z22的一个自同构,于是决定了相同的群 Z3Z22.事实上它就是D6.

练习 2.31 (). 证明它是D6.

现在我们来证明Z3Z4既不是D6也不是A4.由于A4中没有3阶的正规子群,Z3Z4不可能同构于A4.而D6中没有4阶元素,所以也不可能同构于它。

小阶群表

将我们的讨论以表格的形式总结起来,我们有如下所有不超过15阶的群的表格

阶数 Abel 非Abel
2 Z2
3 Z3
4 Z4,Z22
5 Z5
6 Z6 S3
7 Z7
8 Z8,Z4×Z2,Z23 D4,Q8
9 Z9,Z32
10 Z10 D5
11 Z11
12 Z12,Z22×Z3 A4,D6,Z3Z4
13 Z13
14 Z14 D7
15 Z15

环与域

定义和例子

从运算的角度讲,群是一个带有“乘法运算”的集合。当这个群是交换群时,这个运算通常写作加法。如果我们在集合上考虑加法与乘法两种运算呢?比如Z在加法下是一个Abel群,但同时还有乘法的结构。这是一种新的代数结构,叫做环。当然环上的加法和乘法不能随便给定,它们需要互相兼容,满足一些合理的运算性质。完整的定义如下

定义 3.1 (环). 一个集合R附带两种运算(+)()叫做环(ring),如果R+运算下构成一个Abel群,并且对任意的a,b,rR满足

  1. (结合律) (ab)r=a(br)

  2. (分配率) r(a+b)=ra+rb, (a+b)r=ar+br

  3. 存在乘法幺元1R满足r1=1r=r.

这里像通常一样约定了乘法的运算优先级高于加法,并且省略了字母之间的乘号。在环中,我们用0表示加法幺元,1表示乘法幺元。

值得注意的是在环的定义中我们不要求乘法一定是交换的,我们只要求加法一定是交换的。如果乘法还具有交换律,我们就把R称为交换环。

定义 3.2 (域). 如果R是一个环,并且任意非0元素rRR中都有乘法逆r1R满足 r1r=rr1=1 则我们称R是一个。如果R的乘法交换,则称R是一个

在环中,非零元素不一定有乘法逆。如果非零元素rR有乘法逆,我们就称r单位

练习 3.1. 找出环Z中所有单位。

环与域的概念在代数中有很多的例子,我们举几个常见的例子

3.1. 全体整数Z在通常的加法和乘法下构成一个环。

3.2. 全体有理数Q, 实数R, 复数C在通常的运算下都构成域。

3.3. 以整数为系数的所有x的多项式构成的集合 Z[x]:={anxn+an1xn1++a1x+a0|aiZ,n0} 在通常的多项式乘法和加法下构成一个环。类似的可以定义任何一个环R上的多项式环 R[x]:={anxn+an1xn1++a1x+a0|aiR,n0} 这也是一个环,其加法按通常的定义给出,乘法按 (i=0maixi)(j=0nbjxj)=k=0m+n(i+j=kaibj)xk 定义。容易验证其满足结合律,分配率。

3.4. S是由所有有限字符串组成的集合,定义Z[S]是这样一个环,它由所有字符串(还有Z)的有限形式和组成,比如 5+2hello3worldZ[S] 加法按自然的方式给出,乘法由字符串的连接给出: abcadc=abcadc (2a+3b)(2a3b)=4aa6ab+6ba9bb. 在这个定义下,Z[S]构成了一个非交换环,例如ab=abba=ba.

练习 3.2. 全体自然数N={0,1,2,}在通常整数运算下构成一个环吗?

练习 3.3 (). 验证集合Z[2]={a+b2|a,bZ}在通常运算下构成一个环。

练习 3.4 (). 考虑集合 Z(2):={abQ|作为既约分数,其分母b是奇数}. 它是一个环吗?是一个域吗?

练习 3.5 (). H={a+bi+cj+dk|a,b,c,dR}是由如下规则定义的一个环,其乘法由 ij=k,jk=i,ki=j ji=k,kj=i,ik=j i2=j2=k2=1 确定。称H为四元数代数,请你验证它是一个体。(提示:考虑(a+bi+cj+dk)(abicjdk))

类似的,我们也需要研究环与环之间的关系,就像群同态一样,可以定义环的同态和域的同态,它们需要保持运算结构和幺元。

定义 3.3 (环同态). 一个环之间的映射f:RS称为环同态,如果f满足

  1. (Abel群同态) f(a+b)=f(a)+f(b)

  2. (保持乘法) f(ab)=f(a)f(b)

  3. (保持幺元) f(1)=1,f(0)=0.

如果f还是单射,则称为单同态。如果f还是满射,称为满同态。如果f有一个同态逆,则称f为同构。 域同态也按环之间的同态来理解。

3.5. K是一个域,x0K, 可以定义一个多项式赋值同态 f:K[x]Kp(x)p(x0) 将多项式p(x)映射到它在x=x0处的值p(x0).

练习 3.6. 验证这是环同态并且还是满同态。

理想

理想这个概念最初是Kummer提出的。提出这个概念是为了挽救在许多数论中考虑的环里面,没有像整数一样优美的唯一分解律:任何整数都可以唯一分解为一些素数的乘积。在一般的环中,素分解不一定是唯一的。Kummer发现,如果引入“理想数”的概念,理想的乘积仍然可能满足唯一分解律。

简单地来说,理想就是倍数集合。比如对于素数pZ可以考虑p的所有倍数构成的集合(p):={kp|kZ}, 叫做p生成的理想。这个倍数集合最本质的特点是具有倍数的“吸收性”,即对任何rZ,i(p)都有ri(p).这就引出了如下理想的概念

定义 3.4 (理想). 环R的一个Abel子群I叫做左理想,如果对任何rR,iI都有riI.如果条件改成irI,则称为右理想。如果I既是左理想又是右理想,则称为双边理想。注意到在交换环中,不需要考虑左右理想的概念,所有理想都是双边的,于是在交换环中左,右理想都简称为理想。R本身是一个理想,称为平凡理想,不等于R的理想则称为真理想。

理想的一个重要用途就是可以用来构作商环,就像定义商群一样,给定环R和一个双边理想I我们可以定义陪集集合 R/I={r+I|rR}. 这首先是一个Abel群R对于子群I的商群,其元素为陪集r+I或理解为RI所确定的等价关系的一个代表元。其乘法只需要从大环R遗传过来就可以了,即规定R/I中的乘法为 (r+I)(s+I)=rs+I. 容易验证由于理想的吸收律,作为R中的子集,乘积(r+I)(s+I)rs+I.故上述乘法是定义良好的(不依赖于代表元的选取)。

3.6. 考虑环Z的理想nZ={nk|kZ}, 关于这个理想作的商环为所谓模n的剩余类环 Z/nZ={a+nZ|aZ}={nZ,1+nZ,2+nZ,,(n1)+nZ}. 作为加法群,这是一个n阶循环群。作为环这是一个有限的环,其中加法幺元素为nZ, 乘法幺元素为1+nZ.这个环的数论含义是所有整数在模n意义下的n个剩余类构成的环。值得注意的是,当n为素数p时,Z/pZ事实上是一个由p个元素构成的有限域。

练习 3.7. 对于一列理想Iλ我们可以定义它们的和:ΣλIλ为如下理想 {所有有限和λaλiλ|aλR,iλIλ}. 证明这是一个理想。对于有限个理想I1,,In我们可以定义它们的积J=I1InJ={i1in|ikIk}. 证明这也是一个理想。

练习 3.8. 按如下步骤,证明数论中的费马小定理

  1. 0aZ/pZ. 证明对任意k, ak0.

  2. 由此得出a有乘法逆,即Z/pZ是域,有时记为Fp,称作p元有限域。

  3. 证明Fp×:=Z/pZ{0}是一个乘法群,从而对任意aFp×, ap1=1.

素理想

理想这个概念是从数论里面得到的,那么自然的,它就会和许多算术概念产生联系。在数论中,用来证明自然数分解成素因子的乘积的唯一分解律的最重要的一步是证明素数具有如下称为欧几里得引理的性质:设p是一个素数,如果p|ab, 那么p|ap|b至少有一个成立。从理想的角度讲,(p)=pZZp的倍数集合,它是Z的一个理想。这时有 ab(p)a(p)或者b(p). 我们可以把这个概念推广到任何一个环,如果环R的一个真理想IR满足上面的性质,就把I称为素理想。即,如果 abIaI或者bI 那么I就叫素理想。对于一个交换环R, 它的所有素理想构成的集合一般记为Spec(R).注意平凡理想不是素理想,这一点属于约定,原因和约定1不是素数类似,1这种可逆元应该叫做单位,而不适合叫做素数。

练习 3.9 (). 我们称环R是整环,如果在Rab=0能推出a=0b=0. 证明:设IR的一个双边理想,证明R/I是整环当且仅当I是素理想。

练习 3.10. 设有环同态f:RS, 证明,素理想的原象一定是素理想。即若PSS的一个素理想,那么f1(S)R的素理想。

另一个有用的概念是极大理想,环R的一个真理想I是极大理想(左,右,双边)是指,环R中没有包含I的更大的真理想(左,右,双边).我们说明几个极大理想的简单性质

命题 3.1 (极大理想必为素理想). IR的一个极大理想(双边),则I也是R的一个素理想(双边)。

Proof. 否则,可设abIa,bI.考虑 ((a)+I)((b)+I)=(ab)+II 由于(a)+I,(b)+I严格大于I,根据假定它们只能等于平凡理想R。于是得到 R=RRI 这与I是极大理想(根据定义一定是真理想)矛盾。 ◻

命题 3.2. 任意非单位元aR必然被包含在某个极大理想中。

Proof. 考虑由a生成的(左)理想Ra, 由a非单位,我们知道RaR.于是Ra是真理想,对包含它的所有理想的集合用Zorn引理14那么可得它被包含在某个极大(左)理想之中。 ◻

练习 3.11 (). 证明:设IR的一个双边理想,证明R/I是域当且仅当I是极大理想。

练习 3.12 (). a被包含在所有极大理想之中,证明a+1是单位。

同态的核与像

就如同群同态的核与像,对于一个环同态f:RS, 我们可以定义 ker(f):={rR|f(r)=0} 以及 Im(f):={f(r)|rR}.

练习 3.13. 验证核是R中的双边理想,像是S中的一个子环。

我们有显然的同构定理

定理 3.1 (第一同构定理). 给定一个环同态f:RS,它将诱导一个环的同构 f:R/ker(f)Im(f)

Proof. 这个同构由 r+ker(f)f(r) 定义。它显然是良好定义的,因为ker(f)的像是0. 如果f(r)=0,那么rker(f),故它是单射。满射也是显然的。 ◻

定理 3.2 (对应定理). I是一个双边理想,p:RR/I是自然的投射,那么R/I的所有理想与R中包含I的理想一一对应。

练习 3.14. 证明,域的理想只有平凡理想和零理想(0):={0}.说明从域到任意环的同态只能是单同态或者零同态。

Noether性质

如果环R中所有理想都是有限生成的,即任何理想IR都可以表示为 I=Ra1+Ra2++Ran的形式 (右理想则换成a1R++anR),这里aiR,则我们说R是一个Noether环(左,右,双边),这是环论中一个重要而基本的性质,我们研究的大部分环都是Noether的。 关于Noether性质,有如下经典的等价表述

定理 3.3 (Noether性质). 以下三条等价(关于左,右,双边各有一个本定理,不再赘述)

  1. R是Noether环

  2. R的任何理想的上升链 I1I2 必然停止,即存在n使得In=In+1=In+2=.

  3. R的任意由理想组成的非空集合S必有极大元,即存在IS使得IJSI=J

Proof. (1)(2):
I=i=1Ii, 容易证明这是一个理想。于是I是有限生成的,设它由a1,,am生成,由定义,可设aiIni,那么当nmax(n1,,nm)时,In=I,故升链在此停止。

(2)(3):
否则,存在一个严格递增的无穷长升链,与(2)矛盾。

(3)(1):
I是任意理想,设S是所有有限生成的被包含在I内的理想组成的集合,那么可以取出极大元JS. 如果JI, 存在aJ但是aI, 考虑J+Ra是一个有限生成的理想,它严格比J大,这与J的定义矛盾。因此J=I. ◻

练习 3.15. 证明,一个有限环必然是Noether的。

练习 3.16. 证明,如果R是Noether的,那么R/I也是,这里I是一个双边理想。从而得出R的任何同态像也是Noether的。

下面的一个基本定理说明了很多环都是Noether的。

定理 3.4 (Hilbert基定理). 如果R是Noether的,那么R[x]也是。

Proof.IR[x]中一个(不妨设为左理想)理想,那么记 Jm={rR|r出现在某个m次多项式f(x)I的首系数中}{0}. 显然有一个理想的上升链 J0J1J2 根据R的Noether性,Ji全都是有限生成的,并且这个升链必然停止。设Jn=Jn+1= 那么取出J0,,Jn的生成元对应的多项式fi,j(x)R[x], deg(fi,j)=in 我们证明g0I都能由{fi,j}生成。设它的头系数出现在fn1,j1中,n1deg(g0), 有 g1=gfn1,j1xdeg(g)n1 次数严格小于deg(g0). 如果它不为0,可继续取出某个fn2,j2, n2deg(g1),使得 g2=g1fn2,j2xdeg(g1)n2 次数严格小于deg(g1).如果它不为0,这个过程还可以继续。但由于次数是一个非负整数,这个过程必然停止,最终可以得到 g0=kfnk,jkxdeg(gk1nk) 这便证明了命题。 ◻

主理想整环中的算术

这一节我们假定所有的环都是交换环。此时不需要再区分左右理想和双边理想,统称为理想。 设a1,,anR,我们定义理想记号 (a1,,an):=Ra1+Ra2++Ran 表示由a1,,an生成的理想。如果一个理想I可以由一个元aR生成,即I=(a),那么我们称它为主理想(principal ideal)。如果有一个整环R的所有理想都是主理想,那么我们称它为主理想整环(principal ideal domain),简称为PID.

定理 3.5 (最大公因数理论). Z是PID。

Proof.IZ的一个非零理想,并设0<aI, 如果I=(a), 证明完成。否则设0<bI使得a不整除b,那么考虑带余数的除法 b=aq+r,0<r<a 由此得到r=baqI. 如果I内元素全部能被r整除,那么I=(r)我们完成证明,否则可以继续取出一个不被r整除的元素并重复这一过程,得到一个比r更小的正整数属于I.但r是正整数,这个过程无法无限进行下去,一定会有一步的r使得rI且所有I中的元素都能被r整除。由此得到I是主理想。 ◻

推论 3.1. da1,,anZ的最大公因数,那么存在整数x1,,xnZ使得 d=a1x1++anxn.

Proof. 根据定理,I=(a1,,an)=(r)是主理想。显然d|r=r1a1++rnan。但是由ai(r)同样有r|ai,于是r整除ai的最大公因数r|d.这表明r=±dd(d)=Za1++Zan,存在xiZ使得 d=a1x1++anxn. ◻

R是一个一般的整环,就像我们定义素数一样,我们称一个非单位元aR不可约元,如果a=bc只能推出b,c至少有一个是单位。而我们称pR素元,如果(p)是素理想,即p|abp|ap|b.我们知道,在整数环Z的情形,不可约元和素元是等价的,但在一般的整环中这是未必等价的。有趣的是,在PID中这是成立的。

练习 3.17 (). 证明,在PID中不可约元和素元等价。

我们来说明主理想整环在算术上具有非常良好的性质:

定理 3.6 (PIDUFD). 我们称一个整环R是唯一分解整环(Unique Factorization Domain),简称UFD,如果其中每一个非零元素都可以以唯一的方式写成不可约元的乘积(在不记顺序,单位的前提下). 我们有:R是PIDR是UFD. 作为一个推论,UFD中不可约元和素元也等价。

我们先证明一个引理,它等价于分解的存在性

引理 3.1. Noether环中,对任意非零理想I,存在有限个非零素理想Pi使得IP1Pn.

Proof.S是使命题不成立的理想的集合,则取出极大元JS, 那么J不是素理想,否则JJ是一个命题所需的分解。故存在xyJ使得x,yJ, 有 ((x)+J)((y)+J)=(xy)+JJ 注意到(x)+J,(y)+J严格大于J,根据J的定义,它们存在分解,于是它们的乘积也存在分解,由此得出J也存在分解,这与J的定义矛盾。故S为空集。 ◻

现在我们来证明唯一分解定理

Proof. 由引理我们知道,设aR,那么 (a)(p1)(pn) 这里(pi)是一些非零素理想。由于p1pn(p1)(pn)(a), 这表明存在b使得 ab=p1pn. 对于每一个pi,由于(pi)(p1pn)=(ab)ab, 得到(pi)a或者(pi)b.我们将所有满足(pi)bpi逐个约去,直到所有的(pi)b, 重新编号,可以写 ab=p1pm 如果b不是单位,那么它被一个极大理想(是素理想)包含(p)b(p)ab=p1pm 推出(p)要包含pi中的某一个,即(p)(pi)但是由于(pi)是素理想,pi必然是不可约元,因此ppi相差一个单位,(p)=(pi)b, 这与b的定义相矛盾。故b不被任何极大理想包含,它只能是单位。这就证明了分解的存在性。

至于唯一性,我们可以假定有两种分解 a=up1pm=vq1qn 这里u,v是单位,(pi),(qj)是素理想。我们可以从(pi)vq1qn得出(pi)qj(pi)=(qj)那么它们相差一个单位从而将其从两边约去。重复此过程直到某一边变成一个单位,另一边自然也不可能还留有素元。这证明了m=n并且分解中出现的素因子在相差排序和单位的意义下完全相同。 ◻

推论 3.2. Z是UFD.

练习 3.18 (). 试说明PID中,非零素理想都是极大的。

注意,虽然唯一分解性质看起来像是显然的,你可能会以为它在所有环中成立,但这是不对的。例如在Z[5]={a+b5|a,bZ}中,有 6=23=(1+5)(15) 这是6的两种本质不同的分解。有趣的地方是,它们的分解中出现的因子是不可约元但不是素元。

练习 3.19 (). 证明,2,3,1+5,15Z[5]中的不可约元,但不是素元。从而唯一分解定理在Z[5]中不成立。

有趣案例:高斯整环

所谓高斯整环是指R=Z[i]={a+bi|a,b}.我们将用类似于Z的方法证明Z[i]是一个PID从而是一个UFD. 我们定义环Z[i]中的范数: N(a+bi):=a2+b2 它描述了环中元素的’大小’。容易看出这个范数具有乘性,即N(αβ)=N(α)N(β).而这在算术上也有所含义

练习 3.20. 证明,如果n,m都能写成两个整数的平方之和,那么nm也能。

练习 3.21. 证明,在Z[i]中,N(α)=1当且仅当α是单位。

引理 3.2 (高斯整环中的欧几里得除法). α,βZ[i], 那么存在γ,δZ[i]使得 α=βγ+δ 并且0N(δ)<N(β).

Proof. 考虑复数的商αβ=x+iy,分别取a,b为最接近x,y的两个整数。 于是 α=β(x+iy)=β(a+bi+E)=β(a+bi)+δ 其中δ=αβ(a+bi)Z[i],并且 N(E)=|E|214+14<1N(δ)=N(β)|E|2<N(β). ◻

推论 3.3. Z[i]是PID,从而也是UFD.

Proof. 仿照Z是PID的证明,任取非零非单位元aI, 如果(a)I,可以取出bI(a)并不断使用欧几里得除法使得余数r=abq的范数越来小,而这是一个正整数,这个过程必然停止,最终可以得到rII中所有元素被r整除。 ◻

我们来看Z[i]是UFD这个事实的强大应用

命题 3.3. 我们证明,方程 y2+1=x3 只有(x,y)=(1,0)这唯一一组整数解。

Proof.Z[i]中考虑该方程,分解为 (y+i)(yi)=x3(d)=(y+i,yi)是它们在Z[i]中的最大公因数,有d|y+i,d|yid|y+i(yi)=2i. 容易将2i分解为2i=(1+i)(1i)i这里i是单位而(1+i),(1i)是不可约元从而是素元。如果d包含(1+i)或者(1i)作为素因子,那么(yi)(y+i)就会是一个偶数,从而x38整除,得到y2是一个8k+7形状的数字,这是不可能的,因为任何整数的平方除以8的余数只可能是0,1,4.因此d是单位,即y+iyi互素。在UFD中,两个互素的数的乘积等于一个立方可以推出这两个数在相差单位的意义下都是立方,即可设 y+i=u(a+bi)3 yi=u(abi)3 这里uZ[i]×是单位。由于Z[i]中的单位只有±1,±i, 而±1=(±1)3, ±i=(i)3,我们可以将u乘进立方的括号里面,故可以假定u=1.此时 y+i=a33b2a+(b3+3a2b)i 因此必有b3+3a2b=b(b2+3a2)=1这表明b=±1,故b2+3a2=3a21|1,只能是a=0,b=1. 故y=0,x=1是方程唯一的整数解。 ◻

练习 3.22 (). 证明Z[2]是PID.

练习 3.23 (). 找出 y2+2=x3 的所有整数解。

练习 3.24 (). 证明Z[3]不是UFD, 但是比它大一点的环Z[1+32]却是PID.

域上的多项式环是PID

这个结论非常经典而重要,我们在这里还是给出它的证明。事实上这个证明仍然是类似的,由欧几里得除法给出

定理 3.7. a,bK[x]是两个多项式,其中b的次数deg(b)>0,那么存在多项式q,rK[x]使得 a=bq+r 这里deg(r)<deg(b).

Proof.a(x)=a0xn+a1xn1+, b(x)=b0xm+b1xm1+. 那么取q0(x)=a0b0xnm 我们有 abq0=0xn+ 它的n次项被抵消了。如果它的次数不低于b的次数,设a0xn1是它的下一个最高次非零项,可以取 q1=q0+a0b0xn1m 我们有 abq1=0xn+0xn1+ 如果它的次数不低于b的次数,我们可以继续取下去,直到它的次数低于b的次数为止,此时的abq记为r. ◻

推论 3.4. K[x]是PID.

练习 3.25 (). x,y两个变量生成的多项式环K[x,y]还是PID吗?为什么?

环的分式化和分式域

本节讨论的都是交换环。 对于一个整环R,我们可以取一个乘性子集SR,即一个子集满足aS,bSabS.不失一般性可假设1S, 定义环R对于S的分式化为 S1R:={rs|rR,sS} 这个集合可以自然的赋予加法和乘法结构 rs+rs:=rs+srssS1R rsrs:=rrssS1R. 两个分式r/s,r/s视作等同当且仅当rsrs=0. 容易验证它构成了一个环。如果取S=R{0},则把得到的分式化记作Frac(R),称作R的分式域。

定义 3.5 (整闭). 设有整环R,记K=Frac(R),如果存在K中的元素xK满足一个首系数为1R中的多项式方程 xn+r1xn1++rn1x+rn=0 则称xR上整。所有K中在R上整的元素叫做RK中的整闭包,简称R的整闭包,记作R. 如果环RK中的整闭包就是R,称R为整闭(integrally closed)的,也叫正规(normal)的。

3.7. ZQ中的整闭包就是Z,这是因为,如果xy是一个既约分数满足一个首一Z系数方程,可以乘掉分母得到 xn+r1yxn1++rnyn=0 可得y的每一个素因子p都整除x. 由既约的假定,y只能没有素因子,即y是单位,xy是整数。故Z是整闭的。

3.8. d是一个无平方因子数,则 Frac(Z[d])=Q(d):={x+yd|x,yQ}. 这是因为, r+sda+bd=(r+sd)(abd)(a+bd)(abd)=rasbda2b2drb+saa2b2dd 其分母a2b2d不为0,因为d是无平方因子的。

练习 3.26. 证明UFD都是整闭的。

练习 3.27. 验证1+72Z上整,从而证明Z[7]不是UFD.

练习 3.28 (). 找出Z[5]的整闭包。

练习 3.29 (). 我们来考察一个分式化对素理想影响的例子。

  1. 对于环Z,列出它的所有素理想。

  2. S={1,2,4,8,16,},考虑环的分式化S1Z,列出它的所有素理想。

  3. 取素理想(2)Z, 设S=Z(2), 证明这是一个乘性子集,并列出S1Z中的所有素理想。

练习 3.30 (). 可按如下提示,证明K[x,y]是UFD. 从而得出UFD不一定是PID.

  1. K(x)K[x]的分式域,那么K(x)[y]是域K(x)上的多项式环,从而是PID

  2. 将任意多项式f(x,y)K[x,y]放入K(x)[y]中得到一个因子分解

  3. 在某些(K[x]/(p(x)))[y]中考察该分解,这里p(x)K[x]是某些不可约多项式,注意到K[x]/(p(x))是域,(K[x]/(p(x)))[y]也是一个PID.

  4. 证明K[x,y]是UFD.

初等数论在密码学中的应用

Z/n=Zn是一个阿贝尔群,它代表了模nn个剩余类,并且在加法下构成一个群。如果我们考虑Zn×=(Z/n)×,即所有与n互素的剩余类构成的集合,这个集合在乘法下构成一个群,并且其阶数为φ(n).根据拉格朗日定理,对任意aZn×都有aφ(n)=1,即对任意与n互素的整数a都有 aφ(n)1modn. 这便是初等数论中的Euler-Fermat定理。这一定理在现代密码学中有着有趣的应用.

在公钥密码学中,人们希望实现如下目标:

  • 我们需要在一个通信质量可靠,但信息安全不可靠的信道中通信。

  • 我们希望只有发件人和收件人能解读信息的内容,任何在信道中窃听的第三方只能获得密文,而无法获得明文。

  • 我们还希望这套加密通信体系不需要事先进行密钥分发。

以往古典密码学的最安全的加密方法是一次性密钥密码,即通信的双方事先准备好一串只有双方知道的超长的随机字符串kZnm作为一次性密钥,在通信前将密钥k加到明文x上去得到密文x+k.由于k是完全随机的并且与x独立,x+k的分布也是完全随机的,即其概率分布是平凡的均匀分布。故任何只获得了x+k而不知道k的人无法了解到关于x的任何信息。收件方只需要计算(x+k)k=x即可。但是这个密钥只能使用一次,因为x具有非平凡的概率分布,这导致多次使用同一个密钥是不安全的。因此双方事实上需要准备大量的一次性密钥,用完即扔。这样不仅不方便,而且密钥分发也是一个很难的问题:用完了一次性密钥之后你很难确保密钥能安全的(通过信道或线下分发)分发到对方手中。

现代密码学的开端,RSA公钥加密体系通过引入初等数论的方法和非对称加密体系的概念解决了这一问题。考虑一个由两个大质数乘起来的大整数n=pq,那么Zn×是一个阶数为φ(n)=(p1)(q1)的群。即对aZ×都有a(p1)(q1)=1.事实上,对应的同余式 aφ(pq)1modpqaZ(pq)Z都成立。这表明,如果我们取一对指数(e,d)使得ed1modφ(pq),就会有 (xe)dxeqxmodn 对所有x成立。于是我们可以用e来加密信息xZ/n,得到密文xeZ/n,然后用d来解密,得到xed=xZ/n.注意这里加密用的密钥和解密用的密钥是不同的,并且它们之间的联系需要通过求解ed=1Z/(p1)(q1)来得到。(根据理想理论,只需保证e(p1)(q1)互素即可存在ex+(p1)(q1)y=1).如果p,q很大,n将变得难以分解,而不分解n就无从知道(p1)(q1)的取值(容易证明,在给定n的前提下,知道(p1)(q1)等价于知道pq)。于是我们可以构造出如下的不需要密钥分发的加密体系:

  1. 首先生成两个随机的,巨大的素数p,q,

  2. 计算n=pq,m=(p1)(q1),

  3. 随机生成与m互素的整数e,并利用Euclid除法计算得到d满足ed1modm,

  4. 向外公布(n,e)作为你的公钥,将d保留为私密(私钥)信息,p,q,m等信息保留或丢弃。

  5. 当有人需要向你发送加密信息xZ/n时,他可以计算xeZ/n,并通过信道发送给你。

  6. 获得xe的第三方由于不知道d,也不能分解n,无法得知x

  7. 你只需要计算(xe)d=xZ/n就可以解密出原始的信息。

模与线性代数

模的基本知识

模可以说是现代代数学里面最广泛和最重要的一种代数结构了。它可以视为所谓线性代数的自然推广,但所蕴含的现象远远超过了域上的向量空间。就像群可以以群作用一样作用在集合上,我们也可以让环作用在一个集合上。但我们希望环的加法,乘法都能自然地作用在这样的集合上。如果把环里面的乘法看成作用的复合,那我们还不清楚环的加法如何与这个作用配合,因此我们还需要一个加法的结构。于是这引出了模的定义:

定义 4.1 (R模,多模,双边R模). 设R是一个环,一个R-模M是指一个阿贝尔群,并且定义了RM上的一个(左)作用,即对rR, mM可以定义出一个作用后的元素rmM. 这可以理解为一个R×MM的映射,并且这个作用满足

  1. (幺律) 1m=m

  2. (结合律) (rr)m=r(rm)

  3. (R的分配律) (r+r)m=rm+rm

  4. (M的分配律) r(m+m)=rm+rm

我们就说M是一个R-模,也记为RM. 类似的,如果M定义了一种右作用mrM,满足类似的性质,注意此时结合律应该换为m(rr)=(mr)r.我们就说M是一个R-模,也记为MR.

如果我们类比一下群作用时作出的定义,即群作用是一个群同态GAut(X),那么也可以将上述定义理解为,一个左R-模M就是R在一个阿贝尔群M上的作用,即一个环同态ρ:REnd(M). 这里End(M)代表M到自身的群同态构成的环,它的乘法是Abel群同态的复合fg=fg.那么每一个r可以想象成一个M上的算子,一个自同态,即rm=ρ(r)m. 因为ρ(r)是一个Abel群同态,M-的分配律是自动满足的。幺律,结合律,R-的分配律的成立由ρ是环同态保证。

值得注意的是右RM则是一个反同态φ:REnd(M),这个同态会将乘法的方向反过来,φ(rs)=φ(s)φ(r).

如果一个Abel群M上定义了多种模结构,对一族环{Ai}定义了左模的结构,并且对另一族环{Bj}定义了右模的结构,那么我们称它们的作用可交换,或者说它们的作用是兼容的,是指aj(aim)=ai(ajm), 以及 (aim)bj=ai(mbj)(mbi)bj=(mbj)bi.如果这些模结构是互相兼容的,那么我们称M是一个多模,具体的可以记成({Ai};{Bj})-模,或者(Ai|Bj)-模,或者写成(Ai)M(Bj), 有时我们也写成MAi|Bj.如果M是一个(R|R)多模,即既是R左模又是R右模并且两种模结构互相兼容,即 (rm)r=r(mr),则称M双边R-模. 在R是交换环的情形,左R-模和右R-模统称为R-模。

练习 4.1. 验证,环R在自己身上的左乘可以看做一个左R-模。类似的右乘是一个右R-模,于是R是双边R模。

练习 4.2. IR的一个双边理想,验证,R/I在自然的左乘 右乘作用下是一个双边R-模。

练习 4.3. 说明每一个Abel群都是Z-模,而Z-模自然也是Abel群。说明这两个概念的等价性。

练习 4.4. 说明对于交换环R,一个左RM可以按如下方式定义出右R模的结构 mr:=rm 为什么这个定义在R不是交换环时不成立?

环可以很复杂,环上的模自然也可以很复杂,但有两类比较经典的模我们重点讨论,域上的模(向量空间),以及主理想整环上的(有限生成)模。

模的同态

定义 4.2. 设M,N是两个R-模,那么我们说一个R-模同态φ:MN是指一个Abel群同态并且满足φ(rm)=rφ(m). 对于右模的同态则修改为φ(mr)=φ(m)r. R-模同态也叫R-线性映射。

对于多模同态,则需要φ与所有模结构兼容。

单同态,满同态,同构的含义是明显的,不再赘述。如果存在模同构态射φ:MN,我们称M,N同构,记作MN. 由于右模的理论完全是类似的,以下大部分时候我们默认考虑左模。

对于M的子集NM,如果它满足 RNN 我们称NM的子模。对于任何子模我们可以构作商模M/N, 其元素为陪集m+N,作用定义为 r(m+N):=rm+N 容易验证该定义不依赖于陪集代表元的选取,并且满足R-模的定义。

练习 4.5. φ:MN是一个R-模同态,证明kerφ:={mM|φ(m)=0}是一个M的子模,ImφN的子模。 证明第一同构定理φ:M/kerφImφ.

练习 4.6. {Mi}iIM的一族子模,证明 iIMi={所有有限和mi1++min|mi1Mi1,,minMin,{i1,,in}I}iIMi都是M的子模。

以下两个定理与群论中的同构定理证明基本相同。

定理 4.1 (第二同构定理). M,N都是某个R-模的子模,则M+NMN也是子模并且 (M+N)/NM/MN.

定理 4.2 (对应定理). NMM的子模,则M/N的子模与介于MLN之间的子模L一一对应。

正合序列

当我们有一系列模和模的同态时 rendering math failed o.o 如果ker(g)=Im(f),我们说这个序列在N处正合。如果一个模的映射序列在每一处(除了最左边和最右边的端点)都正合,我们说它是一个正合序列。

练习 4.7. rendering math failed o.o 是正合序列当且仅当f是单同态。

练习 4.8. rendering math failed o.o 是正合序列当且仅当f是满同态。

4.1. rendering math failed o.o 是一个Z模的正合序列,其中2是乘以2的映射,p是投射。这里ker(p)=2Z=Im(2).

模的基本构造

本节我们来讨论如何从已有的模构造出新的模。我们已知的方法有,商模,模的交,模的和。

Hom函子

给定两个左R-模M,N,我们可以将所有R-模同态MN组成的集合记为HomR(M,N).对于((Ai)|(Bj))多模同态构成的集合则记为 Hom(Ai)|(Bj)(M,N). 如果我们要区分模同态的方向,有时候我们用这个记号,将左R模同态的集合写成HomR|(M,N).对于两个同态f:MN, g:MN, 容易定义它们的和为 (f+g)(m):=f(m)+g(m) 这显然也是一个同态,故f+gHomR(M,N),这说明HomR(M,N)是一个Abel群。值得注意的是,如果M,N都是左R模或者都是右R模,没有多模的结构,那么它们的HomR(M,N)并没有自然的R模结构,仅仅是Abel群(Z-模)而已。但如果M,N至少有一个具有多模的结构的话,Hom函子可以被自然的赋予模结构,我们来说明这一点。

Hom的模结构

以下R,S是两个环,如果M具有左R模结构和右S模的多模结构,当我们需要明确标明模的结构时我们写为RMS.

我们来举例说明HomR(RMS,RN)具有左S模的结构。这是因为我们可以对fHom(M,N),sS定义 (sf)(m):=f(ms) 那么(sf)显然是一个左R模同态(这里需要用到多模的定义:多个环的模结构需要互相兼容)。我们需要验证HomR(M,N)满足左S模的定义,其它性质都是显然的,唯一需要仔细检查的是结合律 (ss)f=s(sf) 左边的同态是mf(mss),右边的同态是s(mf(ms))=mf(mss),因此这是成立的,即HomR(M,N)在这个定义下成为一个左S-模。

类似的一共有八种情况,我们将所有情况列出如下表格

自然的模结构 S模结构的定义
HomR|(RM,RN)
Hom|R(MR,NR) Z none
Hom|R(MS,R,NR) S (sf)(m):=f(ms)
Hom|R(SMR,NR) S (fs)(m):=f(sm)
Hom|R(MR,NS,R) S (fs)(m):=f(m)s
Hom|R(MR,SNR) S (sf)(m):=sf(m)

总结来说,就是N有哪个方向的S模结构,HomR(M,N)就会具有哪个方向的S模结构。如果双模结构出现在M上,作用会被函数从里向外复合反过来乘法的方向,导致模的方向发生改变。

练习 4.9 (). 确认你弄明白了表格中的所有情况。

自同态环

M=N时,HomR(M,M)记作EndR(M),此时它具有自然的环结构,乘法是MM的同态的复合。

练习 4.10 (). 证明,MR模,那么它具有自然的左R,EndR(M)多模结构。

Hom的函子性

我们说Hom函子是什么意思呢?所谓函子是现代数学范畴论中的一个抽象概念,它描述不同范畴之间的对象如何对应起来。它需要

  1. 将物件A对应于物件F(A)

  2. 将映射f:AB对应于另一个映射F(f):F(A)F(B)或者F(f):F(B)F(A).满足前者的称为协变函子,后者称为反变函子。

  3. 函子必须保持复合,即F(fg)=F(f)F(g).

  4. 我们还要求函子将恒等映射对应到恒等映射,即F(1A)=1F(A).

作为例子,我们详细来说明Hom如何构成函子。

  • 对于一个固定的RN,我们发现MHomR(M,N)是一个反变函子,有时记为hN. 这个函子将RM对应到Abel群HomR(M,N),并且将R模同态f:MM对应到阿贝尔群的同态 Hom(f,N):=Hom(M,N)Hom(M,N):hhf. 显然它保持复合和恒等映射。

  • 类似的,对于固定的模M,我们发现NHomR(M,N)是一个协变函子,它将模同态g:NN对应到阿贝尔群同态 Hom(M,g):=Hom(M,N)Hom(M,N):hgh. 显然它也保持复合和恒等映射。

直和

给定两个左R-模M,N,定义它们的直和MN是集合M×N={(m,n)|mM,nN}作为Abel群的直和,加法为分量相加,R的作用定义为 r(m,n):=(rm,rn) 容易验证这个定义给出了一个R-模结构。直和不仅仅限于有限直和,对任意一族由集合I编号的R{Mλ}我们可以定义直和 λIMλ:={(mλ)λIMλ|至多有有限个mλ不为0}. 如果对一列相同的模Mλ=M作直和,这个直和我们记作M(I).

练习 4.11 (). 验证,如果M,NL的两个子模,满足 MN=0 那么证明有同构M+NMN. 此时我们把M+N称作M,N的内直和。

练习 4.12. 证明我们有如下明显的正合列

  1. 0MMNN0

  2. 这里设MM是子模,那么0MMM/M0是自然的正合列。

直积

与直和类似,一族模Mλ的直积是由集合λMλ赋予自然的模结构得出的。区别在于直积中,我们不要求每一个元素的分量只有有限多个不为0,任意序列(mλ)Mλ都是允许的元素。类似的,如果对一列相同的模Mλ=M作直积,这个直积我们记作MI.

4.2. 考虑F=i=0Z,而G=i=0Z是两个Z模,那么(1,2,3,4,)GG中的一个元素,但在F中没有这个元素。 有自然的包含FG,FG的一个子模。

练习 4.13. 模的有限直和与有限直积同构。

练习 4.14. 证明如下称为直和的universal property,以及直积的universal property的自然同构 HomR(λIMλ,N)=λIHomR(Mλ,N). HomR(M,λINλ)=λIHomR(M,Nλ). 说明它们与这两句话等价

  • 对任意映射hλ:MλN, 存在唯一的映射(hλ):λMλN使得 hλ=(hλ)ιλ. 这里ιλ:MλMλ是自然的含入映射。

  • 对任意映射gλ:PNλ, 存在唯一的映射(pλ):PMλ使得gλ=prλ(pλ).这里prλ:MλMλ是到分量的投射。

自由模

R的任意数量个直和(可能是无限的)得到的模,或者与之同构的模称为自由R模。比如Rn=RRR(nR的直和). 自由模的重要性在于它有如下好性质,任意从Rn出发的模的同态f:RnM都可以很容易被确定下来,只需要确定每个ei=(0,,0,1,0,,0)Rn(第i位是1)被映射到哪里去,整个模的同态就完全确定下来了。因为Rn中每一个元素(r1,,rn)都可以写成 (r1,,rn)=riei 因此 f((r1,,rn))=f(riei)=rif(ei). 值得注意的是,f(ei)的值怎么选取没有任何限制。即f的确定完全取决于f(ei)n个值的任意选取,或者说,取决于一个任意元素(f(e1),f(e2),,f(en))Mn.这给出了如下自然同构 HomR(Rn,M)=Mn.

练习 4.15. 证明自由模的基本性质 HomR(R(I),M)=MI 注意I可能是无限的,并且注意直和与直积的区别。

生成元与基

对于一个(左)RM, 我们选取了一族元素(mi)iIMI之后,由HomR(R(I),M)=MI可以定义出一个映射(rrmi):R(I)M,暂时记为ρ.这个映射的像称之为miR-线性组合.我们说{mi}iIMM的一组生成元,是指由ρ:R(I)M是满射。即,任意mM都可以写成某个有限的mi的线性组合 m=r1mi1++rnmin. 如果存在一族有限的miM的一组生成元,M称作有限生成的。 我们说{mi}iI 是一组R-线性无关组,简称无关组,是指它对应的映射ρ:R(I)M是单射。即如果mi之间有任何有限个元素mi1,,min有任何R线性关系 r1mi1++rnmin=0 那么所有系数r1=r2==rn=0. 如果一组元素{mi}既是M的生成元,又是M的线性无关组,这组元素就叫M的一组.

练习 4.16. 说明,M有一组基等价于M与某个自由模同构。

练习 4.17. 给出一个非自由模的例子,于是它没有任何基,尽管它一定有生成元,但它们一定不是线性无关的。

标量限制

当我们有环同态f:AB和一个BM时,我们可以通过f自然的在M上获得A模的结构,即定义 am:=f(a)m. 这样的一个模结构叫做通过f的标量限制,记作f(M),或者M[A],或者ResABM. 注意一般获得的A模结构与原有的B模结构并不一定兼容,因此不能说这是一个左A,B多模。但当f(A)B交换时,这是对的。

练习 4.18 (). M是左B模,f:AB是上述同态。证明 HomB(BBA,M) 给出的左A模就是f(M).

练习 4.19 (). f:AB, M,N是两个B模,证明有一个自然同态 HomB(M,N)HomA(fM,fN).

向量空间

考虑R=k是一个域,由于域k是交换环,k模不分左右,我们把域k模统称为k-向量空间或者k-线性空间。它们之间的k-模同态称之为k-线性映射或者k-线性变换

向量空间的基

线性空间最好的一点是,它一定有一组基,于是所有线性空间都同构于某个自由k模。这使得线性空间非常好研究,我们来说明这一点。接下来我们设V是一个k-向量空间。

定理 4.3 (基扩张定理). FV的一组无关组,GV的一组生成元,满足FG,那么存在V的一组基B使得FBG.

Proof. 如果有一列递增的无关组Bi使得FBiG,那么显然iBi也是无关组 并且满足FiBiG.于是由Zorn引理存在一个极大的无关组B满足FBG. 我们来证明B能生成V, 即对应的映射ρB:k(B)V是同构。否则,存在vV不能表示成B内元素的线性组合, 那么由于G是生成元组,有一个有限和v=ρG(a)=gGagg,这里G是有限集。于是一定有一个gGB无关,否则所有gG都与B线性相关,由于B是无关组,可以得到gG都能由B生成,从而得到v也能由B生成,这是不可能的。但这样的话{g}B就是一个在F{g}BG里面的更大的无关组,这与B的设定矛盾。故B是一组基。 ◻

4.3. 考虑k=R, M=R2={(x,y)}相当于平面上所有向量的集合,在分量的加法下构成Abel群。那么Mk的乘法下自然的构成一个k向量空间 a(x,y):=(ax,ay)M. 容易验证这个M在该作用下满足k向量空间(k模)的四条定义。{(0,1),(1,0)}是它的一组基.

练习 4.20 (). 证明,对向量空间来说,以下说法等价

  1. BV的一组基.

  2. BV的一个极大无关组.

  3. BV的一个极小生成元组.

练习 4.21. k=Q,找出下面哪些是k2的基,哪些不是?

  1. (1,2),(3,4)

  2. (1,1),(1,1)

  3. (1,1),(1,2),(1,0)

维数理论

如果V有两组不同的基B1,B2, 我们希望证明B1B2是等势的,即它们之间存在双射。

有限的情形

如果B1,B2都是有限的,设m=|B1|拥有较少的元素。我们对m使用归纳法,证明|B2|m。如果m=1,B1={b},那么B2中任意元素都可以写为b的某个非零k-系数倍,它们无法是线性无关的,除非|B2|=1.

现在假定命题对于|B1|m都是成立的,我们来考虑|B1|=m+1的情形。设aB2, 由基扩张定理,存在一组基B={a}B满足{a}B{a}B1, 于是Vka(bBkb),从而V=V/kaB(的投射像)为一组基,其元素个数为m.同理V也以B2{a}的投射像作为一组基,于是|B2|1m.

无限的情形

现在假定V具有一组无限基B从而Vk(B),如果C是另一组基,对于每一个cC, 都有某个有限的表达式c=bBcbb这里至多有限个cb不为零。那么对任意cC,考虑有限集Bc:={bB|cb0},由于C能生成整个空间,对每个b必有c中向量在b的系数上不为0,我们有 cCBc=B 由于B是无限集,这就表明|C||B|,于是由B是无限的,我们推出两者都是无限的.于是对C用同样的推理可知|B||C|.

定义 4.3. 我们定义V维数dimkV是它的任意一组基B的基数|B|.

练习 4.22 (). 设有一族k向量空间的正合列 0EFG0 利用基扩张定理,证明 dimE+dimG=dimF. 由此推出以下维数公式

  1. f:VW,则 dimV=dimkerf+dimImf.

  2. FE是子向量空间,那么 dimE=dim(E/F)+dimF.

  3. dim(MN)=dimM+dimN.

  4. M,NV是两个子空间,那么 dimM+dimN=dim(MN)=dim(M+N)+dimMN.

交换环上的矩阵

有限生成自由模

我们本节需要假定R都是交换环。值得注意的是,自由模Rm中,有一组标准基,即每个元素都可以以唯一的方式写为a1e1+a2e2++amem的形式。

如果一个RM同构于Rn,我们就说M具有秩n.但是我们还没有证明秩的唯一性,即需要证明RmRnm=n.遗憾的是在一般的环中,这不一定是对的。但至少在PID上的情形,这是对的。为了证明这一点,我们需要发展一些环上的线性代数的知识。

环上的矩阵

我们考虑自由模RnRm的模同态,由于 HomR(Rn,Rm)=(HomR(R,Rm))n=(Rm)n=Rmn 我们知道,确定一个同态φ:RnRm,本质上只需要知道每个ejRn被映到Rm中的哪里。我们用eiRm表示Rm中的标准基。如果我们记ej的像在第i个位置的分量为aij,那么可以写 φ(ej)=iaijei 这里aijR是我们要的mnR中的元素。我们可以把这些元素用排成一个矩阵 A=(a11a12a13a1na21a22a23a2nam1am2am3amn) 矩阵一般用大写字母A,B,等等来表示。这里我们的矩阵是φ的矩阵,我们也记为Aφ. 当我们需要强调矩阵元素是aij时,我们写A=(aij)1im,1jn.这个矩阵具有mn列,我们说它是一个R上的m×n的矩阵,记作AMm×n(R). 当m=n时这个记号简单写为Mn(R).

练习 4.23. 确认自己理解:给出一个m×n矩阵与给出一个同态RnRm等价。即给出任意一个由R中元素构成的矩阵,它都代表了某个同态。于是任意矩阵A都能(唯一的)写为Af的形式,f是某个同态。

映射的复合与矩阵的乘法

对于f,gHomR(Rn,Rm), 以及rR我们可以给出同态rff+g的定义。那么类似的定义矩阵的数乘和加法,即定义r乘以Af是指映射rf所对应的矩阵Brf rAf:=Brff,g两个同态对应的矩阵分别为Af, Bg,那么定义A+B是映射f+g对应的矩阵Cf+g Af+Bg:=Cf+g.

练习 4.24. 证明rA的元素就是(raij),而A+B的元素就是(aij+bij). 从而证明Mm×n(R)构成一个R模。

当我们有同态的复合 rendering math failed o.o 时,可以通过Af,Bg算出Cgf,我们把这个过程叫做矩阵的乘法,记作 BgAf=Cgf. 具体是怎么操作的呢?我们可以由矩阵Af=(aij),Bg=(bij)写出 f(ej)=iaijei g(ei)=kbkiek 因此 (gf)(ej)=g(f(ej))=g(iaijei)=k(ibkiaij)ek. 这表明Cgf=(cij)=BA的系数应该为 cij=kbikakj. 这便是矩阵的乘法公式。 注意Bn×m的,Am×l的,而BAn×l的,这表明矩阵乘法给出了一个映射 Mn×m(R)×Mm×l(R)Mn×l(R).m=n=l时,这个乘法运算给出了Mn(R)上的乘法,从而Mn(R)成为一个(通常非交换)环。

练习 4.25. 构成环的必要条件是乘法满足结合律。由映射的复合满足结合律这一点,导出矩阵乘法满足结合律。

练习 4.26. 1:RnRn是恒等映射,写出它的矩阵,记为In.这个矩阵称为n阶单位阵。它是Mn(R)中的乘法幺元。

练习 4.27. AMm×n(R).

  1. 说明,如果我们将Rn中的元素看成n×1的矩阵(称之为列向量),那么A对应的映射RnRm就是如下矩阵的乘法 RnRm:vAv 这里vMn×1(R)=Rn.

  2. 说明,A作为线性映射的像Im(A)A的所有列生成的Rm的子模。

PID上矩阵的约化理论

本节我们设R是一个PID, 考虑R上的m×n矩阵MMm×n(R). 注意到由矩阵乘法,Mm×n(R)具有(Mm(R),R;Mn(R),R)多模结构,即可以通过m阶方阵左乘,n阶方阵右乘作用在m×n阶矩阵上面。

记环Mn(R)中的乘法可逆元构成的群为GLn(R),我们称A,BMm×n相抵的,是指存在两个可逆元PGLm(R), QGLn(R)使得A=PBQ.注意相抵是一个等价关系。

矩阵的初等变换

对于矩阵的乘法C=BA,可以形象的理解为CB的列重新组合得到的,也是A的行重新组合得到的,而组合的系数由另一个矩阵决定。由矩阵乘法公式 cij=kbikakj 可以看出,C的第j列是由B的第1列乘以a1j加上B的第二列乘以a2j,一直加到第k列乘以akj.类似的,C的第i行则是A的各第k行乘以对应的bik再相加。于是,左乘一个矩阵相当于行操作,右乘一个矩阵则相当于列操作。

所谓初等变换,则是指一类简单基本的对矩阵的可逆操作。可以对一个矩阵通过左乘和右乘一些简单的可逆方阵来施行初等变换。一共有这样几类初等变换:

  1. 将矩阵的一行(或者一列)乘以R中的某个非零元素,然后加到另一行(对应的,另一列)上去. 比如将A的第1行乘以r然后加到第2行上去 (10r1)(a11a12a21a22)=(a11a12ra11+a21ra12+a22).

  2. 重新排列矩阵的行或者列.设A=(aij)Mm×n(R),如果我们需要用置换σSm重新排列矩阵的行,就左乘m阶方阵P=(δσ(i)j).这里δij=1i=j表示当i=j时为1,否则为0的一个函数。我们有 (PA)ij=kδσ(i)kakj=aσ(i)j. 这样的方阵叫做置换矩阵。 类似的,重新排列矩阵的列就右乘一个n阶置换矩阵。

  3. 将矩阵的某一行或者一列乘以一个单位uR×. 这只需要将矩阵左乘或者右乘一个对角矩阵 (1u11). 其中u所在的行(列)就是需要乘以的行(列)。

  4. 将矩阵的a倍的第i行(或者列)加上b倍的第j行(列)作为新的第i行(列),原来的c倍第i行(列)加上d倍第j行(列)作为新的第j行(列),这里adbc=1.这也是一个可逆的变换,它等价于左乘以下矩阵(列的情形:改为右乘,并将b,c对调位置) (abcd) 其中省略的部分都是斜对角的1.它的逆是 (dbca).

值得注意的是,这些初等变换都是可逆的,并且它们的逆还是初等变换。并且一系列初等变换都可以用左乘一个矩阵和右乘一个矩阵来得到。这是因为,施行一系列行列初等变换,可以视为按一定顺序左乘右乘了一系列PiQi,由结合律,可以将结果写成 (PkP1)A(Q1Qk) 当然,这相当于说Mm×n(R)(Mm(R);Mn(R))多模。

相抵标准型

定理 4.4 (PID中的相抵标准型). AMm×n(R),这里R是一个PID,那么存在一组唯一(在相差R中单位的意义下)的diR,满足d1|d2||dr,使得A相抵于如下对角形 (d1d2drO). 这里O表示某个零矩阵(可以没有),空着的位置都是0. 我们把得到的r叫做A的秩,记作rankA.

Proof.

  • 考虑矩阵左上角a=a11,通过行交换和列交换我们把素因子数最少的元素挪到这个位置,约定0有无穷多个素因子。如果整个矩阵都是0, 证明可以视为完成了。否则,可以设a11具有有限个素因子。

  • 如果a11整除第一列中所有元素,我们可以用第一行的初等变换消去第一列中剩下的所有元素。否则将不被a11整除的ai1挪到a21的位置,考虑I=(a11,a21)=(d), 我们有αa11+βa21=d.这里一定有(α,β)=(1),否则若α,β都被某个素因子p整除,我们有(α/p)a11+(β/p)a21=d/pI=(d),这不可能。因此可以设有δ,γR使得αδβγ=1. 那么,通过将原来的第一行乘以α加上第二行乘以β作为新的第一行,并将原来的第一行乘以γ加上第二行乘以δ作为新的第二行,我们得到左上角的新元素是d,它是原来a11的真因数,因此具有更少的素因子数量。

  • 不断进行这个操作,直到第一列所有元素都被a11整除,此时矩阵的第一列的其他元素可以被a11通过初等变换消除为0, 对第一行也进行类似的操作直到除了a11都是0.

  • 如果a11整除矩阵中所有元素,我们记d1=a11, 然后继续对从第二行第二列开始的矩阵部分做上述归纳操作。否则,重复第一步的操作,将矩阵中素因子数最少的元素挪到a11.这个操作一定会停止,因为a11的素因子个数会不断减少,直到a11整除所有矩阵元素或者a11被移除了所有素因子然后变成单位,那时它仍然整除所有矩阵元素。

  • 如此操作,矩阵最终可以化为我们所需要的形式。

 ◻

练习 4.28 (). 本题中R是PID. 并将AMn(R)视为RnRnR-线性变换。按如下提示,发现高斯消元法。

  1. 证明,AMn(R)是可逆的当且仅当它相抵于单位矩阵In, 从而得出A可逆rankA=nd1=d2==dn=1.

  2. 推出任何可逆矩阵都可以写成初等矩阵(即初等变换中所使用的矩阵)的乘积。换句话说,初等矩阵构成了GLn(R)的生成元。

  3. 证明,若A可逆,可以只使用行变换将A化为相抵标准型,即In.

  4. 考虑求逆矩阵A1的如下算法,并排写下两个矩阵(A|B),这里B是一个n×m的矩阵。只使用行变换(当B也是n阶方阵时也可改为只使用列变换),对A施行初等变换,并且同时对B做相同的操作。证明当A化为单位矩阵时,B就被变成了A1B.

  5. 分别考虑B=InB=β为一个列矢量的情形,得出求逆矩阵和对于A可逆时解方程 Ax=β 的一个算法。这里xRn=Mn×1(R)是一个未知列矢量。

练习 4.29 (). 本题中的假定与上题相同。

  1. A不一定是可逆的,证明A的核kerA可以由Qer+1,,Qen生成,这里Q是将A化为相抵标准型的矩阵Q,r=rankA是非零的d1||dr的个数。

  2. 得出计算子模kerARn的如下算法:并排写下两个矩阵(A|I),I是单位阵,然后对A施行初等变换,同时对In做相同的列操作,但不进行行操作。当A化为标准型时,右侧矩阵的后nr列所生成的R子模就是kerA.

练习 4.30 (). R是PID,如果(a1,,an)=1, 证明存在可逆矩阵PGLn(R)使得行向量(a1,,an)成为P的第一行。

练习 4.31 (). φ:VW是一个线性映射,在某组VW的基下对应的矩阵是AMm×n(k). 证明rankA=dimkImφ.

PID上的有限生成模的结构

利用我们在本章建立的这些结果,我们将证明两个重量级结论,一个是PID上的(有限生成)自由模的秩是确定的,即RmRnm=n.另一个是PID上有限生成自由模的子模还是有限生成自由模。

有限生成自由模的秩

事实上,这对所有整环成立。

定理 4.5. R是一个整环,那么RnRmn=m.

Proof. 我们利用整环的分式域K=Frac(R),考虑将这个问题’向量空间化’,这样我们也许能用向量空间具有确定的维数来证明这个命题。 事实上,从RnRm的映射f定义了一个R上的m×n矩阵A,由于R是整环,包含映射i:RK是一个单射,将A视为K上的矩阵可以得到一个K中的矩阵AK,它定义了一个KnKm的映射,记为fK.由f有逆我们看出fK也有逆,从而fK也是同构,那么由向量空间的维数的唯一性,我们得到m=n. ◻

于是,我们可以定义有限生成自由模的秩rank(Rn)=n.

有限生成自由模的子模

Noether模

所谓Noether模是指这样一类模,它的所有子模都是有限生成的(那么自然,它自己也得是有限生成的)。

4.4. R是诺特环,那么R作为R模的子模是它的所有理想,由Noether性,它们是有限生成的,因此R是Noether模。

和Noether环完全类似,我们有如下的等价叙述

定理 4.6. 以下关于RM的叙述等价

  1. M是Noether模。

  2. M的任意子模的上升链必然停止。

  3. M的任意子模构成的子集中存在极大元。

练习 4.32 (). 仿照Noether环的证明,说明上述等价关系。

为了说明各类常见的模都是Noether模,我们从R开始构造出其它Noether模。

定理 4.7.

  1. M是Noether模,那么所有M的同态像也是。

  2. M是Noether模当且仅当对某个子模NMNM/N 也是 Noether 模。

  3. Noether模的有限和,以及有限直和都是Noether的。

Proof.

  1. 任何同态φ:MN的像都形如ImφM/kerφ,由于对应定理,M/kerφ的所有子模的上升链都可以对应到M的子模的上升链,从而必然停止。

  2. ():显然成立。
    ():考虑M的一族子模的上升链Mi, 那么有MiN(Mi+N)/N两列分别是NM/N里面的上升链,由于它们Noether,这两个序列都会停止,于是只需证明若PQ, PN=QN(P+N)/N=(Q+N)/NP=Q即可。设qQ, 由于可以找到pP使得qpN, 于是这个元素qpQN=PNP,从而qP.

  3. 0MMNN0我们看出有限直和都是Noether的,而一般的有限和MiMMiMiM的同态像。

 ◻

作为结论,若R是Noether环,Rn是Noether的,从而所有有限生成R模都是Noether的,因为它们都是某个Rn的同态像。

PID上的有限生成自由模

R是一个PID,那么R显然是Noether环,于是Rn是Noether模从而其子模都是有限生成的。设NRn是一个子模,由于它是有限生成的,可设有满射RmN,将它与自然映射NRn复合可以得到一个映射f:RmRn,其像为N.于是我们可以将该映射写为一个n×m的矩阵A,考虑A的相抵标准型,存在可逆n阶和m阶的方阵P,Q使得PAQ=D,这里D是一个对角形的矩阵。翻译回映射的语言,这就是说,存在两个同构映射p:RnRnq:RmRm使得pfq=δ:RmRmRnRn.那么显然Im(f)=Im(fq)Im(pfq)=Imδ,这里δ对应的矩阵是D,也就是以下形式 (d1d2drO). 其中diR,rn.于是我们知道,存在Rn的一组基e1,e2,,en,使得Imδ=d1Re1d2Re2drRer,这里直和是内直和。此处这个Imδ已经与N同构了,如果要换回原来N的形式,那么由于p1是同构映射, N=p1(Imδ)=irdiRp1(ei). 这里ei=p1(ei)仍然构成Rn的一组基,因为p1是同构。于是存在Rn的一组基e1,,en使得 N=d1Re1drRer.

推论 4.1. NRr并且rankN=rn.

PID上的有限生成模

任何有限生成模M都是自由模的同态像,从而是自由模关于它某个子模的商。我们知道,PID上有限生成自由模Rn的子模一定形如(d1)e1(dr)er,这里eiRn的一组基(不一定是标准基).于是在同构RnRe1Ren下,这个商同构于 R/(d1)R/(dr)Rnr

定理 4.8. R是一个PID,M是一个有限生成R模,那么存在一列R中的元素d1|d2||dr和非负整数k使得 MR/(d1)R/(dr)Rk. 这称作M的’循环分解’.

练习 4.33. 证明,有限生成阿贝尔群都同构于如下形式 GZd1ZdrZk 这里d1|d2||dr是一列整数。

练习 4.34 (). 利用PID中的素因子分解,将上述有限生成模的结构定理转化为如下"准素分解"的形式。

  1. d=up1k1psks, 这里u是单位,pi是不同的素数,ks0是非负整数,证明(这可以看作是中国剩余定理的特例。你本质上只需要证明d=d1d2,其中d1,d2互素的情形) R/(d)R/(p1k1)R/(psks).

  2. 说明Z2Z6Z18Z23(Z3Z9).

  3. 证明,所有有限生成R模都是形如R/(pk)R的模的直和。准确的说,有如下分解 MRkp((R/pαp,1)βp,1(R/pαp,2)βp,2(R/pαp,sp)βp,sp) 其中0αp,1αp,2αp,sp, βp,i0.

  4. 反过来,说明准素分解如何化为循环分解。

线性映射的标准型

本节我们设φ:VV是一个有限维k-向量空间上的线性映射。如果我们取V的一组基B={e1,,en}并将φ写成矩阵形式A,一个问题出现了,在向量空间Vφ的定义中,没有明确选择的是哪一个基。事实上,很多线性空间和线性映射都可以在不写出基底和矩阵的情况下定义出来,即不依赖于基底的选取。但是如果我们要将其写成矩阵形式,就一定要人为选取一组基。这就产生了这样几个问题:

  1. 不同的基的选取对矩阵有什么影响?

  2. 有没有一种’最好’或者’很好’的特殊基,使得矩阵的形式得到简化?

相似矩阵

我们先来看第一个问题。设B={e1,,en}是另一组基,其矩阵记作A. 所谓矩阵,本质上是knkn的映射,它与原来的映射的关系可以用基映射ρ:k(B)V来描述,这里ρ{e1,,en}所确定的映射,它是一个同构。将A看做knkn的线性映射,此时我们有A=ρ1φρ,如下交换图所示(所谓交换图,是指按照不同路线将映射复合起来时,所得的映射一致) rendering math failed o.o 类似的,如果ρ是另一组基所确定的映射,则有A=ρ1φρ.于是 A=ρ1ρAρ1ρ=(ρ1ρ)A(ρ1ρ)1 这个故事可由如下交换图来表示 rendering math failed o.o 注意到这里ρ1ρ:k(B)k(B)也是一个n×n的矩阵并且还是同构(从而是可逆矩阵).记该矩阵为P,称作坐标转移矩阵。我们得到 A=PAP1. 这样两个来自同一个映射的矩阵就被联系起来了。如果存在可逆矩阵P使得两个方阵A,A由上述关系联系起来,我们就称这两个矩阵相似.容易验证,相似是Mn(k)上的等价关系。

练习 4.35. V=k2,选取φ:VV为满足φ(e1)=e2, φ(e2)=e1的唯一线性映射。φ对应的矩阵A是什么?如果我们选取一组新的基e1:=(1,1),e2=(1,1),计算转移矩阵PA.

相似标准型

现在我们需要回答,给定两个矩阵A,B,如何判断它们是否相似?这本质上是一个分类问题。一般来讲,我们会从以下几个角度研究这样的问题,一是寻找’不变量’,即可以通过矩阵A算出来的,在相似变换下不变的量。二是,我们可以在每一个相似等价类中找出一个代表元,然后看看矩阵AB能否被化为相同的代表元,或者从不变量计算出这些代表元。无论哪一种,都启发我们从不依赖于坐标的角度出发。不妨设我们的矩阵是线性映射φV上的一组基下的矩阵表示,我们发现,V除了是k模以外,还可以把φ作用在V上。通过重复作用φ和它们的线性组合,我们可以将任一个φk多项式p(φ),作用在V上,这里p(t)k[t]是多项式。于是V成为一个k[t]模,其作用为 p(t)v:=p(φ)v. 我们思考,如果我们让φ代表矩阵的作用,那么矩阵相似是否和对应的V模结构有关?事实上我们可以发现

引理 4.1. VAVt.v:=A.v作用下的k[t]模结构,VBVt.v:=B.v作用下的k[t]模,那么AB相似当且仅当作为k[t]模,VAVB.

Proof.

  • 如果AB相似,那么转移矩阵P:VAVB就是所需的同构映射,注意它的值域上t的作用与定义域上的不同。由于它是可逆矩阵,它显然是k-模同构,为验证它是k[t]模同态,此只需验证它与t交换: P(tv)=PAva=PAP1Pv=B(Pv)=t(Pv). 注意这里概念上(Pv)VB,尽管作为向量空间VAVB完全等同,但它们的k[t]模结构不同。

  • 反过来,如果存在k[t]模同构P:VAVB,我们就有 P(tv)=tP(v) 而这就是PA=BPPAP1=B.

 ◻

于是,我们发现,对矩阵或映射作相似分类等价于对k[t]模进行分类。注意到k[t]是一个PID,我们知道,PID上有限生成模的结构已经被我们完全分类清楚了!它一定可以写成一些形如R/(d)的模或者准素模R/(pk)的直和。一种想法是,我们可以把这样的形式对应的矩阵作为我们的代表元,从而只需要将VA化为这样的形式,就可以将矩阵化为标准型。我们先来讨论标准型到底长什么样。

有理标准型

VA的循环分解中,我们把得到的di称之为矩阵A或者φ不变因子。为了找出更简单的形式,我们将循环分解中的不变因子分解为素因子的乘积,从而变成准素分解,即V成为形如R/(pk)的模的直和(R不会出现在分解中,因为V是有限维k向量空间),这里pRR上的不可约元素。当我们写出 VAR/(p1k1)R/(prkr) 时(这里允许序列piki中的元素重复),我们把所有的这些pi(t)ki(可重复)称为A或者φ初等因子。容易看出,给出初等因子完全确定了VA的模结构。上述分解不仅是R模的直和分解,也是作为k模的直和分解。于是我们知道,只需找出R/(piki)的一组k基,即可找出V的一组k-基。 可设pi(t)ki=tdiadi1tdi1a0是首系数为1的多项式(因为在k[t]k{0}都是单位),我们取 1,t,t2,,tdi1R/(piki) 中的像作为它的一组k-基。那么φ在这组基上的作用就是乘以t在这组基上的作用,我们有 t1=t tt=t2 ttdi1=tdi=adi1tdi1+adi2tdi2++a0 这便给出了在这组基下φ在子空间R/(piki)上作用的矩阵 Apiki=(a01a11a21adi1). 于是φ在这样的基下,其矩阵便是形如这样的矩阵按照对角排列构成的矩阵 A=(Ap1k1Ap2k2Aprkr). 这里矩阵中的所有元素都属于k,我们称之为φ有理标准形

练习 4.36 (). φ:VVnk线性空间上的线性变换。从而φ使V成为一个以k[t]Vφ.

  1. 证明,φ的不变因子中的dn就是所有初等因子的最小公倍数。

  2. 对于一个环R上的模M,定义 ann(M):={rR|rM=0} 称之为M的零化子,证明它是R的一个理想。

  3. 得出φ存在最小多项式,即ann(Vφ)=(m(t))并且该多项式就是m(t)=dn(t),其次数n.

Jordan标准型

如果我们的域k是代数闭域,即所有k上的多项式都在k上有根,即可以分解为一次式的乘积(比如k=C),那么矩阵还能化归为更简单的形式。这时,k[t]上的不可约多项式都形如一次式(ta),于是piki一定形如(tλi)ki. 我们考虑R/((tλi)ki)的一个形式更简便的k-基:(tλ)ki1,(tλ)ki2,,1,在这组基下,t的作用如下 t(tλ)ki1=λ(tλ)ki1+0 t(tλ)ki2=λ(tλ)ki2+(tλ)ki1 t1=λ1+(tλ) 这表明,在这组基下,φ在这个子空间上具有如下矩阵表示 Jpiki=(λi1λi1λi11λi). 这里矩阵是ki×ki的大小。于是φV这样选取的基下具有如下矩阵表示 A=(Jp1k1Jp2k2Jprkr). 这称为φJordan标准型。特别的,如果ki=1,那么J(xλi)=(λi)是一个只有对角线的一阶矩阵。

练习 4.37. 证明,A在域k上可对角化当且仅当所有初等因子都是一次的。于是等价于A的最小多项式能在k上分解成一次式的乘积并且无重根。

练习 4.38 (). k=Fp是有限域,那么M2(k)中有多少个k-相似等价类?

自由化解

虽然我们已经知道了所有映射的矩阵都可以化为标准型,即VA模可以分解为结构定理中所叙述的形式,但是,我们要怎么具体来确定VA的模结构呢?在模的理论中,有一个方法是所谓的’模的化解’。就像Taylor展开一样,对于一个一般的RM,在了解了它的生成元之后,可以定义一个生成映射R(I)M.那么这个R(I)就可以视为M的’一阶近似’,它包含了所有生成元,但是生成元之间却没有任何线性关系。这些关系事实上就是R(I)M的核,记为K。如果我们再找出K的一组生成元,就可以得到一个正合列 R(I2)R(I1)M0. 如果此时左边映射已经是单射,我们的逼近就结束了,否则还可以继续不停的在左边重复这个操作,得到一个很长的正合列,这个正合列就叫M自由化解序列。注意这样的序列未必是唯一的。

练习 4.39 (). 证明,对于PID上的有限生成模M,总可以构造出自由化解序列形如 0R(I2)R(I1)M0. 即,它的’自由模逼近’在至多两项之后就可以停止了。

Vk[t]化解

本节记R=k[t].我们要如何给定一个RnV的满射?或者说,怎么找出一组生成元?事实上,当我们给定一组V的基α1,,αn之后,φ具有矩阵表示A,并且α1,,αnV的一组k生成元,自然也是一组R-生成元。于是我们考虑由α1,,αnV确定的R-满射 ρ:RnV. 现在要为这个映射找出核,我们考虑矩阵表示A,显然有 xi:=tei(a1ie1++anien)kerρ. 这里eiRn是标准基,这就找出了kerρn个生成元x1,,xn.于是我们可以作出映射RnRn使它的像对应到xi, 事实上,该映射刚好由矩阵tIAMn(R)所描述。由于tei=xi+(a1ie1+), 我们发现N=Rxi+keiRn的一个R-子模。于是对任意x=pi(t)eikerρ,它都属于N,从而可以写成 x=qi(t)xi+ciei. 注意到0=ρ(x)=ciαi,我们知道所有ci=0.这表明xxiR-线性组合,我们证明了xi确实构成了kerρ的一组生成元。

我们还需证明RnRn是单射,即xiR-线性无关组。为此,设qi(t)xi=0,我们有 iqi(t)teii,jqjaijei=i(qitjqjaij)ei=0 这表明tqi=jaijqj. 那么我们发现,(q1,,qn)=Rqikqi.由于 R 是PID,左边的理想是主理想,设它等于(d).若d0,由于R是整环,(d)应当是包含了任意次数的多项式,但右边kqi是有限维k-空间,且仅包含有限次数的多项式,这不可能。于是d=0,我们知道q1=q2==qn=0.

推论 4.2. 我们有如下R-模的短正合列 0RnRnVA0. 其中RnRn是由tIAMn(R)确定的映射。

有了这个基本的正合列之后,我们来考察怎么具体将VA的模结构计算出来。注意到tIA是PID上的矩阵,于是存在可逆矩阵P,QMn(R)使得 P(tIA)Q=D=diag(d1,,dr,0,,0) 这里d1||dr, diag表示以这些元素为对角线,其它地方为0的对角矩阵。那么我们有这样一个交换图 rendering math failed o.o 这里我们需要以下一个简单的引理

引理 4.2. R是一个(未必交换)环,M等都是(不妨设)左R模, 如果给定了如下的关于R模和R模同态的交换图(除了γ以外的部分) rendering math failed o.o 并且两个行都是正合的,那么可以唯一的构造出一个R模同态γ,使得整个图都交换。另外,如果α,β还是同构映射,那么γ也是。(本质上,这个同态γ是由β诱导的。)

Proof. 事实上,取mM,考虑它在M中的一个原象m, 将其映射到gβ(m), 我们定义γ(m)=gβ(m).那么需要验证这个定义不依赖于原象m的选取,事实上,另一个原象只与m相差一个ker(g)的元素,即相差一个Imf的元素,故记另一个原象为m+f(m), 它在N中的像是g(β(m))+g(β(f(m)))=g(β(m))+g(f(α(m)))=g(β(m)),于是γ的定义不依赖于原象m的选取。这里用到了交换性。容易验证γ确实是一个R模同态。唯一性是显然的,因为γ就是由图的交换性唯一确定的。

现在来考虑α,β是同构时,γ为何是同构映射。事实上,我们作出α1,β1, 然后定义出这样一个交换图 rendering math failed o.o 那么由引理的前一部分,可以唯一的构造出γ与图交换。注意到1M:MM显然是一个与第一行和第三行交换的映射,于是由唯一性,γγ=1M,从而γ是同构。 ◻

现在,由于P,Q可逆,Q1,P显然定义出了同构映射。由这个引理我们知道可以构造出VAV的同构,这里 VRn/DRn=R/(d1)R/(dr)Rnr. 注意到VVA作为R模同构自然也是k模同构,并且是一个有限维k向量空间,但是R并不是有限维k向量空间,于是n=r, d1|d2||dnR中的非零元素使得 VAVR/(d1)R/(dn). 当然,判断出VA同构于上述形式并不需要前面的论证,只需要使用有限生成R模的结构定理即可。但是上述过程给出了一个利用A的形式将VA化为结构定理中的标准型的明确计算方式。

练习 4.40 (). 证明,当给出了如下R模同态的交换图之后(这里行都是短正合列) rendering math failed o.o 可以唯一的构造映射α使图交换。如果β,γ都是同构,那么α也是。

练习 4.41 (). KL是两个域,KL的子域。证明A,BMn(K)K上相似当且仅当它们在L上相似。

特征向量与根子空间

本节我们通过特征空间理论的讨论如何实际的得到转移矩阵P使得P1AP=D为我们的标准型,或者等价的说,AP=DP.假定k是一个使φ的初等因子都是形如一次式的乘积(xλi)ki的域(比如说,代数闭域,如k=C),我们将此时的初等因子中出现的λ称作φ特征值.按照特征值排列准素因子我们有 Vφλ(k(R/(tλ)k)nk). 对于每个特征值λ,k(R/(tλ)k)nk在同构下对应的Vφ的子空间称为关于特征值λ根子空间,它等于 Rλ:=kker(φλ)k. 而子空间ker(φλ)称之为关于λ特征子空间,记为Vλ,其中的向量叫做φ特征向量,它显然是对应特征值的根子空间的子空间。 注意到我们前面讨论Jordan标准型时对形如R/((tλ)k)的子模的基的k-基的选取,我们知道1R在该模中的投射像生成了这个模,即它有一组基(tλ)k1,,(tλ),1,这里我们的基需要按这样的顺序排列以保证φ的矩阵是之前所描述的Jordan形式。那么如果我们找出了1R/((xλ)k)Vφ的同构下的像,不妨记为α,该子空间对应的一组k-基就可以写成(φλ)k1α,,(φλ)α,α.

如果φ是可对角化的,那么所有初等因子都是一次式,此时根子空间就等于特征子空间。只要求出特征向量,就能得到P.对于一般的φ我们需要求出根子空间的基ker(φλ)k. 下面我们举几个例子来说明

4.5. 我们考虑域k=Q上的如下矩阵 A=(1234),tIA=(t123t4). 那么我们对tIA做初等变换,得到 (2t1t43)(20t4(t4)(t1)23)(100t25t2). 于是AQ上的有理标准型为(0215). 即,存在Q上的可逆矩阵,使A相似于上述形式。如果我们考虑k=R或者k=C(事实上,只需要k=Q(33)即可),那么从t25t2=(t5+332)(t5332)我们得到它的初等因子,从而它在k上相似于如下对角阵 A=(5+332005332). 这就是它在任意包含了Q(33)的域k上的的Jordan标准型。

为求出P,考虑它对这两个特征值λ1=5+332,λ2=5332的特征子空间 Vλ1=ker(Aλ1I)Vλ2=ker(Aλ2I).利用前几节描述的ker的算法对ker(AλI)进行计算(或者直接解方程)我们可以计算出这两个空间的生成元,即特征向量是(2λ1),这里令λ=λ1,λ2分别得到对应特征值的特征向量。于是(注意,P不需要是唯一的。) P=(223+3323332) 满足AP=PA,即P1AP=A.

4.6. 考虑如下Q上的矩阵,将其化为Jordan标准型J,并找出对应的P使得P1AP=J. A=(2121122100110001). 通过对tIA的初等变换,我们可以计算出它的不变因子 (1000010000(t1)0000(t1)2(t3)) 从而得出初等因子是(t1),(t1)2(t3).于是我们先计算ker(A1I)2,得到了根子空间R1如下的一组基(基并非唯一,大家算出来的可能不同) v1=(1100),v2=(2010),v3=(2001). 对上述向量分别作用AI,我们发现前两个向量落入了ker(AI),而最后一个(AI)v3=e1e2+e3从而属于ker(AI)2ker(AI).于是令α2=v3,这个向量就对应了R/((t1)2)中的生成元1,它的Jordan块对应的基是(AI)α2,α2. 那么我们还需要一个不属于k[φ]α2生成的空间的特征向量来对应到另一个初等因子(t1),显然可以取α1=v1.

最后通过简单的对特征向量ker(A3I)的计算,我们找到一个特征值为3的特征向量 β=(1100) 将它们以α1,(AI)α2,α2,β的顺序排列进矩阵P,我们就得到了所需的转移矩阵 P=(1121110101000010),P1AP=(1000011000100003).

练习 4.42 (). 事实上,在上述例子的P的计算过程中,我们还可以用以下手段降低计算量。

  1. φ:VV是一个一般的n维空间上的线性映射,它的极小多项式形如(tλ1)k1(tλ2)k2,这里两个特征值不相同。证明 Im(φλ1)k1=ker(φλ2)k2 ker(φλ1)k1=Im(φλ2)k2.

  2. 这里A回到上一个例子中的A.通过计算矩阵(A3I)ker(A3I),找出λ=3的特征向量,并利用ker(AI)2=Im(A3I),说明ker(AI)2直接由A3I的列生成,从而无需计算(AI)2和它的核。

练习 4.43 (). Fibonacci序列是所谓由初始条件F1=1,F2=1以及递推式 Fn+2=Fn+1+Fn 所确定的唯一正整数序列。我们可以将上述递推式转化为矩阵形式 (Fn+2Fn+1)=(1110)(Fn+1Fn). 记其矩阵为A.通过将上述矩阵化为k=C上的Jordan标准型,我们可以轻松的计算An,并从其中导出Fn的通项公式。

练习 4.44 (). 是否存在矩阵X使得 X2=(011001000)?

线性映射的不变量

所谓不变量,是指,要么这个量的定义不依赖于基的选取,要么对任意基的选取,这个量都是不变的(即所谓相似不变量).本节我们来看线性映射的几个经典的不变量。

行列式

考虑一个nk-向量空间V和其上的一个线性映射φ:VV.我们考虑V上的一个n-线性交错函数 D(v1,v2,,vn):V×V××Vk. 所谓n-线性是指,D对每个变量vi都是线性的,即固定其它元素时, viD(v1,,vi,,vn):Vk 是一个k线性映射。而交错则是指,如果有两个向量相同,比如vi=vj=v,那么函数的值为0. D(v1,,v,,v,,vn)=0. 作为推论,这表明当我们交换两个向量vi,vj的位置时,函数值会变为原来的相反数 D(v1,,vi,,vj,,vn)=D(v1,,vj,,vi,,vn). 这是因为D(,vi+vj,,vi+vj,)=0,利用n-线性展开可得上述推论。 那么首先我们要问了,我们加了这么多奇怪的条件,这样的函数还能存在吗?我们考虑引入V的一组基e1,,en,并考虑vi在基底下的分解 vi=ajiej. 那么由n线性我们有 D(v1,)=j1aj11D(ej1,)=j1j2aj11aj22D(ej1,ej2,)==j1,,jnaj11ajnnD(ej1,,ejn) 由于D(ej1,,ejn)中需要没有重复元素才能不为0,我们只需要考虑kjk刚好构成{1,,n}的一个置换的情形。不妨记这个置换为σ, 此时置换σ又可以分解为一系列对换的乘积,而每一个对换对D来说刚好产生一个负号,从而 D(eσ(1),,eσ(n))=sgn(σ)D(e1,,en)D(v1,,vn)=(σSnsgn(σ)aσ(1)1aσ(n)n)D(e1,,en). 容易验证上述表达式定义的函数确实满足n-线性性和交错性,于是我们想要的函数D确实存在,但其定义似乎依赖于D(e1,,en)值的选取和V的一组基的选取。为了避免无意义的0函数,我们选取D(e1,,en)0,对任意映射φ,考虑 det(φ):=D(φ(e1),,φ(en))D(e1,,en) 称为φ行列式,如果我们写出矩阵分解φ(ei)=ajiej, 根据上面的公式,我们知道这个定义不依赖于D(e1,,en)的值的选取(只要不为0),从而可以写出对于矩阵A的行列式的定义 detA=σSnsgn(σ)aσ(1)1aσ(n)n. 这相当于假定D(e1,,en)=1时,D(α1,,αn)的值,这里αiA的列。 神奇的是,事实上φ的行列式的定义也不依赖于基 e1,,en 的选取!为此我们只需证明 相似的矩阵行列式相同。而这是因为行列式是一个乘法同态:

定理 4.9 (行列式是乘法同态). 固定向量空间V的一组基的选取,设A,BMn(k)是两个矩阵,那么 det(AB)=det(A)det(B).

Proof.A的列从左到右分别是α1,,αn,那么AB的第j列就是b1jα1++bnjαn.设,通过类似于前面的交错和展开,我们有 det(AB)=σSnsgn(σ)bσ(1)1bσ(n)nD(α1,,αn)=σSnsgn(σ)bσ(1)1bσ(n)ndet(A)=det(A)det(B). ◻

很容易看出,det(I)=1,因此对于可逆矩阵Pdet(PP1)=det(P)det(P1)=1det(P1)=(detP)1.那么,两个相似的矩阵A=PAP1的行列式就一定是相同的 det(A)=det(P)det(A)(detP)1=det(A). 事实上,行列式有着明显的含义,n-线性交错函数某种意义上就是n-维空间中的一种带符号的体积函数,它描述了向量v1,,vn张成的平行多面体的体积。而这个体积的定义最终还需依赖’基础体积’D(e1,,en)的值。那么,φ的行列式就是φ把这个基构成的平行多面体映射成的新平行多面体的体积’放大的倍数’,这个倍数却不依赖于’基础体积’的值.即,它描述了线性映射φ的带符号的’大小’.这个大小是不依赖于基的选取的。

练习 4.45. 说明,行列式事实上可以对Mn(R)中的矩阵定义,这里R是一个交换环。

练习 4.46 (). 本题中设AMn(R)是PID上的矩阵。

  1. A是可逆矩阵当且仅当det(A)R×是单位。

  2. A定义了一个单射当且仅当det(A)0.

  3. rankA<n当且仅当det(A)=0.

练习 4.47 (). φ:VV是一个n维向量空间上的k-线性映射,A是它在某一组基下的矩阵,证明下列说法的等价性。

  1. rankA=dimV.

  2. A的列能生成dimV.

  3. kerφ=0, 即φ是单射。

  4. detφ0.

  5. 0不是φ的特征值。

  6. Ax=0没有非零解。

  7. A是可逆矩阵,φ是同构。

练习 4.48 (). φ:VV是域kn维向量空间上的线性映射,定义多项式pφ(t)=det(t1Vφ).

  1. pφ(t)φ的一个相似不变量,它的根都是φ的特征值,因此称为φ的特征多项式。

  2. 证明pφ(t)等于φ的所有不变因子的乘积,也即所有初等因子的乘积。

  3. 证明Cayley-Hamilton定理pφ(φ)=0.

张量积

MN分别是右A模和左A模,我们可以定义一个阿贝尔群MAN, 其中的元素都是由形如mn的符号生成的,其0元素为00,并且满足以下三条约束

  1. (系数平衡) (ma)n=m(an),

  2. (左线性) (m+m)n=mn+mn,

  3. (右线性) m(n+n)=mn+mn.

即,要求这个符号具有双线性性,并且A中的元素可以自由的穿过该符号。严格来说,这个定义是指,MAN是一个由所有符号mn生成的自由Z模,商掉所有形如(ma)nm(an),(m+m)nmnmn等关系元素生成的子模。当我们不写出A的时候,要么从上下文是明确对哪一个基环取张量积,要么我们是在对A=Z取张量积。由于任何模都是阿贝尔群因此可以视为双边Z模,故Z总是可以定义出来的。

4.7. M=Z/2, N=Z/3是两个Z模,那么考虑T=MZN=Z/2Z/3. 这个群是由所有形如mn的符号生成的,这里mZ/2表示整数m所在的剩余类。

  1. m=0时,0=00因此0n=(00)n=0(0n)=00=0, 这个元素是T中的0元素。

  2. 同理当n=0时,m0=0.

  3. m=1时,我们有1=31,因此1n=(13)n=1(3n)=10=0.

因此在这个例子中,张量积(Z/2)Z(Z/3)=0.事实上对(m,n)=1互素都有(Z/m)Z(Z/n)=0.

练习 4.49. 观察上述例子,回答:在MAN中,mn=0是否等价于m,n中有至少一个是0

虽然一般来说我们定义出的MAN只是一个Abel群,但类似于Hom,当MN至少有一个具有双边模的结构时,可以将MAN赋予模结构。 我们来举例说明SMRRRN)具有左S模的结构。这是因为我们可以对,sS定义 s(mn):=(sm)n.

类似的一共有四种情况,我们将所有情况列出如下表格

自然的模结构 S模结构的定义
MRRN Z none
MRS,RN S
s(mn):=m(sn)
MRRNS S
(mn)s:=m(ns)

练习 4.50 (). 确认你弄明白了表格中的所有情况。

4.8. M是一个左A模,同时有一个系数扩张同态ρ:AB,这里你可以把B理解为一个更大系数的环,比如QC.那么由于B此时可以视作一个左BA模,我们可以利用张量积,将MA系数扩张为B系数,得到一个左B模: N=BAM 这里平衡关系可以理解为b(am)=(bρ(a))m, 因为B的右A模结构是由ρ给出的。

练习 4.51. M是一个左A模,A显然是一个双边A模,证明AAMM是一个左A模,同构于M.

张量积的Universal Property

相比于直和或者直积分别代表多个物件指向一个物件,和一个物件指向多个物件,张量积的一个重要含义是,它代表了多线性属性。什么意思呢?我们说B:M×NP是一个Z-多线性映射,是指B的两个变量都是Z线性的。如果还要求BA-平衡的,即B(xa,y)=B(x,ay),那么B本质上是定义在MAN上的线性映射。即,双线性映射不过是一类特殊空间上的线性映射。

定理 4.10 (张量积的Universal性质).

  1. M,N是两个Z模,那么任意一个双线性映射B:M×NP都可以分解为映射的复合 rendering math failed o.o 其中φ(m,n)=mn是一个与B无关,只与M,N有关的的典范映射,也叫MN的结构映射,B:MNP是一个使上图交换的唯一的映射。

  2. M,N分别具有右,左A模结构,那么类似的,任意一个A平衡的Z双线性映射B:M×NP都可以唯一的分解为Bφ:M×NMANP.

Proof. 根据定义,MN=F/I,这里 F=(m,n)M×NZ(mn) 是所有抽象符号mn生成的自由模, I则是由所有双线性关系生成的子模, I=(m+m)nmnmn,m(n+n)mnmnm,n. 给定了一个双线性映射B:M×NP之后,我们可以定义一个Z线性映射 fHomZ(F,P)=M×NHom(Z(mn),P) 为满足mnB(m,n)的唯一映射。其存在性是自由模的性质保证的。由于B是双线性的,显然有f(I)=0(因为fI的所有生成元上是0,有Ikerf),因此可以作出商映射f:F/IP:a+If(a), 这便是我们需要的B:MNP. 命题的第二部分也是类似的,只需作简单修改即可。 ◻

推论 4.3. HomZ(MAN,P)=Hom|A(M,HomZ(N,P)) 这里左边对应的就是命题中的B,右边对应的是A平衡双线性映射B:M×NP

引理 4.3. 如果V,Wk线性空间,那么 在VkW中,vw=0v=0w=0.

Proof. ()为显然,对于(),如果v,w都不为0,可以构造k线性函数f:Vk,g:Wk使得f(v),g(w)0. 那么容易验证,B(x,y):=f(x)g(y)是一个k平衡双线性映射,因此可以分解为B=Bφ:V×WVkWk.但是B(v,w)=f(v)g(w)不为0,因此φ(v,w)=vw0. ◻

练习 4.52. 将上述命题推广到M,N分别是右,左A模的情形。这里需要添加适当的假设:MN满足,任意非零元素都存在A线性函数在该元素上不取零。

4.9. k是一个域,V,W是两个k向量空间。显然它们是两个双边k模,因此可以定义出k-线性空间VkW.如果V,W分别是由基底{ei},{fj}生成的,那么VkW由基底eifj生成。该基底能生成整个VW是显然的,难点在于说明{eifj}VW线性无关。假设有一个有限和 x=aijeifj=0 那么这表明,对任意k平衡双线性映射B:V×Wk,都有B(x)=0.由于(v,w)ei(v)fj(w)显然是一个k平衡双线性映射,这里ei代表在基底ei上取值为1,其他基底上取值为0的唯一线性函数ei:Vk.将该函数作用在x上我们得到aij=0,而i,j是任意的,因此这表明x的所有系数都是0.

练习 4.53. 说明,dimk(VkW)=dimVdimW.

练习 4.54 ().

  1. 如果有两个线性映射f:VV,g:WW,能否自然的定义出一个线性映射fg:VWVW?

  2. V,V,W,W分别有一组基底ei,ei,fj,fj, 而f,g在基底下有矩阵表示A=(aij),B=(bij).求在VW,VW自然的基底{eifj},{eifj}下,fg的矩阵表示AB.在适当的基底排列顺序下,你应该可以得出如下形式 (a11Ba1mBam1BammB). 而如果你把基底的排列换一种方式,你可以得出如下矩阵形式 (b11Ab1nAbn1AbnnA). 作为推论,这两个矩阵一定是相似的。通常我们将前者约定为矩阵AB.

对偶空间

对于一个A-模M我们可以定义一个对偶模M:=HomA(M,A)。它的模结构由A的双边A模结构给出,即如果M是左A模,M就是右A模,反之亦然。在A是交换环,或者是一个域的简单情形,我们不需要区别左右模的问题,M就是自然的A模。

k向量空间V的简单情形,V=Homk(V,k)叫做V对偶空间。它可以理解为V上面所有的线性函数f:Vk构成的向量空间。对偶空间好玩的地方在于,它是一个反变函子。

定理 4.11. 对偶函子MM是一个从左A模到右A模的反变函子,即它将一个左A模对应到一个右AM,并且将左A模同态f:MN对应到右A模同态f:MN。这个对应满足合成律,即合成 LgMfN=LfgN 被对偶函子所保持:(但由于是反变函子,会扭转合成的方向) LgMfN=L(fg)=gfN

Proof. 事实上这就是我们之前讨论过的Hom函子()=HomA(,A)的性质的特殊情形。回忆它将f:MN对应到f:MfN,即通过f:MNN上的线性函数h:NA拉回到M上的线性函数hf:MNA. ◻

对偶基

如果M有一组基,即MA(I)是自由模,那么它的对偶模是HomA(A(I),A)=HomA(A,A)I=AI.后者通常是一个比A(I)更大的模,但如果I是有限的,那么A(I)AI是同构的。在向量空间的情形,这表明有限维向量空间的对偶空间V具有和V相同的维数。但是这个同构并不是典范的,即我们不能在不给定一组基的情形给出这个同构,并且这个同构取决于我们的基的选取,它不是自然同构。即便如此,我们仍然可以讨论一组基对应的对偶基的概念。

V由一组基{b1,,bn}生成,那么这组基等价于一个同构映射φ:knV,将kn上的标准基{ei}对应到φ(ei)=bi。对这个映射取对偶函子我们会得到 kn(kn)φV 而由函子性,φ也是一个同构映射。如果我们扭转φ的方向,这就会给出一个同构kn(kn)(φ)1VV的一组基,称之为{bi}对偶基,记为{bi}.

具体来说,ei的定义是,它在φ下的像是kn上的取第i个坐标的函数ei:knk。即满足 biφ=ei 带入ej就有 bi(bj)=ei(ej)=δij 这里δij=1i=j表示一个在i=j时等于1,其它时候等于0的符号。上面这一行也通常作为对偶基的等价定义,因为对所有ejkn满足上一行可以线性扩张到对所有向量满足biφ=ei.

对偶线性映射的矩阵表示:转置

f:VW是一个有限维线性空间之间的线性映射,在确定了VW上的一组基vi,wi后,具有矩阵表示A=(aij)f(vj)=iaijwi. 那么,对应的对偶映射f:VW在对偶基vi,wi下的矩阵表示B=(bij)是什么样的呢?我们计算 ibijvi=f(wj)=wjf, 代入vi就可以得到 bij=wj(f(vi))=wjjajiwj=aji. 这个矩阵事实上就是将A的所有元素按主对角斜线翻转得来的,将行变成列,列变成行。这个操作我们称之为A的转置矩阵,记为AT.因此我们得到了如下推论:

定理 4.12. 对偶映射在对偶基下的矩阵是原映射在原有基底下的矩阵的转置。

推论 4.4. 转置会翻转矩阵乘法的方向,即(AB)T=BTAT.

值得注意的是上述推理并不需要VW维数相同,矩阵和矩阵的转置可以对任意形状的矩阵进行。

练习 4.55 (). V是有限维向量空间。讨论当基底发生变化时,对偶基如何变化?即如果有一组基底{αi}和一个坐标变换给出的新的基底{βi}, βi=jajiαj, 这里A=(aij)是一个可逆方阵。那么对应的对偶基βi应该如何用αi来表示?

双对偶

虽然当向量空间是有限维时,VV并不是自然同构的,但是神奇的是,VV是自然同构的。

定理 4.13. V是有限维向量空间,那么映射ev:VV:vevv是一个不依赖于基底选取的自然同构。这里evv代表将V里的函数f映射到evv(f)=f(v)k的线性映射,即计算fv上的取值。

Proof. 容易看出evv:VV是一个V=(V)里的元素。我们来证明这个映射是同构,首先ev显然是线性映射,因为它计算取值的对象是线性函数。为此我们只需证明ev是一个单射,因为在有限维的情形我们知道dimV=dimV=dimV.

如果v0,一定可以找到线性函数f:Vk使得f(v)0(比如将v扩充为一组基然后取对偶基f=v). 那么此时evv(f)=f(v)0,从而作为V的元素,evv0.这就证明了ev是单射,从而证明了命题。 ◻

如果V不是有限维的,V通常会非常大,但是我们仍然有上述自然的单同态ev:VV.

域扩张和伽罗瓦理论

群表示论

本章节需要大家具有线性代数和张量积的基础知识。从某种意义上说,群表示论是线性代数的延伸。想想一个线性空间V和其上的一个线性算子σ:VV, 那么我们可以把v自然的作用在V上,于是可以得出一系列v,σv,σv2,.如果σ还是可逆的,我们相当于可以把σk这一系列算子都作用在V上,不难发现,这本质上可以视作群Z在线性空间V上的作用。更一般的我们可以考虑群GV上的作用。 群的线性表示是指群以线性变换的方式作用在线性空间上,即给出一个群同态 ρ:GGL(V). 或者等价的说,给F-向量空间V一个FG模结构(简称为G模):FG是由G中元素构成的所有线性组合,它们是所有“算子”,可以自然的作用在V上,并且满足对于g,hG以及λ,μF,

  1. 1v=v.

  2. h(gv)=(hg)v.

  3. g(λv+μw)=λgv+μgw.

基本概念

G是一个群,V是域F上的向量空间。如果有同态 ρ:GGL(V) 则我们称 (V,ρ) 是一个 GF-线性表示,在不引起混淆时我们直接称V或者ρG的一个线性表示。如果 dimV<, 我们说 dimV 是表示的次数,记作degρ.我们只涉及有限维的表示。

我们可以定义 kerρ:={gG:ρ(g)=1V}, 称作表示ρ的核。如果 kerρ={1} 我们说表示ρ是忠实的。

一个表示就是给了G 在线性空间 V上的一个(以可逆线性变换的方式)作用。V 可以等价的说成一个 G-模。所有 ρ(g) 都是 VV 的一个可逆线性变换。

6.1. 考虑由G的元素张成的线性空间FG, G在其上以左乘的方式有一个可逆线性变换的作用(置换它的基)。这称为G的正则表示,记为(FG,ρreg)

子表示和商表示

V是一个G表示,UV 是一个子空间。我们称 U 是一个 子表示 如果 ρ(g)UU(gG), 也即UG的作用下是封闭的。在这种情形下我们还可以给商空间一个自然的作用,获得所谓的商表示 g(v+U):=gv+U. 如果 UV 的一个子表示,适当的取V的一组基 v1,,vm,,vn 使得 v1,,vm 构成 U 的一组基,则用矩阵的语言我们有对所有gG, ρV(g)=(ρU(g)ρV/U(g)).

6.2. 正则表示FG有一个一维子表示U=F(gGg).

表示的同态

(V1,ρ1)(V2,ρ2) 是两个表示. 如果有线性映射 fHomFV1,V2 满足 ρ2(g)f=fρ1(g)gf(v)=f(gv), 或者说有如下交换图表 rendering math failed o.o 则我们称f是一个G表示的同态,或者说是一个G模同态。全体 G-模同态的空间记作HomGV1,V2.

反轭表示

V是一个G表示时,我们也可以自然地把V=HomFV,F看成一个G表示 (ρ(g)f)(v):=f(g1v) 我们把这个表示称作V反轭表示。在选取了V的一组基B,以及V的一组对偶基 B 之后,我们有 ρB(g)=(ρB(g)T)1. 读者可能会奇怪,为何反轭表示里,gf(v)定义为f(g1v)而不是f(gv)?这是因为群的作用需要满足结合律,也即需要满足 (gh)f=g(hf). 但是注意到映射f的合成会把乘法的顺序反过来 g(hf)=g(f(h1))=f(h1g1)=f((gh)1) 因此需要引入逆将乘法的顺序再反过来,这是唯一合理的定义。

张量积表示

对于给定的两个表示 VU,我们可以在张量积空间VU上定义一个自然的作用使其成为一个G表示 ρVρU:GGL(VU)gρV(g)ρU(g). 称之为张量积表示。 通过张量积表示,我们可以将空间HomFV,U自然地视作一个G模。这是因为,HomFV,U 可以自然的视作 VFU,于是在其上的张量积表示可以给出 (gf)(v):=g(f(g1v)). 在这个定义下,HomGV,U成为 HomFV,U的子表示。

命题 6.1. 我们有如下G模同构 VUFGHomFV,U.

Proof.U的一组基ui以及V的一组基vi和对偶基vi,考虑从HomFV,UVU的一个对应 fi,jvi(f(uj))viuj. 容易看出这是线性空间的同构。由定义知它们在G的作用下是相同的。 ◻

表示的直和

我们可以将两个表示V1V2直和起来,得到一个新的G表示V1V2 ρ1ρ2:GGL(V1V2)gρ1(g)ρ2(g). 也即 g(v1,v2)=(gv1,gv2). 从矩阵的观点来看,令BiVi的一组基,则我们有 ρV(g)=(ρV1(g)ρVn(g)).

表示的外张量积

给了一个G1的表示和G2的表示之后,我们可以构造一个G1×G2 的表示 ρ1#ρ2:G1×G1GL(V1V2)(g1,g2)ρ1(g1)ρ2(g2) 称作表示ρ1ρ2的外张量积。

不可约表示

我们现在将要研究将表示拆分成一些更小的表示,以及无法再分解的基本的表示:不可约表示。 一个表示 V 叫做 不可约 如果它没有非平凡的子表示。叫做不可分解,如果它不能分解成两个非平凡的子表示的直和。显然不可约模一定是不可分解的。我们称一个表示是完全可约的,如果它能分解成不可约模的直和。显然我们讨论的有限维表示都可以分解为不可分解表示的直和,但不可分解模不一定是不可约模。但是,我们将证明,对于charF|G|的情形,有限维表示都是完全可约的。

我们今后将完全限于charF|G|的情形(称之为常表示论),读者完全可以假设F=C而不失任何关键信息。charF||G|的情形非常复杂,属于模表示论的范畴。

引理 6.1. f:VUG-模同态,则kerfVImfU都是子表示。

Proof.vkerf则有f(gv)=gf(v)=0,因此gvkerf, 即kerfV的子表示。类似可证Imf. ◻

下面的引理是简单而重要的:两个不同构的不可约表示之间没有非平凡的同态。

引理 6.2 (Schur). V1V2 是两个 G 表示,则有

  1. f 是任一个非平凡 G-模映射,那么f只能是同构。因此,若ρ1ρ2, 则 HomGV1,V2=0.

  2. HomGV1,V1 是一个包含 F 的除环.

  3. F 是代数闭域, 那么 HomGV1,V1F1V1F.

Proof.f是一个G-模映射,W=kerfV1的子表示,由于V1是不可约的,必然有W=V1或者W=0.若假设f非平凡,必有W=0从而f是单射。同理我们必有Imf=V2,故f也是满射,因此是一个同构。

对于第二个命题,只需注意到HomGV1,V1中的任意非零元素都是同构因而是可逆的。

最后,如果F是代数闭域,我们可以考虑f的特征值λ和特征向量v.注意到由Gv张成的空间构成V1的子表示,故它等于V1.因此任何xV可以写成 x=gGxggv,xgF. 必然有 f(x)=gGxggλv=λx. 这表明f=λ1V1. ◻

Maschke 定理

我们即将开始看到charF|G|起到什么样的作用。Maschke定理描述了在这种情形下,每个子表示都有直和补表示,这将表明不可分解模是不可约的,从而我们研究的有限维表示都可以分解为不可约表示的直和。

定理 6.1 (Maschke). V是一个F-表示, charF|G|,那么V的任意子表示U都有直和补表示。

Proof. 我们首先可以找到U的一个补空间(不要求该补空间是子表示),设V=UW,考虑p:VU是该直和分解附带的投射,我们只需证明存在一个G-模投射p:VU,这样的话V=Ukerp,而kerp则自动是子表示。

做法是考虑p的平均化: p:VUv1|G|gGg1p(gv). 容易验证它确实是G-模同态 p(gv)=1|G|hGh1p(hgv)=1|G|hG(hg1)1p((hg1)gv)=gp(v). ◻

正则表示的分解

正则表示FG具有基本的重要性,因为每个不可约表示都是FG的直和项。这是因为,如果我们把FG分解成某些不可约表示的直和 FG=i=1mViniV是任意一个不可约表示,则有 HomGFG,V=i=1mHomGVi,Vni. 于是由Schur引理,若V没有出现在FG的分解中,上述空间=0.如果V=Vj, 则njdimHomGVj,Vj=HomGFG,V. 但是我们知道,可以实际的计算空间HomGFG,V.事实上,其中的元素fHomGFG,V完全由f(1)V值所决定,反过来任给一个vV可以作出映射f使得f(1)=v.于是有线性空间的同构 φ:HomGFG,VVff(1). 于是我们得出如下重要命题

定理 6.2 (正则表示的分解). 任何不可约表示都是正则表示FG的直和项。如果 If V1,,Vk 是所有的互不同构的不可约表示,那么 FGi=1kVidi. 其中 di=dimVidimHomGVi,Vi. 特别的,如果F=C, di=dimVi.

Proof. 考虑Vi=HomGFG,Vi=HomGVi,Vidi. 计算两边的维数即得结论。 ◻

推论 6.1. F=C,并且 n1,n2,nk 是所有不可约表示的次数,那么我们有|G|=n12++nk2.

特征标理论

特征表理论是群表示论的核心部分之一:它是表示的重要不变量。给定一个表示(V,ρ),我们可以联系一个表示的特征标χ=χρ:GF,定义为g作为线性变换的迹 χρ:GFgtrρ(g).

引理 6.3. F=C,则 ρ(g):VV作为矩阵是可对角化的,并且其特征值都是单位根。

Proof. 这是因为gG有阶数gn=1, 这表明ρ(g)n=1,满足该方程的矩阵必然是可对角化的,并且特征值为n的单位根。 ◻

命题 6.2 (特征标的基本性质). 特征标 χρ 具有如下基本性质

  1. χ(1)=degρ

  2. χ(ghg1)=χ(h)

  3. F=C,则χ(s1)=χ(s).

Proof. 由于1G的作用必然是恒等作用,它的迹当然是V的维数。第二条是由于矩阵的相似不改变迹。第三条是因为ρ(s1)ρ(s)互为逆矩阵,故它们对应的特征值之和分别为λiλi1=λi.这里用到了|λi|=1. ◻

Properties

The sum, or product, of two characters of G, is still a character of G, since the sum is the character of the direct sum of the two representations, and the product is the character of the tensor product of the two representations.

Orthogonal Relations

If charF|G|, for two F-valued functions χ1,χ2 on G, define (χ1,χ2):=1|G|gGχ1(g)χ2(g1). We have the following

定理 6.3 (First Orthogonal Relation). charF|G|, if χ1 and χ2 are characters of two irreducible F representations V1,V2 of G, then (χ1,χ2)={0,ρ1ρ2dim(HomGV1,V1)1F,ρ1ρ2

引理 6.4. charF|G|, let χ be the character of an F-representation V, χ be the character of the sub F-representation InvG(V)={v|gv=v,gG}. Then 1|G|gGχ(g)=1|G|gGχ(g).

Proof. 1|G|gGχ(g)=tr(1|G|gGρ(g))=trz where z is a linear map indicated by the context. Note that gz=zg=z therefore z is an G-module map and z2=z. ◻

Proof of the theorem. 1|G|gGχV1(g)χV2(g)=1|G|gGχV1(g)χV2(g)=1|G|gGχV1V2(g)=1|G|gGχHomFV2,V1(g)=1|G|gGχInvG(HomFV2,V1)(g)=1|G|gGχHomGV2,V1(g)={(dimHomGV1,V1)1Fρ1ρ20ρ1ρ2. ◻

推论 6.2. If Vn1V1nkVk, where V1,,Vk are distinct irreducible representations, then (χ,χi)=nidimHomGVi,Vi. If charF=0 and F is the splitting field of G, then (χ,χ)=1 if and only if V is irreducible.

The first orthogonal relation can also be stated as follows 1|G|t=1shtχi(gt)χj(gt1)=δijdimHomGVi,Vi where {g1,,gs} is a set of representatives of the s conjugate classes of G. h1,,hs are the sizes of each conjugate class. In particular, if F=C and denote χij=χigj, one has 1|G|t=1shtχitχjt=δij using matrix notations, this is XHXT=|G|I where X=(χij),H=diag{h1,,hs}. It is easy to see that we have XTX=|G|H1 or written explicitly t=1sχtiχtj=|G|hiδij=|CG(gi)|δij this is called the second orthogonal relation or column orthogonal relation.

置换特征标

Let GSn acts on {x1,,xn}, we obtain easily a representation of G on V=x1,,xnF thus |Fix(g)|=trρ(g) is a character. Since U=F(x1++xn)=Fz is a subrepresentation or a sub-FG-module of V, one can construct the quotient representation V/U, and obviously χρ=χU+χV/U=1+χV/U. Which gives another useful character χ of G χ=|Fix(g)|1.21

Tensor Product

VVSym2(V)Alt2(V) χ2=χS+χA χS=12(χ2(g)+χ(g2)) χA=12(χ2(g)χ(g2))

Powers of Irreducible Character

定理 6.4. Let χ be an irreducible character taking r different values. Then any irreducible character is a component of one of the r characters 1,χ,χ2,,χr1.

Character Table : Examples

We give some examples of calculating the character table of a given group G.

6.3. To calculate the character table of S3, first note that it is easy to obtain the character table of S2

S2 1 1
(1) (12)
χ1 1 1
χ2 1 1

then, via the homomorphism σ:S3S3/A3S2 we lift two characters of S2 to characters of S3

S3 1 3 2
(1) (12) (123)
χ1 1 1 1
χ2 1 1 1
χ3 n3 a b

since 6=12+12+22, we have n3=2. Moreover by the second orthogonal relation we have 1×1+1×(1)+2a=0 1×1+1×1+2b=0 therefore a=0,b=1. Thus

S3 1 3 2
(1) (12) (123)
χ1 1 1 1
χ2 1 1 1
χ3 2 0 1

6.4. We wish to calculate the C character table of A5, which does not have a nontrivial normal subgroup. First we identify the conjugate classes of A5. Note that [A5:CA5(g)]=[S5:CS5(g)][CS5(g):CA5(g)][S5:A5] the quotient [CS5(g):CA5(g)][S5:A5] is either 12 or 1 depending on whether CS5(g)A5.

Integrality

引理 6.5. Let gG is an element of order m, then χ(g) is a sum of degρ m-th root of units. In particular, this is true for all g if m is the l.c.m. of all orders of elements in G.

Proof. If gm=1, then ρ(g)m=1, the eigenvalues of ρ(g) will all be m-th unit roots. ◻

推论 6.3. Let χ be a complex character, then χ(g) is an algebraic integer.

推论 6.4. |χρ(g)|χρ(1), with equality holds if and only if ρ=ω1V.

Proof. Under certain basis, ρ(g) will be a diagonal matrix, whose diagonal elements are m-th unit roots. Therefore |χρ(g)|=|ω1++ωn|χρ(1) with equality holds if and only if ω1==ωn, in which case ρ(g)=ω1V. ◻

定理 6.5. Let χ be an irreducible complex character, then [G:CG(g)]χ(g)χ(1) is an algebraic integer.

Proof. Let ϕ=hCgρ(h) be a linear transform from V to V. Clearly it is also a G-module map. Now Schur’s Lemma gives ϕ=λ1V. Taking tr we have trϕ=λχ(1)=hCgχ(g)=[G:CG(g)]χ(g) thus λ=[G:CG(g)]χ(g)χ(1). Now, to show that λ is an algebraic integer, note that ϕ is the restriction of ψ=ρreg(h) on V. An eigenvalue of ϕ will also be the eigenvalue of ψ. Since λ is the eigenvalue of ϕ, it is the root of the polynomial det(λIM) with M being the matrix of ψ which is an polynomial of integral coefficients. ◻

推论 6.5. χ(1) must be a divisor of |G|.

Proof. |G|χ(1)=gG1χ(1)χ(g)χ(g)=i=1s[G:CG(g)]χ(gi)χ(1)χ(gi) which is an algebraic integer and also a rational, which must be an integer. ◻

Burnside’s Theorem

引理 6.6. Let α be a sum of n unit roots, with αn being an algebraic integer. Then α=0 or αn is a unit root.

Proof. Let f(x) be the minimal polynomial for β1=α/n over Q, β2,,βk be its conjugates. The Galois group Gal(f) acts transitively on them, let σiGal(f) be the one such that σi(β1)=βi. The number c=βiQ is also an algebraic integer since σi permutes the roots of f, we conclude that c is an integer. Now we wishes to prove that |βi|=1, to do so, note that |β1|1. In order to establish similar inequalities for each i, one needs to consider the field Q(ϵ), where F is the splitting field for f and ϵ is some unit root such that αQ(ϵ). Since Q(ϵ)/Q is normal, FQ(ϵ), Q(ϵ) is actually a splitting field for xm1 over F. We extend every σi to an automorphism of Q(ϵ), which sends unit roots in Q(ϵ) to unit roots in it. Therefore we have |βi|1 for each i, consequently |c|1 and so |c|=1=|βi|. ◻

诱导表示

我们通常希望用更小的群的表示来描述一个群G的表示。这方面,最简单的考虑是所谓膨胀(Inflation).

膨胀

NG,我们可以通过投射GG/NG/N的表示拉回为G的表示: GG/NGL(V). 这个操作称为膨胀 inf:Rep(G/N)Rep(N) 并且我们有inf是一个忠实函子。这是一个常用的获得较为简单的G表示的手段。

限制

当有子群HG时,我们可以将G的一个表示V直接视为H的表示,即通过合成 HGGL(V) 定义H的作用。这个操作称作限制(Restriction) ResHG:Rep(G)Rep(H). 从特征标的角度来看,限制不改变特征标:只需将χ限制在子群HG上取值即可。

诱导表示

诱导这个操作则是要从H的表示V构造出一个G的表示来,也即把HV变为一个G模。这个构造比限制要复杂,但是想法是简单的:利用双边GFG和我们的胶水:张量积,我们将为V配上一个G系数,考虑如下的张量积 V=IndHG(V)=FGFHVV由于FG可视为左GH模的结构,具有G的左乘作用 g(g0Hv):=(gg0)Hv V于是成为一个G表示。可以这样来想象IndHGV, 我们取一组陪集代表元G/H,那么


  1. 一般的书从一开始就只写了这个定义,这对初学者来说容易带来困难,初学者会以为群就是一种集合上面带有一种运算,满足一些不知道为什么的定义,他们需要花很长时间才能认识到群代表的实际上是对称。↩︎

  2. 也记为CnZ/nZ.↩︎

  3. 我们基本上只讨论有限群。↩︎

  4. 严格来说,是D3同构于D6 的一个子群↩︎

  5. 一个关系称作等价关系,如果它满足自反性aa,对称性abba 和传递性ab,bcac.↩︎

  6. 也可以定义右陪集。但为了方便,本书统一使用左陪集。↩︎

  7. 也即与其它所有元素都交换的元素↩︎

  8. 这种用交换图来表达等式的方式非常直观,在代数学中会经常用到。↩︎

  9. 有些书也记为SX↩︎

  10. 据说Frobenius 早在Burnside 之前发现了这个结果↩︎

  11. 对于SG,我们以记号CG(S)表示{gG|gs=sg,sS},称为S中心化子↩︎

  12. 也可以定义右正则表示α:GSym(G)g(aag1)↩︎

  13. 称它为诱导表示,是因为它实际上是IndHGV0=gG/HgV0,其中V0H的一维平凡表示。↩︎

  14. Zorn引理是指:如果带有偏序的集合S上的任意升链都在S中有上界,那么S存在极大元。该引理是集合论的结果,等价于选择公理。这里包含I的任意理想的升链I1I2的上界是理想的并i=1Ii,容易证明它也是一个理想因此属于S从而可以用Zorn引理。↩︎