最小作用量原理(principle of least action)是物理学中描述客观事物规律的一种方法。即从一个角度比较客体一切可能的运动(经历),认为客体的实际运动(经历)可以由作用量求极值得出,即作用量最小的那个经历。公元40年,希腊工程师(Hero)提出了光的最短路程原理,是最小作用量原理的早期表述,到中世纪,最小作用量原理思想被更多的人所接受。

中文名

最小作用量原理

外文名

least action principle

别称

平稳作用量原理

所属学科

物理学

属性

描述客观事物规律的一种方法

概述

最小作用量原理

作为研究光线的反射和折射的结果,费尔马曾得出这样的结论:“自然界总是通过最短的途径发生作用的。”此后,莫培督在其1744年的一片著名论文中宣布了一个原理,他称之为“最小作用量原理。”他用这样几句话说明了这个原理:“自然界总是通过最简单的方法产生起作用的。如果一个物体必须没有任何阻碍地从这一点到另一点——自然界就利用最短的途径和最快的速度来引导它。”(原先也一直不能并存的自然界各种规律现在就一致起来了。《科学院的报告》,1744年4月15日,第421页)简单地说这意味着任何不受费尔马

影响的动力学系统在发生变化时,其变化方式总是使有关的作用量为最小。在对物理实在(现象)的观察中,科学家们相信,对于不同的观察者物理实在可以不同,但其物理实在的结构(规律)必定是相同的。物理学中描述物理实在结构的方法之一就是作用量方法。这种方法从功能角度去考察和比较客体一切可能的运动(经历),认为客体的实际运动(经历)可以由作用量求极值得出,是其中作用量最小的那个。这个原理称为最小作用量原理。

物理学中最小作用量原理(英语:least action principle),或更精确地,平稳作用量原理(英语:stationary action principle),是一种变分原理,当应用于一个机械系统的作用量时,可以得到此机械系统的运动方程。这原理的研究引导出经典力学的拉格朗日表述和哈密顿表述的发展。卡尔·雅可比特称最小作用量原理为分析力学之母。

在现代物理学里,这原理非常重要,在相对论、量子力学、量子场论里,都有广泛的用途。在现代数学里,这原理是莫尔斯理论的研究焦点。本篇文章主要是在阐述最小作用量原理的历史发展。关于数学描述、推导和实用方法,请参阅条目作用量。最小作用量原理有很多种例子,主要的例子是莫佩尔蒂原理(Maupertuis' principle)和哈密顿原理。

在最小作用量原理之前,有很多类似的点子出现于测量学和光学。古埃及的拉绳测量者(rope stretcher)在测量两点之间的距离时,会将固定于这两点的绳索拉紧,这样,可以使间隔距离减少至最低值。托勒密在他的著作《地理学指南》(Geographia)第一册第二章里强调,测量者必须对于直线路线的误差做出适当的修正。古希腊数学家欧几里得在《反射光学》(Catoptrica)里表明,将光线照射于镜子,则光线的反射路径的入射角等于反射角。稍后,亚历山大的希罗证明这路径的长度是最短的。

原理简介

动力学中的一个变分原理。由保守系统的动力方程可以导出这个原理,也可自这原理导出动力方程。这原理可表述为:对于定常保守系统,作用量Tdt的积分的全变分为零。即

(1)

式中T为动能;t为时间;Δ为全变分记号。Δ与变分记号δ不同之处是:

,而

。将Δ与δ施于同一变量时,有关系式:

因此Δ和δ两符号有关系式:。

最小作用量原理还可详述为:对于定常保守系统,在广义坐标qi和时间t的联合空间

里,对于机械能E保持不变(即

)的各条路径中,如果路径的端点(包括始点和终点)的全变分为零,则积分对于真实运动的路径和邻近的旁路比较,真实路径的积分是驻值。在一般实际情况中,式(1)确定的积分

为极小值,最小作用量原理即由此得名。

对于一个质点,

,因此式(1)成为

上式是1744年由P.-L.M.de马保梯最先提出的一个最小作用量原理。他研究这个问题的目的是想配合光学中的费马原则,说明光是一种高速运动着的微粒。L.-V.德布罗意和E.薛定谔等所创立的波动力学(现在都称它为量子力学)也受到力学中的最小作用量原理和光学中的费马原理的许多类似之处的启发。后来L.欧拉证明这原理对于一个质点在有心力场中的运动也是成立的。J.-L.拉格朗日把这原理推广到N个自由度的保守系统并给予严格证明,所以这原理称为马保梯-拉格朗日最小作用量原理。

最小作用量原理与哈密顿原理的相同点是:①两者都是作用量的积分的变分原理,对时间不长的运动,两者都是极小值;②两者都是在多维空间

中真实路线积分与旁路线积分的比较;③这两个原理在所设条件下与保守系统的动力方程等效,三者可互相推导。最小作用量原理与哈密顿原理的不同点是:①哈密顿原理以

为作用量,L为动势,最小作用量原理以为作用量;②哈密顿原理的始点和终点在多维空间

中为两定点,变分为等时的,即

,最小作用量原理的始点q0和终点q1的全变分为零。即

,且机械能E在各条路线上相同,即

。两种作用量有关系式:

式中H为哈密顿函数。

数学描述

费 德布罗意

principle of least action机械能守恒系统[1]在位形空间真实轨道上运动时所遵循的一个基本原理。二倍动能T对时间dt的积分称为拉格朗日作用量2Tdt。在N维位形空间

中,表示点沿着具有相同机械能的端点的真实路径上的作用量和沿邻近的可能路径上的作用量比较,沿真实路径的作用量取驻值(包括极值)。考虑在N维q空间自始点

出发的两条运动的真实路径,这两条路径是相邻的,只是出发的方向略有不同。这两条路径除A外可能还有其他交点,若B是靠近A的第一个交点(见图)。当两条路径的出发方向趋于一致时,B的极限点称为动焦点。当代表点的路径长超过时,作用量积分既非极小也非极大。长度不超过始点和第一个动焦点之间的路径长时,真实路径的作用量是极小值。拉格朗日作用量

同哈密顿作用量

(见哈密顿原理)的关系式为

,H为哈密顿函数。在空间运动的质点的作用量为

。于是质点运动的最小作用量原理可用变分表示为

上式是莫培督在1744年提出来的最小作用量原理的表示式。他是受到17世纪时期所建立的

马原理启发,用微粒说来解释光在空间的行进规律。L.欧拉认为这个原理很有价值,在1744年用力学方法证明它在辏力场中成立。对质点系的最小作用量原理的证明是J.L.拉格朗日在1760年得出的。在物理学上,微粒和波动的对偶关系是L.V.德布罗意在1923年提出物质波后,再经过C.J.戴维孙和L.H.革末于

年的实验所证实,才得到公认的。德布罗意就是在费马原理和最小作用量原理的启发下发展了物质波理论。

近代发展

莫佩尔蒂

莫佩尔蒂于1744年发表了最小作用量原理。这原理阐明,对于所有的自然现象,作用量趋向于最小值。他定义作用量为物体的质量,移动距离,与移动速度的乘积。   1741年,莫佩尔蒂在巴黎科学院发表了一篇论文,"Loi du repos des corps",(静止物体定律)。他表明,在一个系统里,所有呈静止状态的物体,假若有任何变化,产生的运动,趋向于作用量的最小改变。在另一篇于1744年,在巴黎科学院发表的论文中,他提出了"Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles"(几种以前互不相容的自然定律的合一论):光折射的路径,从一种介质到另一种介质,是作用量的最小值。1746年,莫佩尔蒂更进一步地在伯林科学院发表了论文,"Loix du mouvement et du repos"(运动与静止定律)。他表明,质点的运动也趋向于最小作用量。为了便于分析,物体的全部质量可以被视为集中于一点,称这一点为质点。在十八世纪前期,关于质点经碰撞后的可能发生状况,有很大的争论。笛卡儿派与牛顿派物理学家认为,在碰撞下,几个质点的总动量与相对速度是恒定的。莱布尼茨派则认为活力(vis viva)也莫佩尔蒂

是恒定的。由于两个原因,这论点是笛卡儿派与牛顿派无法接受的:1.活力恒定不能应用于硬物体(不能压缩的物体)。2.活力的数学定义是质量与速度平方的乘积。为什么速度在活力这数量里出现两次?莱布尼茨派辩明,理由很简单,任何物质对于运动都有一种自然的趋向。在静止状态,物体里含有一个内在的速度。当物体开始移动时,对应于实际的运动,又产生了第二个速度项目。笛卡儿派与牛顿派则认为这辩理简直是胡言。对于中古学者,运动的内在趋向这句话,具有一种奥秘的性质;这中古学者的偏爱,必须毫无反顾地抗拒。今天,硬物体的概念已被完全地否定了。至于质量与速度平方的乘积,这数量则是动能的两倍。现代力学给予了活力一个很重要的角色。对于莫佩尔蒂而言,硬物体的概念是很重要的。他提出的最小作用量原理有一个很特别的优点:这原理可以应用于硬物体与弹性物体。又可以应用于静止状态的物体与光,似乎,这原理可以广泛的应用于宇宙的每一个角落。莫佩尔蒂又从宇宙论的观点来论述:最小作用量好像一个经济原理;在经济学里,大概就是精省资源的意思。这论述的瑕疵是,并没有任何理由,能够解释,为什么作用量趋向最小值,而不是最大值。事实上,莱布尼茨证明过,在大自然现象中,这物理量有可能趋向最小值,也有同样的可能趋向最大值。假若,我们解释最小作用量为大自然的精省资源,那么,我们又怎么解释最大作用量呢?在量子力学的发展中,作用量的不连续性不以其最初的假定方式保持下来。这种不连续性使解释量子力学的数量关系成为可能,但却没有去找这种解释。这样,不连续性就以终极概念的身份出现了。作用量不连续在日后推广为相对论的量子论中可以得到因果性的解释。看来这种推广的尝试对作用量概念本身带来某些新的认识,就像时空网格数的概念那样,用普朗克常数去除作用量的表象没有被排除,嬗变过程就在此网格中发生,在宏观的近似中网格可以作为自身同一的基本粒子的世界线而加以研究。此时世界线的概率就同爱丁顿所说的那种数量关系的作用量联系在一起,于是最小作用量原理就成为最大概率原理。1819年,高斯在题为《论新的力学普遍原理》一书中,提出了作为更为普遍原理的结论,无摩擦的约束系统在任意力作用下将这样运动:来自约束的对系统的拘束和施加于约束上的压力均取极小值。高斯用以下方式阐述了他的最小拘束原理。“倘若质点是自由的,那么对以任何方式联系起来的,受任意影响的质点系来说,它在每一时刻的运动都要完全或只是有可能完全依照这些质点本来就有的方式进行活动,也就是说运动要以尽可能小的拘束进行。如果在无限小的瞬间,对每一质点的质量和该质点现在的位置的偏离量的平方之积取和,这个和则可作为对拘束的量度高斯观念的发展是1892——1893年赫兹提出的最直路径原理。这个原理同时延续了雅考毕的思路,即对全部变分原理和动力学加以几何化。这一问题在众所周知,赫兹不用力的概念而要建立起力学的尝试中得到阐明。这个尝试是在《力学原理》这本书上讲的(1892)。[罗素的某些看法。根据质量和能量的相对论的数量关系,罗素推出把质量和时间之积当成作用量的可能性。但是,引力质量还有与其相等的惯性质量可以由距离代表,这时作用量就是长度和时间的乘积了。用这种观点来看待普朗克常量,罗素说:要是把作用量取作物理学的基本概念,我们或许能建立起来全是原子论的,极适于检验的物理学。罗素接着指出:相对论中时间空间间隔的不变性和作用量的意义(即在微观世界中的作用量)之间的联系是意味深长的。与上述类似的一些设想并不能引起物理知识的实际的进展,不过却很值得提出来,因为此后推广量子力学时要用作用量来表征近代物理的特征和风格。

折射理论

于1744年,在巴黎科学院发表的一篇论文《几种以前互不相容的自然定律的合一论》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩尔蒂提出,光折射的路径,从一种介质到另一种介质,是作用量的最小值。按照这论点,如前图,假设光线从折射率为的介质1折射于折射率为介质2,则作用量为

其中,是光线的质量。虽然光线并没有质量,这变量对于结果没有任何影响,可以被忽略。

取作用量对于变量的导数,设定为零,经过一些运算,可以得到。

请注意,这结果与牛顿的光粒子理论相符合;但是,与费马得到的结果南辕北辙,大不相同。

欧拉的表述

1744年,莱昂哈德·欧拉在论文《寻找具有极大值或极小值性质的曲线,等周问题的最广义解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)里,以非常清楚的字句,给出最小作用量原理的定义:

设定一个质量为M,速度为v的粒子移动无穷小距离ds。这粒子的动量为Mv,当乘以无穷小距离时,会给出ds,粒子的动量积分于无穷小距离ds。现在,我宣明,这移动粒子的真实轨道(在所有连结两个端点的可能轨道之中)是为最小值的轨道,或者,假定质量是个常数,是为最小值的轨道。

如同欧拉所写,是动量积分于移动路径。采用现代术语,这积分等于简略作用量;其中,p是广义动量,q是广义坐标。因此,在同一年,稍微比莫佩尔蒂晚一点,欧拉独立地发表了,与莫佩尔蒂的理论等同的,关于变分原理的理论。欧拉并没有争夺优先荣誉。

直线运动

假设没有任何作用力施加于这粒子,则这粒子以均匀速度移动:

只有在轨道长度s为最小值时,才能得到作用量最小值。这轨道是一条直线。

抛物线运动

假设这移动于二维空间的粒子感受到均匀重力,则根据活力定律(principle of vis viva),

其中,v是瞬时速度,v0是最初速度,y是粒子朝着y-轴移动的距离,g是加速度常数。

将这方程代入作用量:

,求作用量的稳定值,应用变分法,可以得到欧拉-拉格朗日方程:

其中,

是积分常数。重新编排,可以得到

将这方程积分,

其中,

是积分常数。

假设粒子的初始位置为

,初始速度为,则

重新编排,可以看出这是抛物线方程:

欧拉又将这结果推广至一群粒子。他认为最小作用原理所以正确,是因为粒子的惯性试着阻抗任何关于状态的改变,自由粒子会选择遵循影响最小的作用力。

表观目的论

微分运动方程数学等价于其对应的积分运动方程,这具有很重要的哲学意义。微分方程描述局部于空间的一点或单独时间的片刻。举例而言,牛顿第二定律解释为瞬时作用力F施加于质量为m的粒子会造成瞬时加速度为a的运动。明显对比地,作用量原理不会局部于一点,而牵涉到积分于一段时间间隔或一个空间的局域。更重要地,通常在经典作用量原理的表述里,系统的初始状态和终结状态是固定不变的,也就是说,

设定一个移动粒子开始于位置x1、时间t1,结束于位置x2、时间t2,连接这两个端点的物理轨道是作用量积分的平稳值。

特别地针对这程序,终结状态的固定动作似乎额外地赋予了作用量原理一些目的论的特色。在物理学史里,这特色不经意地制造出很多激烈的争论。

应用

相对论运用时空事件的四维世界把最小作用量原理解释为能够从可能的世界线中挑选出实际的世界线的原理。在这种情况下相对论并没有给最小作用原理添加进新的物理内容。这种物理内容可以为量子物理所引入。只有作出某种把相对论和微观世界联系在一起的解释的情况下,根据更为一般的设想,相对论或许有“推出”最小作用原理的可能。在建立广义相对论时爱因斯坦用过最小作用原理。此时作用量的概念得到某些新的解释。如所周知,在决定空间和时间的曲率时借助于四个恒等式,并且力求排除表征空间时间特性但不表征曲率的多余的参量。这些恒等式按其物理意义而言表示不同坐标系中空间和时间曲率的同一性,曲率张量取决于能量冲量张量。在研究此问题时,爱因斯坦指出,上述四个恒等式有物理意义,也就是具有守恒定律的意义,并且表示了空间时间的特性。然而,现在当我们谈能量冲量张量时,空间的首要特性,即其均匀性对应于冲量分量守恒;而时间的均匀性对应于能量守恒。这样,守恒定律就对应于曲率张量之间恒等的数量关系,作为与这种或那种坐标表示无关的物理特性的曲率对应于作用量。爱丁顿提出在广义相对论中对作用量这一概念意义的极为精细、深刻的说法。他指出:对时空连续统而言,作用量扮演着类似于能量在空间关系上所扮演的角色。在四维世界里,作用量是曲率的量度,即决定质点运动的四维连续统的基本特性的量度。我们顺便指出:在叙述魏尔的统一场论时爱丁顿曾顺带提到对作用量的一种很有益的解释。爱丁顿说,可能作用量就是概率的函数,然而当把一些概率连乘,则作用量就相加,从而作用量可以认为是概率的对数。由于概率的对数是负数,所以作用量就要看成是概率的对数再加上负号,此时最小作用原理则表示实际实现的运动的最大概率。

在现代量子力学中最小作用量原理起着重要作用。不但如此,对于作用量概念的思考也激起对现存理论进行总结的尝试。表征微观世界之基本量,即作用量子和引入到宏观力学的基本数量关系中的量,即由能量按时间积分,这两个量的量纲一致,促使近代理论家在一系列设想上尽管没有引出什么具体的物理理论,但是却引出一些看来是很有前途的物理理论。