前言
本学期选修了中国科学院大学开设的表面与界面的统计热力学,正好好久没写博客了,干脆把note放博客上面,笔记写的很乱,可能不严谨,一堆笔误之类的,凑合看
表界面热力学理论框架
该课程的理论主要包含四部分,分别是预备知识、 界面张力及涨落不稳定性、界面的浸润现象和界面相互作用。其中预备知识包含基本的热力学和统计物理知识,并会介绍部分微分几何知识(只包含经典微分几何,不含黎曼几何),第二部分主要关注瑞利-普拉托不稳定性;第三部分关注多相界面,第四部分主要讲述DLVO theory
第一章 预备知识
该部分主要介绍基本的热力学和统计物理,以及后续会用到的部分微分几何知识
热力学基础回顾
热力学定律是物理学中描述能量转换和热力学过程的基本原理,众所周知,当我们提到热力学时,通常会谈到热力学四大定律,它们分别是:
热力学第0定律:若两个热力学系统均与第三个系统处于热平衡状态,此两个系统也必互相处于热平衡;考虑三个热力学系统1、2、3;若系统1和3处于热平衡状态,即T_1=T_3;系统2和系统3也处于热平衡状态,即T_2=T_3,那么系统1和系统2也处于热平衡状态,即T_1=T_2;热力学第0定律揭示了热平衡的递移性,从而为温度的定义和测量提供了理论基础
热力学第1定律:该定律是能量守恒定律对非孤立系统的扩展,其可以写成:
\displaystyle dU=dW+dQ
这里我们均选取指向系统的方向为正方向,便于后续统一分析(即dW代表外界对系统做的功,dQ代表外界传入系统的热量)
热力学第2定律:该定律有克劳修斯表述和开尔文表述,为定量描述热力学第二定律,克劳修斯引入“熵”这一状态函数。其核心特征是:熵是广延量,仅由系统的平衡态决定,与过程无关。基于熵的定义,热力学第二定律可通过 “熵增原理” 转化为数学关系:
\displaystyle \Delta S \geq \frac{\Delta Q}{T}
移项得\Delta S-\frac{\Delta Q}{T}\geq0,将不等式左边定义为\Delta S^{tot},其中\Delta S^{tot}=\Delta S^{sys}+\Delta S^{res},sys代表系统,res代表热浴,其中\Delta S^{sys}=\Delta S,\Delta S^{res}=-\frac{\Delta Q}{T}。其中不等式中的等于符号取在平衡态,可用于作为非平衡的判据
结合第1与第2定律,进行移项\Delta W=\Delta U-\Delta Q,之后利用\Delta W=\Delta U-T\Delta S+T\Delta S-\Delta Q,可以得到最大功原理,可以发现\Delta U-T\Delta S即为\Delta F,而后面部分其实就是T\Delta S^{tot},故而有\Delta W=\Delta F+T\Delta S^{tot},而第二定律又给出了这个表达式的边界,因此有\Delta W\geq \Delta F,改写成-\Delta W\leq -\Delta F,也就给出了最大功原理(亥姆霍兹自由能最小原理)
上述热力学第2定律还可以通过涨落定理导出,或者说涨落定理是热力学第2定律的统计证明(知乎上说的),由Crooks涨落定理:
\displaystyle <e^{-\Delta s^{tot}}>=1
此处\Delta s无量纲,玻尔兹曼常数取k_B=1,利用琴生不等式(对于凸函数,有<e^{x}>\geq e^{< x >}),可知<e^{-\Delta s^{tot}}>\geq e^{-< \Delta s^{tot} >},即1 \geq e^{-< \Delta s^{tot} >},由于<\Delta s^{tot}>=\Delta S^{tot},故得\Delta S^{tot}\geq0 (注意区分小s与大S,小s代表远离平衡位置的随机熵,大S则是总的熵)
同理,最大功原理可以通过Jarzynski equality导出,Jarzynski equality即:
\displaystyle <e^{-w}>=e^{-\Delta F}
根据上面类似的操作,容易得到e^{-\Delta F}\geq e^{-< w >},最后得到-\Delta W\leq -\Delta F
热力学第3定律:绝对零度不可达到
上面主要关注热力学第2定律及熵增定律,因为\Delta S^{tot}也即指明了熵产生,而\Delta S-\frac{\Delta Q}{T}\geq0则定义了平衡态,用于作为平衡态与非平衡态的判据。而对于自由能,直译便是“自由的能量”,中译中即热力学自由能可以用于对外做功,自由能是系统的内能减去不能用于做功的能量,因为前面提到了熵产生,并不是所有内能都可用于做功:
\displaystyle \begin{cases}
F=U-TS\\
T=\frac{\partial U}{\partial S}
\end{cases}
这也和前面提到的最大功原理-\Delta W\leq -\Delta F联系起来了
Legendre变换
经典热力学的目标是描述宏观性质的平均行为,而不是每个粒子或自由度的微观细节。需要注意,这里的Legendre变换是一个平衡态里才有的概念。考虑一个系统sys(S,V,N),其中S是熵,V是体积,N是粒子数;可以得到热力学第二定律:
\displaystyle
\begin{cases}
dU=TdS-PdV+\mu dN\\
(\frac{\partial U}{\partial S})_{V,N}\equiv T, (\frac{\partial U}{\partial V})_{S,N}\equiv -P,(\frac{\partial U}{\partial N})_{S,V}\equiv \mu
\end{cases}
当然这并非唯一的选择,由于熵难以测量,我们更希望用T作为变量而非S,因此我们可以做下面的操作:
\displaystyle \begin{cases}
d[U-TS] = -SdT - PdV + \mu dN = F(T,V,N)\\
T = \left( \frac{\partial U}{\partial S} \right)_{V,N}
\end{cases}
以此来得到F(T,V,N),同理类推你可以把V用类似的操作替换成P,把N替换成\mu等,但是这些热力学变量并不是相互独立的,譬如你利用d[U-TS+PV-\mu N]=-SdT+VdP-Nd\mu,你会发现你得到了Gibbs-Duhem equation,也就是说上面那一堆是等于0的,d[U-TS+PV-\mu N]=-SdT+VdP-Nd\mu=0,一种说法是宏观热力学是具有广延性的,而T,P,\mu都是强度量,S,V,N才是广延量。证明这个需要利用一个热力学势函数的性质,即热力学势函数都是欧拉一阶齐次函数
欧拉n阶齐次函数是指:
\displaystyle f(\lambda x_1,\lambda x_2,\cdots,\lambda x_N)=\lambda^n f(x_1,x_2,\cdots,x_N)
其具有这样的性质:
\displaystyle nf(x_1,x_2,\cdots,x_N)=\sum_{i=1}^{N} x_i\frac{\partial f}{\partial x_i}
证明过程只需要对其定义式两边对\lambda做偏导即可:
\displaystyle \sum_{i=1}^{N}\frac{\partial f}{\partial (\lambda x_i)}\frac{\partial (\lambda x_i)}{\partial \lambda}=n\lambda^{n-1}f(x_1,x_2,\cdots,x_N)
此时令\lambda=1即得到nf(x_1,x_2,\cdots,x_N)=\sum_{i=1}^{N} x_i\frac{\partial f}{\partial x_i}
回到我们先前讨论的Gibbs-Duhem equation上来,U(S,V,N)=\frac{\partial U}{\partial S}S+\frac{\partial U}{\partial V}V+\frac{\partial U}{\partial N}N=TS-PV+\mu N,自然而然的有d[U-TS+PV-\mu N]=0,也即证明了Gibbs-Duhem equation
需要注意的是这是一个对于宏观热力学系统才成立的方程,对于纳米系统如分子层次的微小结构,此时不可使用该定律,方程右边可能不为0,因为此时的热力学势函数可能不再是欧拉一阶齐次函数
统计力学基础
统计力学是理论物理的一个大分支,它利用概率论和统计学的方法来研究由大量粒子组成的宏观系统;由于该部分的讲述针对完全未学过统计力学的学生,没从Boltzmann那一套讲法出发,于是这部分直接copy上课板书
首先,在统计力学中,我们引入状态变量(state variable),状态变量是指在动态系统中,可以描述系统数学状态的一组变量,它应能确定系统未来的演化行为,这里我们记状态变量为\omega(t)
有了状态变量后,我们就有了概率,写为p(\omega)d\omega,其中p(\omega)是概率密度函数,在全空间中,应当有\int p(\omega)d\omega=1,之后我们有可观察量(某一个具体的物理量):A(\omega),则其平均值< A >=\int A(\omega)p(\omega)d\omega,其实这就是统计力学的核心,定义状态变量,获得概率密度函数,然后拿去算你需要算的物理量
我们落实到具体的physical quantities来讲,在一个孤立的系统中,哈密顿量通常代表系统的内能,即<\hat{H}(\omega)>=U,注意,这里的\hat{H}并非哈密顿算子,只是写成这样方便区分,根据玻尔兹曼熵公式有S=<-k_B\log{p(\omega)}>,这里的\log其实是\ln,为了和板书一致我就没有更改。这里的S便是Gibbs-Shannon entropy,而\hat{s}=-k_B\log{p(\omega)}则是Stochastic entropy
接着有F=U-TS=<\hat{H}(\omega)>+k_BT<\log{p(\omega)}>=<\hat{H}(\omega)+k_BT\log{p(\omega)}>
这一堆东西还可以写成<\hat{f}(\omega)>,其中\hat{f}(\omega)=\hat{H}(\omega)+k_BT\log{p(\omega)}=\hat{H}(\omega)-T\hat{s}(\omega),又称Stochastic free energy
接着讲了Free energy(non-equilibrium),其可以根据下面的公式进行计算:
\displaystyle F=\int d\omega p(\omega)[\beta \hat{H}(\omega)+\log{p(\omega)}]k_BT\\
=k_BT\int d\omega p(\omega)\log\frac{p(\omega)}{\frac{1}{Z}e^{-\beta\hat{H}(\omega)}}-k_BT\log{Z}\\
=k_BT\int d\omega p(\omega)\log{\frac{p(\omega)}{p_s(\omega)}}-k_BT\log{Z}\\
=k_BTD_{KL}(p(\omega)//p_s(\omega))-k_BT\log{Z}
其中\beta=\frac{1}{k_BT},另外有Z=\int d\omega e^{-\beta\hat{H}(\omega)},并且\frac{1}{Z}e^{-\beta\hat{H}(\omega)}=p_s(\omega),且\int d\omega p_s(\omega)=1
而D_{KL}是Kullback-Leibler Divergence,也可以叫Relative entropy,其具体定义为,给定两个概率密度函数PDF,p_1(\omega)和p_2(\omega),其相对熵可以写成:
\displaystyle D_{KL}(p_1(\omega)//p_2(\omega))=<\log{\frac{p_1(\omega)}{p_2(\omega)}}>_{p_1(\omega)}\\
=\int d\omega p_1(\omega)\log{\frac{p_1(\omega)}{p_2(\omega)}}
下标处的p_1(\omega)代表以p_1作为概率测度。最后自由能可以写成:
\displaystyle F-(-k_BT\log{Z})=D_{KL}(p(\omega)//p_s(\omega))
其中F_{eq}=(-k_BT\log{Z})为平衡态自由能,而D_{KL}(p(\omega)//p_s(\omega))为凸函数,且D_{KL}(p(\omega)//p_s(\omega))\geq0
接下来先review一下之前的东西,上次我们说到对于Nano system,宏观的系统广延性可能会丢失,然后我们接着开启了统计力学的部分
对于统计力学,首先第一步是确定状态变量,这里举两个例子,经典:相空间中的任意一点;量子:波函数。需要注意的是,状态空间有连续和离散两种区别,需要分别处理
在给定状态变量\omega后,我们就有了Probability:
\displaystyle p(\omega)=\begin{cases}
probability,discrete \ space\\
probability \ density \ function,continuous \ space
\end{cases}
此处可以看出,若是连续空间,那此时某一点的p(\omega)=0,是无意义的
之后给定一个可观测量:<\hat{A}(\omega)>,那么显然对于随机变量\hat{A}(\omega)有:
\displaystyle <\hat{A}(\omega)>=\begin{cases}
\sum_{\omega}p(\omega)\hat{A}(\omega),discrete\\
\int d\omega p(\omega)\hat{A}(\omega),continuous
\end{cases}
再次回到具体的physical quantities上来,在一个孤立的系统中,哈密顿量通常代表系统的内能,即<\hat{H}(\omega)>=U,熵则可以写成S=<\hat{s}(\omega)>,其中\hat{s}是stochastic entropy,有\hat{s}=-k_B\log{p(\omega)}
这里对\hat{s}做一点额外的解释,熵是信息的度量,一个事件发生的概率越小则其所蕴含的信息量越大,具体写为:
\displaystyle \hat{s}=-k_B\log p(\omega)=k_B\log{\frac{1}{p(\omega)}}
显然有p(\omega)越小,\hat{s}越大,而对于玻尔兹曼熵变,则有:
\displaystyle S_{Boltzmann}=k_B\log{W}=k_B\log{\frac{1}{\frac{1}{W}}}
其中\frac{1}{W}=p,如果一个微观状态的概率很小,意味着该状态越不常见,系统越可能处于其他状态,这增加了系统的混乱程度,因此熵就越大。反之,如果一个微观状态的概率很大,意味着该状态越常见,系统越可能稳定地处于该状态,熵就越小。比如离散的情况下:
\displaystyle <k_B\log{W}>_p=\sum_{\omega}p(\omega)k_B\log{W}
此外,关于为什么熵公式中含有\log函数,我们进行了如下的讨论:用语言解释即是熵的广延性(可加性);在物理上,我们先令S=k_Bf(\omega),其中f(\omega)是一个未知的函数,此时考虑一个系统sys,其具有微观状态数W,此时将该系统沿着中间切成两半,分成系统1和系统2,并分别具有微观状态数W_1和W_2,二者只在界面处有交换,令该热力学系统为无穷大,此时交换可以忽略,那么二者的微观状态数应该满足:
\displaystyle W_{sys}=W_1\cdot W_2
而熵应该满足:
\displaystyle S_{sys}=S_1+S_2
而只有\log函数具有这样的性质,因为:
\displaystyle S_{sys}=S_{1+2}=k_B\log{W}=k_B\log{W_1W_2}\\
=k_B\log{W_1}+k_B\log{W_2}=S_1+S_2
接着是自由能F=U-TS,stochastic free energy可以写成\hat{f}(\omega)=\hat{H}(\omega)-T\hat{s}(\omega),然后有:
\displaystyle F=<\hat{f}(\omega)>=<\hat{H}(\omega)-T\hat{s}(\omega)>
还可以写成:
\displaystyle F=k_BTD_{KL}(p(\omega)//p_s(\omega))+F_{eq}
其中F_{eq}=-k_BT\log{Z},为平衡态自由能,Z为配分函数,Z=\int d\omega e^{-\beta \hat{H}(\omega)},并且有:
\displaystyle D_{KL}(p(\omega)//p_s(\omega))=\int d\omega p(\omega)\log{\frac{p(\omega)}{p_{s}(\omega)}}
而p_s(\omega)=\frac{1}{Z}e^{-\beta\hat{H}(\omega)},也即Gibbs-Boltzmann probability
KL散度
前面我们提到过:
\displaystyle k_BTD_{KL}(p(\omega)//p_s(\omega))=F-F_{eq}
接着详细讨论一下KL散度,KL散度还具有一些别的性质,比如非负性,即:
\displaystyle D_{KL}(p(\omega)//p_s(\omega))\geq 0
若我们把F写成p(\omega)的泛函,则有F[p(\omega)]-F_{eq}=D_{KL}(p(\omega)//p_{eq}),认真观察一下可以发现我们得到了热力学中的极小原理:最小自由能原理。我们进行简单的证明,首先,D_{KL}是凸函数,我们将其按照数学定义写为:
\displaystyle D_{KL}(p(\omega)//p_{eq}(\omega))=\mathbb{E}^{p(\omega)}[\log{\frac{p(\omega)}{p_{eq}(\omega)}}]\\
= \mathbb{E}^{p(\omega)}[-\log{\frac{p_{eq}(\omega)}{p(\omega)}}]
其中\mathbb{E}代表数学期望,上标代表以p(\omega)为概率测度。由于-\log{x}是凸函数,因此我们利用琴生不等式,有:
\displaystyle \mathbb{E}[-\log{x}]\geq -\log{\mathbb{E}(x)}
进而可以得到:
\displaystyle \mathbb{E}^{p(\omega)}[-\log{\frac{p_{eq}(\omega)}{p(\omega)}}]\geq -\log{\mathbb{E}^{p(\omega)}[\frac{p_{eq}(\omega)}{p(\omega)}]}
其中等于号取在:
\displaystyle -\log{\int d\omega p(\omega)\frac{p_{eq}(\omega)}{p(\omega)}}=-\log{\int d\omega p_{eq}(\omega)}=0
这里利用了\int d\omega p_{eq}(\omega)=1,这也就说明了,无论系统从哪一个态出发,最后会演化到唯一的平衡态,这里其实还引出了Lyapunov function,不过此处不再进行深入讨论了
动力学
接下来我们研究系统的动力学,即系统从非平衡态到稳态(Steady state)的过程。考虑一个具有遍历性(Ergodicity)的系统,我们需要概率p(\omega,t)的演化方程,其中该系统全概率守恒,即:
\displaystyle \sum_{\omega}p(\omega,t)=1
而所谓遍历性,在数学中指动力系统的一种性质,它表明系统在长时间内可以访问其状态空间的任意一部分,表现为系统性质的不变性。接下来我们引入主方程:
\displaystyle \frac{d}{dt}p_{\omega}(t)=\sum_{\omega'}W_{\omega\omega'}p_{\omega'}(t)
这里假设系统的未来发展仅取决于其当前状态,而不是其过去的历史,即做了马尔可夫近似,另外为了简单我们仅考虑了离散的情形,方程中W_{\omega\omega'}是转移速率矩阵,给定时间t,系统由\omega'态演化到\omega态,这其中,由于\sum_{\omega}p(\omega,t)=1,因此对于任意p_{\omega'}(t),可以得到:
\displaystyle\frac{d}{dt}\sum_{\omega}p_{\omega}(t)=\sum_{\omega'}(\sum_{\omega}W_{\omega\omega'})p_{\omega'}(t)=0
显然有\sum_{\omega}W_{\omega\omega'}=0,这说明了该转移速率矩阵在任一列的加和为0,继续写即:
\displaystyle W_{\omega'\omega'}+\sum_{\omega\neq\omega'}W_{\omega\omega'}=0
最后有W_{\omega'\omega'}=-\sum_{\omega\neq\omega'}W_{\omega\omega'},也即该矩阵的任意一个对角元等于负的该列其他元素的和。物理上,这表示对于任意状态\omega',其概率流失速率(由对角元W_{\omega'\omega'}描述)在数值上等于从该状态转移到所有其他状态的总速率(由非对角元之和\sum_{\omega\neq\omega'}W_{\omega\omega'}给出)
主方程的解的形式为:
\displaystyle p_{\omega}(t)=\sum_{\lambda}C_{\lambda}e^{-\lambda t}\phi_{\lambda}(\omega)
其中\lambda为特征值且\lambda >0,\phi_{\lambda}(\omega)对应特征值\lambda的特征函数,而C_{\lambda}为展开系数,继续推导还可以得到:
\displaystyle \sum_{\omega'}W_{\omega\omega'}\phi_{\lambda}(\omega')=-\lambda\phi_{\lambda}(\omega)
这里如果我们考虑具体的例子,比如考虑\omega代表位置,即\omega\rightarrow\vec{x},则对于连续情况,我们有:
\displaystyle \frac{\partial}{\partial t}p(\vec{x},t)=-\nabla\cdot\vec{J}(\vec{x},t)
其中流矢量写成:
\displaystyle\vec{J}(\vec{x},t)=-D\nabla p(\vec{x},t)+\vec{u}(\vec{x},t)p(\vec{x},t)
如果只看流矢量的第一部分,就得到了扩散方程,或者说Fick定律,这部分也称为扩散流,D为扩散系数。而流矢量的第二部分为漂移流,两部分一起考虑,就得到了Fokker–Planck equation,为了研究Local velocity,我们把流矢量写成:
\displaystyle\vec{J}(\vec{x},t)=p(\vec{x},t)\vec{\gamma}(\vec{x},t)\\
=p(\vec{x},t)[\vec{u}(\vec{x},t)-D\frac{1}{p(\vec{x},t)}\nabla p(\vec{x},t)]\\
=p(\vec{x},t)[\vec{u}(\vec{x},t)-D\nabla\log{p(\vec{x},t)}]
因此有:
\displaystyle\vec{\gamma}(\vec{x},t)=\vec{u}(\vec{x},t)-D\nabla\log{p(\vec{x},t)}
若\vec{u}(\vec{x},t)不含时,即\vec{u}(\vec{x},t)=\vec{u}(\vec{x}),我们可以把它写成\vec{u}(\vec{x})=\kappa\vec{f}(\vec{x})=-\kappa\nabla\hat{H}(\vec{x})的形式,其中\vec{f}=-\nabla\hat{H}(\vec{x}),\kappa为迁移率
继续推导我们有:
\displaystyle \vec{\gamma}(\vec{x},t)=-\kappa\nabla\hat{H}(\vec{x})-D\nabla\log{p(\vec{x},t)}\\
=-\kappa\nabla[\hat{H}(\vec{x})+\frac{D}{\kappa}\log{p(\vec{x},t)}]
此时若令D=k_BT\kappa=\frac{k_BT}{\xi},其中\xi=\kappa^{-1},则我们可以得到爱因斯坦关系(Einstein relation)如下:
\displaystyle D=-\kappa\nabla[\hat{H}(\vec{x})+k_BT\log{p(\vec{x},t)}]\\
=-\kappa\nabla\hat{f}(\vec{x},t)
\hat{f}即前面提到的Stochastic free energy,其中D为扩散系数,而\xi为摩擦系数,得到爱因斯坦关系的前提要求是t\rightarrow\infty并且\vec{\gamma}(\vec{x},t)=0,也即-\hat{H}(\vec{x})=\frac{D}{\kappa}\log{p(\vec{x},t)},或者写成-\frac{\kappa}{D}\hat{H}(\vec{x})=\log{p(\vec{x},t)},此时p(\vec{x},t)=e^{-\frac{\kappa}{D}\hat{H}(\vec{x})}
这里我自己再啰嗦两句,在物理学的诸多领域中,我们常会观察到一种极具共性的数学结构:许多核心的物理矢量场,都可以通过某个标量函数的负梯度来定义。比如F=-\nabla V,亦或是E=-\nabla \phi,以及这里的\vec{f}=-\nabla\hat{H}(\vec{x}),第一个公式揭示了保守力场中势能与保守力的关系,第二个公式揭示了电场中电场强度与静电势的关系,而值得注意的是,磁场中并不存在这样的数学结构,这一本质差异,恰恰从数学层面印证了磁场的一个关键物理特性:它不存在平衡态,或者说它无法达到真正的平衡态
Comments NOTHING