или: Да се изложи и критички претресе теорија диференцијалног рачуна
Страхиња Радић
При проучавању разних предмета са
„старијих“ година Математичког факултета често се увиђа потреба да се боље
упознају све финесе диференцијалног рачуна. На пример, када проучавамо
диференцијалне једначине, јавља се и следећи проблем: ако је
u=F(x,y,z(x,y)) функција, шта представља израз
∂x∂u, шта ∂x∂z, а шта ∂x∂y? Слични
проблеми се јављају и код реалних и комплексних функција, итд.
⋆⋆⋆
Прво, да видимо шта са становишта диференцијалног рачуна значе појмови
„константа“, „променљива“ и „функција“. Константе су, као што знамо, реалне
бројевне вредности, на пример: 1; 2; 22/7; 3,14159…;
345; 10000 итд. Променљива представља вредност коју не познајемо,
и која је, као што јој и назив говори, подложна промени. Дакле, променљива x
може да узима разне појединачне (константне) вредности. Ако се фиксира
(одабере) њена одређена вредност, она „постаје“ константа. У ствари, од тог
тренутка смо заправо забранили сваку даљу промену тог симбола, нпр. x, и он
постаје само ознака за одређену константу. Тако, можемо променљиву y, која
узима вредности из интервала [0,1], фиксирати на вредност 0,25:
y=0,25, и од тог тренутка y постаје симбол за константу 0,25.
Функција представља променљиву која зависи од једне или више других
променљивих, које су независне како од „функције“, тако и међусобно. То значи да
када променљиве имају у више случајева различите појединачне вредности, и
функција може такође имати различите вредности. Наравно, функција може зависити
и од других „функција“, у смислу управо изнете дефиниције. Тако, функција f
може да зависи од u, v и w, при чему је w такође функција која зависи од
u и v: f(u,v,w(u,v)).
Нека је сада y=f(x) функција. То значи да је y променљива, која зависи од
променљиве x (њеног аргумента) на начин који је описан изразом који се
обележава са f. На пример, можемо имати: y=f(x)=2x+45, и ту је формално
f=2□+45, где је са □ означена променљива (аргумент) од које
зависи израз f. Наравно, f неће моћи увек да се искаже преко аритметичких
операција, па чак ни преко аналитичких израза. Тада кажемо да је функција задана
имплицитно (наспрам пређашњег експлицитног задавања), и онда су променљиве
обично у вези која се исказује релацијом оваквог типа: F(x,y)=0, где је F
неки аналитички израз, а истовремено не може да се одреди f у једнакости
y=f(x).
Зауставимо се сада за тренутак да бисмо приметили једну важну чињеницу. Функција
се може посматрати формално и ефективно. Формално, функција је променљива
(нпр. ако је y=f(x), онда је y формално променљива), али ефективно она
зависи од једне или више променљивих. Тако функција z=f(x,y) ефективно зависи
од променљивих x и y, иако је формално једна променљива, z. Ако функција
зависи од других функција, она од њих зависи само формално, док ефективно она
зависи од њихових параметара. На пример, за w=w(u,v)=u+v и f(u,v,w)=(u−v)⋅w2 имамо функцију t=f(u,v,w(u,v)), која формално
зависи од променљивих u, v и w: t=(u−v)⋅w2, али ефективно зависи
само од променљивих u и v, јер од њих ефективно зависи променљива w:
w=u+v⇒t=(u−v)⋅(u+v)2.
Нека је сад, на пример, t=f(u,v,w,z)=uv+wz, w=2u и z=v2. Иако функције
w и z зависе само од по једног параметра, остали параметри им се формално
додају да би се задржала форма функције која ефективно зависи од параметара
функција од којих формално зависи. Тако имамо:
Ова два начина гледања на функцију ће нам касније бити од кључне
важности.
Нека је, дакле, y=f(x) функција a x променљива од које зависи функција y.
Одредимо једну појединачну вредност променљиве x и означимо је са x0. То ће
бити тачка (друго име за константу) од које ћемо рачунати остале вредности
које ће нас занимати. Нека сада променљива x узима неку другу вредност, било
коју осим x0. Означимо x−x0 са Δx=0. Симбол Δx
означава прираштај променљиве x, који можемо посматрати и као својеврсни
„помак“ који би извршило неко тело које се креће од тачке x0 до тачке
x=x0+Δx. Одредимо сада вредност функције у тачкама x0 и
x=x0+Δx. У тачки x0 имаћемо неку такође фиксирану, константну,
вредност функције y: f(x0)=y0. Нека је вредност функције y у тачки
x0+Δx различита од њене вредности у тачки x0, дакле нека је
f(x0+Δx)=y=y0. Означимо y−y0 са Δy=0. Да резимирамо;
ситуација је следећа:
Прираштај функције, Δy, у општем случају зависи како од прираштаја
променљиве, Δx, тако и од избора почетне тачке, x0. Зато се обично
пише Δy=Δf(x0), мада би могло да се напише и, рецимо, Δy(Δx)=Δf(x0,Δx). Ипак, углавном се посматра прираштај
функције у једној фиксираној тачки x0, а тада прираштај функције зависи
само од прираштаја променљиве, Δx. На пример, нека је:
Као што видимо, прираштај функције, Δy, зависи од
Δx. Сада погледајмо шта се дешава са следећим
количником:
ΔxΔy(Δx)=Δxx0⋅Δx+2Δx2=x0+2Δx,
кад бесконачно смањујемо Δx, пазећи да он никада не постане тачно 0.
Уколико та гранична вредност постоји, она се у општем случају означава1
са:
Δx→0limΔxΔy=Δf′(x0)=y′,
и назива изводом функције y у тачки
x0.2 Битна особина извода јесте да он
зависи само од избора почетне тачке, x0, а
не и од прираштаја! У нашем примеру је, тако,
y′=f′(x0)=Δx→0lim(x0+2Δx)=x0,
па за x0=1 имамо y′=1.
[И заиста: ако применимо таблицу извода (код које x0 није фиксирано, већ се
уводи као параметар x), наћи ћемо
y′=(2x2)′=22x=x, па је x≡x0=1→y′=f′(x0)=1. Још једном: оно „x“ у тој таблици представља почетну тачку, а
не прираштај!]
Ако се може написати (уз задржавање тачности):
Δy=f′(x0)⋅Δx+α(Δx)⋅Δx,
односно:
Δy=f′(x0)⋅Δx+Δx→0o(Δx),
где је f′(x0)∈R константно за фиксирано x0∈R, онда се производ
f′(x0)⋅Δx=Δdf(x0)=dy
назива диференцијалом функције f у тачки x0. У случају функције једне
променљиве, то је производ константе f′(x0) (за фиксирано x0) и променљиве
Δx, па самим тим и функција од прираштајаΔx. За фиксирано
Δx ће df(x0), погађате, бити константан број, баш као што је и
функција константан број за једну засебну вредност променљиве (аргумента). Овде
видимо једну кључну разлику између извода и диференцијала: док извод зависи само
од почетне тачке, x0, диференцијал уз то зависи још и од прираштаја
аргумента, Δx.
Слика 1. Извод представља угаони коефицијент тангенте у тачки $x_0$, а диференцијал „парче“ праве $x=x_0+\Delta x$ између $y_0$ и пресека са тангентом. Прираштај функције је „парче“ исте праве до пресека са графиком функције. Оба „парчета“ зависе од тога колико се одмичемо од $x_0$ $\bigl($тј. зависе од $\Delta x\bigr)$.
Сада се можемо запитати: чему је једнак диференцијал од променљиве? Проверимо
ово уз помоћ формуле којом се задаје диференцијал: нека је нова „функција“
једнака: z=g(x)=x. Овде је функција формално променљива z, али је ефективно
једнака променљивој x. Даље је: Δz=g(x0+Δx)−g(x0)=x0+Δx−x0=Δx, па је z′=g′(x0)=Δx→0limΔxΔx≡1, и диференцијал је једнак dz=Δd[g(x)=x]=g′(x0)⋅Δx=1⋅Δx=Δx. По дефиницији диференцијал dz у овом случају означавамо са
dx. Дакле, у случају реалне променљиве имамо да је њен диференцијал
ефективно једнак њеном прираштају, dx=Δx. Ако сада Δx=dx убацимо у формулу:
dy=f′(x0)⋅Δx=y′⋅Δx,
добићемо:
dy=df(x0)=f′(x0)⋅dx=y′⋅dx⇒y′=f′(x0)=∂x∂y.
Овде треба посебно обратити пажњу на то да иако и dy и dx (као
диференцијали) зависе од прираштаја променљиве, Δx, њихов количник,∂x∂y=y′=f′(x0) (као извод=
гранична вредност..., итд.) не зависи од Δx! Како то? Просто: да ли
2x зависи од x? Да. Да ли x2x=2 зависи од x? Не. Израз може
зависити од променљиве, а да његов количник са том променљивом буде константан.
А дељење нулом? Сетимо се да смо изричито забранили да Δx=dx
буде једнако нули, иако може да тежи ка нули.
Вратимо се нашем примеру; имали смо:
Δy(Δx)=x0⋅Δx+2Δx2.
Очито је овде x0⋅Δx део који садржи само производ константе и
прираштаја (главни, линеарни део). Зато је:
Δy(Δx)=x0⋅Δx+Δx→0o(Δx),Δx→0o(Δx)=2Δx2,
тј. dy=x0⋅Δx=x0dx⇒∂x∂y=x0. Нека је, конкретно, x0=1 и Δx=dx=0,25.
Биће: Δy=0,28125, dy=0,25. За Δx=dx=0,05
имамо Δy=0,05+0,00125=0,05125 и dy=0,05. Очигледно је да
ће прираштај функције „тежити“ ка диференцијалу, али се они ипак не поклапају ни
за једну конкретну вредност dx, мада им се „поклапају“ граничне
вредности, па се може писати Δy≈dy(Δx→0).
Извод је овде сасвим друга прича, јер је он константно једнак 1 за x0=1 (у
оба претходна случаја). Диференцијал је производ константног извода,
y′=f′(x0), и променљивог прираштаја, dx=Δx.
[Да буде јасније: овде смо могли да напишемо и Δx→0lim(dy(Δx)−Δy(Δx))=0, где се dy и Δy посматрају као функције од прираштаја, Δx. Грчко и
латинско слово за „д“ конвергирају ка истој вредности кад прираштај тежи ка
нули.]
Као да све ово није довољно замршено, понекад се уместо Δx=dx пише
и h, па онда имамо h→0limhf(x0+h)−f(x0)=f′(x0),
диференцијал постаје dy=f′(x0)⋅h, итд. Ипак, углавном се не користи
израз hdy.
Код Њутнових ознака се претпоставља да функција зависи од времена,t. У
другим случајевима се Њутнова ознака не употребљава. За Лајбница су, очито,
диференцијали били основни градивни елемент, док су касније они потиснути у
други план.
⋆⋆⋆
Ако променљива x зависи од неке друге променљиве, t, тј. ако се ради о
функцијиx=x(t), онда извод yt′ налазимо преко извода yx′ и xt′.
Саставимо, најпре, израз за Δy:
где је α(Δx) бесконачно мала функција кад
Δx→0[а
Δx→0 кад Δt→0],
и коначно добијамо:
y′t=y′x⋅x′t⟺∂t∂y=∂x∂y∂t∂x.
Слично је са диференцијалима:
dy=yt′dt=yx′⋅xt′dt⟺dy=∂x∂y∂t∂xdt.
Ако овде ставимо xt′dt=dx, добијамо диференцијал у облику у ком
би он био да је x променљива:
dy=yx′dx.
Ипак, x је овде ознака функције, а не обична променљива!
Ради се само о ознаци. Ова згодна особина се зове
инваријантност форме првог диференцијала.
Подсетимо се да су овде yx′ и xt′ константе,
а dt и dy прираштај и функција
од прираштаја. Пошто су ово реалне једнопараметарске функције,
овде се „разломци“ могу „скраћивати“, па је:
dy=dxdydtdxdt=dy.
Међутим, да смо имали више параметара, ово не бисмо могли да урадимо.
⋆⋆⋆
Погледајмо сада шта се дешава ако функција има више параметара. За
почетак се ограничимо на функције чији су параметри обичне променљиве
(нису функције). Дакле, нека је:
u=f(x,y,z),M=(x,y,z),
и нека је M0=(x0,y0,z0) почетна тачка. Шта је прираштај променљиве, која
је сада променљиви векторM? Променљиве x, y и z се могу мењати
независно једна од друге. Ипак, разликујемо неколико посебних случајева.
Фиксирајмо y и z, тј. нека је:
Mx=(x,y0,z0),ΔxM=(Δx,0,0).
Имамо: ΔxM=Mx−M0, Mx=M0+ΔxM. Овде под сабирањем
подразумевамо сабирање вектора по његовим компонентама. Даље је:
Δxu=f(M0+ΔxM)−f(M0)=f(x0+Δx,y0,z0)−f(x0,y0,z0), а
ако пређемо на граничну вредност у изразу:
Δx→0limΔxf(x0+Δx,y0,z0)−f(x0,y0,z0),
добићемо извод, али само по првој променљивој,x. Он се обележава са:
и назива парцијалним изводом по променљивој x
функције f у тачки M0. Слично се, фиксирањем
променљивих x и z, или x и
y, дефинишу и fy′(M0) и fz′(M0).
Ако парцијални извод помножимо са прираштајем (прве променљиве
= вектора!), добићемо некакав диференцијал:
fx′(M0)dx, који ипак није једнак диференцијалу
функције у општем случају.
Погледајмо, зато, прираштај по свим променљивим:
ΔM=M−M0=(x,y,z)−(x0,y0,z0)=(Δx,Δy,Δz).
Имамо M=M0+ΔM, и:
Δu=Δf(M0,ΔM)=f(M0+ΔM)−f(M0).
Ако се прираштај функције, Δu, може написати као:
Δu=⟨f′(M0),ΔM⟩+⟨(α,β,γ),ΔM⟩,
где су α(ΔM), β(ΔM) и γ(ΔM) бесконачно
мале функције кад ∥ΔM∥→0, односно
Δu=⟨f′(M0),ΔM⟩+∥ΔM∥→0o(ΔM),
[где је f′(M0) константни вектор, а ⟨a,b⟩ означава скаларни
производ вектора (a) и (b)], онда се скаларни производ
⟨f′(M0),ΔM⟩ назива диференцијалом функције f у тачки M0.
Он се записује овако:
⟨f′(M0),ΔM0⟩=Δdf(M0)(ΔM),
или, уколико више волите да пишете ΔM=h, df(M0)(h). Оправдање
поистовећивања записа L(h)=Lh, односно функција и матрица, ћемо дати касније,
кад будемо разматрали векторске функције више променљивих, а сада је довољно да
приметимо да је управо због таквог записа d „склизнуло“ из израза
df(M0,h) у скаларни производ, df(M0)(h), иако оно што је
означено са df(M0) уопште није диференцијал, већ извод. Да све буде још
„боље“, df=df(M0,ΔM)=df(M0)(ΔM) је
диференцијал функције! Ова, формално гледано, незгода, изискује посебну пажњу
када се ради са диференцијалима функција више променљивих. Ево колико-толико
уреднијег прегледа овог проблема:
Да се подсетимо шта је то линеарни оператор. Просто, то је функција која за
све x, y∈D и λ, μ∈R, где је D домен функције f (и
λx+μy такође припада D), испуњава следеће:
f(λx+μy)=λf(x)+μf(y).
Очито, множење са константама представља неку врсту линеарних оператора, па је
тако диференцијал реалне функције једне променљиве, који представља множење са
изводом (константом), уједно и линеарни оператор, мада сасвим тривијалан. Овде
имамо скаларни производ променљивог вектора са константним вектором, што такође
представља линеарни оператор.
Осим овога, може се доказати да је извод f′(M0) једнак управо градијенту
функције f у тој тачки, тј. вектору који се састоји од парцијалних извода по
свим променљивим функције f:
Нека сада функција f има m параметара: x1, …, xm; M=(x1,…,xm)[у нашем досадашњем излагању би било m=3 и x1≡x,
x2≡y, x3≡z], и нека постоји m бесконачно малих функција
α1, …, αm, кад ∥ΔM∥→0. У складу са
овим, имамо табелу аналогну оној из првог дела излагања:
прираштајфункције:Δuизводфункције:u′диференцијалфункције:du=Δf(M0,ΔM)=f(M0+ΔM)−f(M0)==df(M0)(ΔM)+⟨(α1,…,αm),ΔM⟩.(зафиксираноM0јефункцијаод ΔM)=df(M0)=f′(M0)=gradf(M0),(зафиксираноM0јеконст. вектор)=df=df(M0)(ΔM)=⟨u′,ΔM⟩==⟨gradf(M0),ΔM⟩=fx1′(M0)dx1+⋯+fxm′(M0)dxm.(зафиксираноM0јел. оп. од ΔM)(зависиодM0и ΔM)(зависисамоодM0)(зависиодM0и ΔM)
⋆⋆⋆
Слично као и у случају функција једне променљиве, и овде се као аргументи могу
јавити функције од неких параметара. И формула за извод такве, сложене функције
је слична као и у том случају. Нека је w=f(x,y,z) и x=x(u,v), y=y(u,v) и
z=z(u,v). Почнимо од израза за прираштај функције:
Ако сада „пустимо лимес“ кад Δu→0, доћи ћемо до формуле:
wu′=wx′⋅xu′+wy′⋅yu′+wz′⋅zu′.
Слично за Δv→0:
wv′=wx′⋅yv′+wy′⋅yv′+wz′⋅zv′.
Ово можемо записати и преко Лајбницових ознака [које су по мом мишљењу
чисто траћење простора, иако могу бити и корисне, нпр. у изразу као што је:
(∂xn∂fm)2/3 наспрам
((fm)xn′)2/3]:
па би следило wu′≡0, што није тачно у општем случају. Наравно,
употребом Лагранжових ознака нећемо ни доћи у искушење да нешто „скраћујемо“, па
их зато препоручујем уместо Лајбницових.
Иако је помало гломазан, диференцијал се лако добија из претходних формула за
wu′ и wv′:
добијамо диференцијал у облику у ком би он био да су x, y и z променљиве,
слично као и у случају функција једне променљиве:
dw=wx′dx+wy′dy+wz′dz.
Ипак, x, y и z су и овде ознаке функција, а не обичне променљиве; ради се
само о ознакама. Дакле, и за функције више променљивих важи инваријантност
форме првог диференцијала.
Шта је, дакле, ∂u∂w? Поделимо
претходни израз са прираштајем Δu=Δdu:
Сада све зависи од извода ∂u∂v. Пошто се
v не мења када се мења u, јер би иначе v била функција од u, то значи да
ће прираштај Δv бити идентички једнак нули, као да је v константа, и
гранична вредност количника прираштаја ће бити једнака нули:
∂u∂v=Δu→0limΔuΔv≡Δu→0limΔu0=0.
Дакле,
∂u∂w=wx′xu′+wy′yu′+wz′zu′=wu′=∂u∂w,
као и у случају функције једне променљиве. Ипак, не важиdw=wu′du! У супротном би било wv′dv≡0, што није тачно у општем
случају. Диференцијали функција више променљивих се другачије понашају од
диференцијала функција једне променљиве: они се не могу „скраћивати“. Ово је
уједно и главни разлог зашто је уведена ознака ∂ уместо d.
Поред овога, није уобичајено да се диференцијал записује са ∂w, и тај
израз стандардно нема самостално значење у диференцијалном рачуну.
⋆⋆⋆
Најзад, поставља се питање шта се дешава када је функција векторска, тј. када
је њен „резултат“ вектор. Тада ћемо, на пример, имати функцију:
u=f(x,y,z,t)=(a(x,y,z,t),b(x,y,z,t),c(x,y,z,t)).
Да бисмо лакше записивали ове формуле, треба да се присетимо појма базе из
Линеарне алгебре. То је скуп вектора, нпр.:
{e1=(1,0,0),e2=(0,2,0),e3=(0,0,−1)},
који су међусобно линеарно независни (једини начин да њихова линеарна
комбинација буде нула јесте да су сви коефицијенти којима се множе вектори базе
једнаки нули):
λ1e1+λ2e2+λ3e3=0⟺λ1=λ2=λ3=0.
Претпоставимо да имамо другу функцију L са истим својствима као и f, али
која је уз то и линеарни оператор. Она ће, као и функција f, сликати 4
променљиве на 3 променљиве, односно имаћемо функцију L:R4→R3. Она
се може посматрати и као вектор од три (координатне) функције које су реалне.
Нека је база за R4 једнака {e1,e2,e3,e4}, а база за R3 једнака
{h1,h2,h3}. Важи:
L(ei)=mi1h1+mi2h2+mi3h3,i∈{1,2,3,4},
а mij су неки реални бројеви. Пошто сваки вектор x можемо да изразимо
преко вектора из базе: x=x1e1+x2e2+x3e3+x4e4, биће:
Зато се линеарни оператори поистовећују са одговарајућим матрицама, а одређивање
вредности линеарног оператора са матричним множењем те матрице и колона-вектора
аргумента.
Нека је, дакле, M0=(x0,y0,z0,t0) и:
M=(x,y,z,t),u=f(M)=(a(M),b(M),c(M)).
Прираштај вектора M је ΔM=M−M0=(Δx,Δy,Δz,Δt), а прираштај функције
Може се наслутити да ће функција бити диференцијабилна ако је
испуњено:
Δf(M0,ΔM)=df(M0)ΔM+∥ΔM∥→0o(ΔM),
где је df(M0)=Δf′(M0) матрица линеарног
оператора. Да ово не би изазвало забуну, треба обратити пажњу на запис,
као и код реалних функција више променљивих. Тамо смо имали
df(M0)(ΔM) или df(M0)(h)
као ознаку за диференцијал, а са
f′(M0) смо означавали вектор извода
(градијент). Овде уместо скаларног производа два вектора, у диференцијалу
имамо множење матрице променљивим вектором прираштаја:
df(M0,ΔM)=f′(M0)⋅ΔM.
Израз df(M0), иако садржи латинско слово d, представља матрицу
извода: