Qual è il significato del vettore gradiente e della derivata direzionale per funzioni di due variabili? Come è possibile calcolarli?

Vogliamo cercare di estendere il concetto di derivata
(visto nel caso di funzioni a variabile reale), al caso di funzioni in
più variabili. Vediamo come sia possibile far ciò, proprio
partendo dalle nozioni note nel caso di funzioni dipendenti da una singola
variabile.

      Sia A un aperto
di 2 e sia
f : A –>  una
funzione; fissiamo un punto
X0 = (x0y0)
in A e definiamo la nuova funzione
f0(x) :=f(xy0),
ottenuta considerando la funzione f ristretta alla retta
{y = y0}. Questa nuova funzione è
una funzione dipendente da una singola variabile (la x) e quindi
possiamo calcolare (se esiste) il limite del suo rapporto incrementale:

se tale limite esiste finito, lo denoteremo con , che chiameremo derivata parziale della
f rispetto alla x (in realtà le notazioni presenti nei
vari testi sono le più varie: f, fx, …). In altre parole, quello
che abbiamo fatto è stato considerare gli incrementi della f
per piccole variazioni del suo argomento lungo la direzione dell’asse delle
x.

      In maniera completamente
analoga si definisce la derivata parziale rispetto alla y.

      Questa definizione ci
fornisce anche un metodo per calcolare le derivate parziali (al di là
del calcolo del limite del rapporto incrementale): basta considerare una
variabile come “parametro” fissato ed applicare tutte le regole note per il
calcolo delle derivate di funzioni dipendenti da una sola variabile reale.

      Inoltre, si definisce il
vettore gradiente, il vettore le cui componenti sono rappresentate
proprio dalle derivate parziali:

(anche in questo caso la notazione varia da testo a testo).

      Ma perché
limitarci a considerare gli incrementi lungo l’asse delle x o delle
y? Si può generalizzare quanto appena fatto agli incrementi
lungo una qualsiasi direzione? La risposta è ovviamente affermativa.

      Consideriamo una
direzione (cioè, un vettore)  = (12) diversa da (0, 0) e il seguente rapporto
incrementale:

se tale limite esiste finito, denoteremo tale valore con
quello che viene detto derivata
direzionale
della f rispetto alla direzione .

      Facciamo un po’ di
osservazioni sui concetti finora illustrati:

  • Le derivate parziali sono delle particolari derivate direzionali,
    rispetto alle direzioni e1 = (1, 0) ed
    e2 = (0, 1).

  • Non è assolutamente detto che esistano tutte le
    derivate direzionali. Per esempio, la funzione
    f(xy) = |x| + y
    in X0 = (0, 0) ha derivata parziale finita
    rispetto alla y, ma non rispetto alla x.

  • Qualora esista il gradiente (cioè entrambe le
    derivate parziali), è possibile fornire una rappresentazione delle
    derivate direzionali in termini del gradiente:

    dove con “” abbiamo
    indicato il prodotto scalare standard in 2. Quindi l’esistenza di entrambe le derivate
    parziali implica l’esistenza di tutte le derivate direzionali.

  • Osserviamo che il discorso fatto in precedenza è
    valido se si considerano due qualsiasi direzioni linearmente
    indipendenti
    (anziché le direzioni e1 ed e2).
    Quindi possiamo concludere che se esistono le derivate direzionali rispetto a
    due direzioni linearmente indipendenti, automaticamente esistono tutte le
    altre derivate direzionali.

Purtroppo quanto abbiamo appena discusso, non generalizza
completamente la nozione di derivabilità in . Infatti, per funzioni di una variabile reale vale
l’importantissima proprietà

DERIVABILITÀ   ==>   CONTINUITÀ.

Nel caso di più variabili, l’esistenza delle derivate
parziali (o di tutte le derivate direzionali) non garantisce la
continuità della funzione nel punto. Per esempio, si può
considerare la funzione:

dove

Si dimostra che per ogni
(cioè esistono tutte le derivate direzionali
nell’origine), ma la funzione è chiaramente discontinua in
(0, 0).

      Qual è il motivo di
questa “incongruenza”? In realtà non si tratta di una vera e propria
incongruenza: il fatto è che per funzioni dipendenti da una singola
variabile reale, due importanti concetti vengono a coincidere: quelli di
derivabilità e differenziabilità (questo fa sì che in
tale contesto vengano spesso usati come sinonimi!). È solo in
dimensione maggiore che ci si rende conto della differenza fra questi due
concetti. Diamo quindi la definizione di differenziabilità (in
realtà si può dare in maniera molto più generale):

      Una funzione f si
dice differenziabile in (x0y0)
se esistono le derivate parziali in
(x0y0) e

Osserviamo che nel caso di una singola variabile reale
questa definizione è equivalente a quella di derivabilità (il
ruolo di è svolto da
f’(x0)).

      È questa nuova
definizione quella che ci interessa; infatti valgono le seguenti
proprietà:

  • Differenziabilità ==> continuità.
  • Differenziabilità ==> esistenza di tutte le derivate direzionali.
  • Esistenza delle derivate parziali e loro continuità ==> differenziabilità.

(tali implicazioni non si invertono, come si mostra
abbastanza facilmente trovando dei controesempi).