Os espacios euclidianos

O espacio euclidiano de dimensión $n$, denotado por $\mathbb{R}^n$, é o conxunto das $n$-tuplas de números reais coa estructura natural de espacio vectorial. Máis concretamente, \[ \mathbb{R}^n=\{(x_1,\dots,x_n):x_i\in\mathbb{R},\forall i=1,\dots,n\}, \] onde se definen a suma e o producto por un escalar mediante \begin{align*} (x_1,\dots,x_n)+(y_1,\dots,y_n)&{}=(x_1+y_1,\dots,x_n+y_n),\\ \lambda\cdot (x_1,\dots,x_n)&{}=(\lambda x_1,\dots,\lambda x_n), \end{align*} con $\lambda\in\mathbb{R}$ e $(x_1,\dots,x_n)$, $(y_1,\dots,y_n)\in\mathbb{R}^n$.

Os elementos do espacio euclidiano $\mathbb{R}^n$ denotaranse mediante $\mathbf{x}=\left( x_1,\dots,x_n\right)$. Ditos elementos chámanse vectores. Un elemento distinguido dun espacio vectorial é o vector cero, aquel que ten tódalas compoñentes nulas: $\mathbf{0}=(0,\dots,0)$.

Obviamente, se $n=1$ obtemos simplemente a recta real $\mathbb{R}$. Para $n=2$ e $n=3$ adoptamos unha notación un pouco máis relaxada cando conveña e poremos $(x,y)$ e $(x,y,z)$ para un vector xenérico de $\mathbb{R}^2$ e $\mathbb{R}^3$ respectivamente.

Producto escalar e norma euclidiana

Defínese o producto escalar $\langle\,,\,\rangle$ no espacio euclidiano como a aplicación \[ \begin{aligned} \langle\,,\,\rangle\colon\mathbb{R}^n\times\mathbb{R}^n & \to \mathbb{R}\\ (\mathbf{x},\mathbf{y}) & \mapsto \langle\mathbf{x},\mathbf{y}\rangle= {\sum_{i=1}^n x_i y_i}. \end{aligned} \]

O producto escalar ten as seguintes propiedades:

  • É unha aplicación multilinear: \begin{align*} \langle\mathbf{x},\mathbf{y}+\mathbf{z}\rangle &=\langle\mathbf{x},\mathbf{y}\rangle+\langle\mathbf{x},\mathbf{z}\rangle,\\ \langle\mathbf{x}+\mathbf{z},\mathbf{y}\rangle &=\langle\mathbf{x},\mathbf{y}\rangle+\langle\mathbf{z},\mathbf{y}\rangle,\\ \langle\lambda\mathbf{x},\mathbf{y}\rangle &=\lambda\langle\mathbf{x},\mathbf{y}\rangle =\langle\mathbf{x},\lambda\mathbf{y}\rangle. \end{align*}
  • É unha aplicación simétrica: $\langle\mathbf{x},\mathbf{y}\rangle=\langle\mathbf{y},\mathbf{x}\rangle$.
  • É unha aplicación definida positiva: $\langle\mathbf{x},\mathbf{x}\rangle\geq 0$, e $\langle\mathbf{x},\mathbf{x}\rangle=0$ se e só se $\mathbf{x}=\mathbf{0}$.

(para todo $\mathbf{x}$, $\mathbf{y}$, $\mathbf{z}\in\mathbb{R}^n$ e $\lambda\in\mathbb{R}$.)

A multilinearidade séguese facilmente da propiedade distributiva para os números reais. A simetría é consecuencia da propiedade conmutativa. O feito de que o producto escalar sexa definido positivo é evidente, pois calquera número real elevado ó cadrado é non negativo, e a suma de números non negativos só pode ser cero cando tódolos sumandos son cero.

A continuación empregámo-lo producto escalar para defini-la norma ou módulo dun vector.

Defínese a norma dun vector como \begin{align*} \lVert\mathbf{x}\rVert& {}=\langle\mathbf{x},\mathbf{x}\rangle^{1/2}\\ &{}=\sqrt{x_1^2+\dots+x_n^2}. \end{align*}

A norma ten as seguintes propiedades:

  • Desigualdade triangular: $\lVert\mathbf{x}+\mathbf{y}\rVert\leq \lVert\mathbf{x}\rVert+\lVert\mathbf{y}\rVert$.
  • $\lVert\lambda\mathbf{x}\rVert=\lvert\lambda\rvert\cdot\lVert\mathbf{x}\rVert$.
  • $\lVert\mathbf{x}\rVert\geq 0$, e $\lVert\mathbf{x}\rVert=0$ se e só se $\mathbf{x}=\mathbf{0}$.

(para todo $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ e $\lambda\in\mathbb{R}$.)

Norma dun vector x y (x, y)
$\lVert(x,y)\rVert=\sqrt{x^2+y^2}$
Norma dun vector

A primeira desigualdade probarémola na sección seguinte. Coñécese tamén como a desigualdade de Minkowski.

Cómpre recordar o seguinte feito. Se $x\in\mathbb{R}$ é un número real, entón \[ \sqrt{x^2}=\lvert x\rvert. \] Neste curso empregaremos sempre o convenio de que cando tomémo-la raíz cadrada dun número, entenderemos sempre que nos referimos ó seu valor positivo.

Recórdese tamén que a raíz cadrada é unha función estrictamente monótona crecente, o cal implica que conserva tanto desigualdades como desigualdades estrictas.

Desigualdades de Cauchy-Schwarz e de Minkowski

Nesta sección demostraremos dúas propiedades do producto escalar e da norma euclidiana que serán importantes para o resto da materia.

En matemáticas, a desigualdade de Cauchy-Schwarz é unha desigualdade moi útil encontrada en diferentes áreas, tales como o álxebra lineal (aplicada a vectores) ou a análisise matemática (aplicada a series infinitas e integración de productos).

(Desigualdade de Cauchy-Schwarz) Para calquera $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ verifícase que \[ \lvert\langle\mathbf{x},\mathbf{y}\rangle\rvert^2\leq \langle\mathbf{x},\mathbf{x}\rangle\cdot\langle\mathbf{y},\mathbf{y}\rangle. \]

Equivalentemente, tomando a raíz cadrada en ambos lados, e referíndose á norma dos vectores, a desigualdade escríbese como \[ \lvert\langle\mathbf{x},\mathbf{y}\rangle\rvert\leq \lVert\mathbf{x}\rVert\cdot\lVert\mathbf{y}\rVert. \]

Sexa $\lambda\in\mathbb{R}$ un número real arbitrario. Polas propiedades do producto escalar temos que \begin{align*} 0&{}\leq\lVert\lambda\mathbf{x}+\mathbf{y}\rVert^2\\ &{}=\langle\lambda\mathbf{x}+\mathbf{y},\lambda\mathbf{x}+\mathbf{y}\rangle\\ &{}=\lambda^2\langle \mathbf{x},\mathbf{x}\rangle+2\lambda\langle \mathbf{x},\mathbf{y}\rangle+\langle \mathbf{y},\mathbf{y}\rangle. \end{align*}

Dado que $\langle \mathbf{x},\mathbf{x}\rangle\geq 0$, como función de $\lambda$, a expresión anterior expresa o feito de que estamos considerando unha parábola coas ramas cara arriba e que sempre está porriba do eixo $Y$. En consecuencia, tal parábola terá, como moito, unha solución real. Deste xeito, o seu discriminante será non positivo, o que quere dicir que \[ 4\langle \mathbf{x},\mathbf{y}\rangle^2-4\langle \mathbf{x},\mathbf{x}\rangle\langle \mathbf{y},\mathbf{y}\rangle\leq 0, \] feito que é equivalente á ecuación que queriamos probar.

Probar que os dous lados na desigualdade de Cauchy-Schwarz son iguais se e só se $\mathbf{x}$ e $\mathbf{y}$ son linearmente dependentes.

y x θ
Ángulo entre dous vectores

Unha aplicación da desigualdade de Cauchy-Schwarz permite medi-lo ángulo $\theta$ entre dous vectores $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ como \[ \langle\mathbf{x},\mathbf{y}\rangle =\lVert\mathbf{x}\rVert\cdot\lVert\mathbf{y}\rVert\cdot \cos\theta. \]

De feito, a desigualdade de Cauchy-Schwarz implica que, para vectores $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$, con $\mathbf{x},\mathbf{y}\neq \mathbf{0}$, \[ -1\leq \frac{\langle\mathbf{x},\mathbf{y}\rangle} {\lVert\mathbf{x}\rVert\cdot\lVert\mathbf{y}\rVert}\leq 1. \] Agora ben, como todo número no intervalo $[-1,1]$ é acadado, de xeito único, polo coseno dun ángulo en $[0,\pi]$, defínese o ángulo entre $\mathbf{x}$ e $\mathbf{y}$ como o único elemento $\theta\in[0,\pi]$ tal que $\langle\mathbf{x},\mathbf{y}\rangle =\lVert\mathbf{x}\rVert\cdot\lVert\mathbf{y}\rVert\cdot \cos\theta$.

A continuación pasamos á desigualdade triangular ou desigualdade de Minkowski, que establece que, para cada triángulo, a lonxitude dun lado debe ser menor cá suma das lonxitudes dos outros dous lados.

(Desigualdade de Minkowski) Para calquera $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ verifícase que \[ \lVert\mathbf{x}+\mathbf{y}\rVert\leq \lVert\mathbf{x}\rVert+\lVert\mathbf{y}\rVert. \]

Obsérvese que para $n=1$ obtemos a desigualdade triangular para o valor absoluto.

Sexan pois $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ arbitrarios.

x y y x + y

A demostración consiste en emprega-la definición da norma en termos do producto escalar, e aplica-las propiedades deste último xunto coa desigualdade de Cauchy-Schwarz: \begin{align*} \lVert \mathbf{x}+\mathbf{y}\rVert^2 &{}=\langle\mathbf{x}+\mathbf{y},\mathbf{x}+\mathbf{y}\rangle\\ &{}=\lVert\mathbf{x}\rVert^2+2\langle\mathbf{x},\mathbf{y}\rangle+\lVert\mathbf{y}\rVert^2\\ &{}\leq \lVert\mathbf{x}\rVert^2+2\lVert\mathbf{x}\rVert\lVert\mathbf{y}\rVert +\lVert\mathbf{y}\rVert^2\\ &{}=(\lVert\mathbf{x}\rVert+\lVert\mathbf{y}\rVert)^2, \end{align*} e simplemente hai que extraer raíces cadradas de número non negativos.

Proba-la desigualdade triangular inversa: \[ \Bigl\lvert\lVert\mathbf{x}\rVert-\lVert\mathbf{y}\rVert\Bigr\rvert \leq\lVert\mathbf{x}-\mathbf{y}\rVert. \]

Resulta interesante enfatiza-lo feito de que nas demostracións anteriores das desigualdades de Cauchy-Schwarz e de Minkowsi en ningún momento se empregou a definición de producto escalar ou norma, se non simplemente as propiedades que foron establecidas xusto a continuación da súa definición. En contextos máis xerais, que van máis aló do contido deste curso, poden definirse aplicacións similares ó producto escalar e á norma, que permiten probar resultados importantes en espacios máis complicados, incluso de dimensión infinita.

Distancia euclidiana

A distancia euclidiana é a distancia habitual entre dous puntos do espacio deducida a partir do teorema de Pitágoras.

Chámase distancia euclidiana entre dous puntos $\mathbf{x}$, $\mathbf{y}\in\mathbb{R}^n$ ó número \begin{align*} d(\mathbf{x},\mathbf{y}) &{}=\lVert\mathbf{x}-\mathbf{y}\rVert\\ &{}=\sqrt{\sum_{i=1}^n (x_i-y_i)^2}. \end{align*}

A distancia euclidiana ten as seguintes propiedades:

  • $d(\mathbf{x},\mathbf{y})\geq 0$.
  • $d(\mathbf{x},\mathbf{y})=0$ se e só se $\mathbf{x}=\mathbf{y}$.
  • Simetría: $d(\mathbf{x},\mathbf{y})=d(\mathbf{y},\mathbf{x})$.
  • Desigualdade triangular: $d(\mathbf{x},\mathbf{y})\leq d(\mathbf{x},\mathbf{z})+d(\mathbf{z},\mathbf{y})$.
x y z d(x, y) d(x, z) d(y, z)

Estas propiedades séguense inmediatamente das propie­dades da norma euclidiana sen máis que aplica-la definición de distancia.

Intuitivamente, a desigualdade triangular dinos que a distancia entre dous puntos sempre é menor que pasando primeiro por un terceiro. Xunto coa desigualdade de Cauchy-Schwarz esta é unha das desigualdades que empregaremos en repetidas ocasións ó longo deste curso.

Aínda que non será de interés para esta materia, diremos que un par $(X,d)$, onde $X$ é un conxunto e $d\colon X\times X\to\mathbb{R}$ é unha aplicación satisfacendo as propiedades da distancia euclidiana, é un espacio métrico; a aplicación $d$ chámase distancia ou métrica. Grande parte dos conceptos e resultados que se presentarán nesta materia son aplicables a espacios métricos.

De fundamental importancia na materia son as bólas abertas, que corresponden cos puntos do espacio que distan dun punto dado menos cá un número fixado chamado radio.

De xeito máis preciso. Sexan $\mathbf{x}_0\in\mathbb{R}^n$ e $r>0$.

A bóla aberta de $\mathbb{R}^n$ de centro $\mathbf{x}_0$ e radio $r$ é o conxunto \[ B_{\mathbb{R}^n}(\mathbf{x}_0,r)=\{\mathbf{z}\in\mathbb{R}^n: d(\mathbf{z},\mathbf{x}_0) < r\}. \]

Analogamente,

A bóla pechada de $\mathbb{R}^n$ de centro $\mathbf{x}_0$ e radio $r$ é o conxunto \[ B_{\mathbb{R}^n}[\mathbf{x}_0,r]=\{\mathbf{z}\in\mathbb{R}^n: d(\mathbf{z},\mathbf{x}_0) \leq r\}. \]

Cando non exista posibilidade de confusión escribiráse simplemente $B(\mathbf{x}_0,r)$ ou $B[\mathbf{x}_0,r]$.

x0 r B(x0 , r) x0 r B[x0 , r]
As bólas abertas non conteñen o seu borde, mentres que as pechadas si.

En $\mathbb{R}$ as bólas correspóndense cos seguintes intervalos \begin{align*} B_{\mathbb{R}}(x_0,r)&=(x_0-r,x_0+r),\\ B_{\mathbb{R}}[x_0,r]&=[x_0-r,x_0+r]. \end{align*}

Un conxunto $X\subset\mathbb{R}^n$ dise limitado se está contido nalgunha bóla, é dicir, se existe $\mathbf{x}_0\in\mathbb{R}^n$ e $R>0$ tal que $X\subset B(\mathbf{x}_0,R)$.

O seguinte lema asegura que o punto onde estea centrado a bóla e o seu carácter aberto ou pechado son irrelevantes.

Sexa $X\subset\mathbb{R}^n$. Entón, $X$ é un conxunto limitado se e só se existe $M>0$ tal que $\lVert \mathbf{x}\rVert\leq M$ para todo $\mathbf{x}\in X$.

Supoñamos primeiro que $X$ é limitado.

x0 X R ||x0 || 0

Sexan $\mathbf{x}_0\in\mathbb{R}^n$ e $R>0$ tales que $X\subset B(\mathbf{x}_0,R)$. Tomemos $M=\lVert \mathbf{x}_0\rVert + R$ e vexamos que entón $\lVert \mathbf{x}\rVert\leq M$ para todo $\mathbf{x}\in X$. En efecto, se $\mathbf{x}\in X$, como $\mathbf{x}\in B(\mathbf{x}_0,R)$ temos que, pola desigualdade triangular, \begin{align*} \lVert\mathbf{x}\rVert &{}=d(\mathbf{x},\mathbf{0})\\ &{}\leq d(\mathbf{x},\mathbf{x}_0)+d(\mathbf{x}_0,\mathbf{0})\\ &{} < R+\lVert \mathbf{x}_0\rVert=M, \end{align*} como queriamos ver.

Supoñamos agora que existe $M>0$ tal que $\lVert \mathbf{x}\rVert\leq M$ para todo $\mathbf{x}\in X$. Entón $X\subset B(\mathbf{0},M+1)$. En efecto, se $\mathbf{x}\in X$, por hipótese temos que $d(\mathbf{x},\mathbf{0})=\lVert \mathbf{x}\rVert\leq M < M+1$, de onde $\mathbf{x}\in B(\mathbf{0},M+1)$.

No caso dun subconxunto $A$ de $\mathbb{R}$, dicimos que $A$ é limitado superiormente se existe $M>0$ tal que $x\leq M$ para todo $x\in A$. O concepto de subconxunto de números reais limitado inferiormente defínese de xeito análogo.

O supremo dun subconxunto $A$ de $\mathbb{R}$, limitado superiormente, é o número $M\in\mathbb{R}$ que satisfai:

  • $\forall x\in A$, $x\leq M$
  • $\forall\epsilon>0$, $\exists x\in A$ tal que $x>M-\epsilon$

Denotarémo-lo supremo de $A$ como $\sup A$.

O supremo non ten por que acadarse.

Para un conxunto limitado pode definirse o concepto de diámetro, que se entende intuitivamente coma a maior distancia á que se poderían atopar dous dos seus puntos. En xeral, como veremos, tal distancia non ten por que realizarse (é dicir, non ten por que haber dous puntos que estean a unha distancia exactamente igual ó diámetro).

Sexa $X$ un conxunto limitado de $\mathbb{R}^n$. Defínese o diámetro de $X$ como o número \[ \delta(X)= \sup\{ d(\mathbf{x},\mathbf{y}): \mathbf{x}, \mathbf{y}\in X\}. \]

É consecuencia da desigualdade triangular que se un conxunto é limitado, entón o seu diámetro existe. En caso de que o conxunto non sexa limitado o supremo anterior non existe e dirase que o conxunto ten diámetro infinito.

Problemas resoltos

Calcular $\delta\bigl(B_{\mathbb{R}^2}(\mathbf{x}_0,r)\bigr)$.

Vexamos que o diámetro é $\delta\bigl(B_{\mathbb{R}^2}(\mathbf{x}_0,r)\bigr)=2r$.

Sexan $\mathbf{x}$, $\mathbf{y}\in B_{\mathbb{R}^2}(\mathbf{x}_0,r)$ arbitrarios. Pola desigualdade triangular temos que \begin{align*} d(\mathbf{x},\mathbf{y}) & {}\leq d(\mathbf{x},\mathbf{x}_0)+d(\mathbf{x}_0,\mathbf{y})\\ &{} < r+r=2r, \end{align*} co que $\delta\bigl(B_{\mathbb{R}^2}(\mathbf{x}_0,r)\bigr)\leq 2r$.

Sexa agora $\epsilon>0$ arbitrario, e supoñamos, sen perda de xeneralidade, que $\epsilon < 4r$. Tomemos $\mathbf{x}=\mathbf{x}_0+(-r+\epsilon/4,0)$ e $\mathbf{y}=\mathbf{x}_0+(r-\epsilon/4,0)$. Temos que \begin{align*} d(\mathbf{x},\mathbf{x}_0) &{}=\lVert (-r+\epsilon/4,0)\rVert\\ &{}=r-\frac{\epsilon}{4} < r, \end{align*} co que $\mathbf{x}\in B_{\mathbb{R}^2}(\mathbf{x}_0,r)$. Analogamente, $\mathbf{y}\in B_{\mathbb{R}^2}(\mathbf{x}_0,r)$. Por outra banda, \begin{align*} d(\mathbf{x},\mathbf{y}) &{}=\lVert(2r-\epsilon/2,0)\rVert\\ &{}=2r-\epsilon/2 > 2r - \epsilon, \end{align*} o que proba, de acordo coa definición de supremo, que $\delta\bigl(B_{\mathbb{R}^2}(\mathbf{x}_0,r)\bigr)=2r$.

Dados dous conxuntos $A$, $B\subset\mathbb{R}^n$, defínese a distancia entre $A$ e $B$ como \[ d(A,B)=\inf\{d(\mathbf{x},\mathbf{y}):\mathbf{x}\in A,\ \mathbf{y}\in B\}. \]

Sexan \begin{align*} A&{}=\{0\}\times\mathbb{R},\\ B&{}=\{(x,y)\in\mathbb{R}^2:x>0,\ y=1/x\}. \end{align*} Calcular $d(A,B)$.

Vexamos que $d(A,B)=0$. En particular isto implica que a distancia entre conxuntos non é unha distancia propiamente dita, xa que $A\neq B$ (de feito, $A\cap B=\emptyset$).

Obviamente, $d(\mathbf{x},\mathbf{y})\geq 0$ se $\mathbf{x}\in A$ e $\mathbf{y}\in B$ polas propiedades da distancia. Sexa pois $\epsilon>0$ arbitrario. Tomámo-los puntos $(0,2/\epsilon)\in A$ e $(\epsilon/2,2/\epsilon)\in B$. Entón, \begin{align*} d((0,2/\epsilon),(\epsilon/2,2/\epsilon)) &{}=\sqrt{\Bigl(-\frac{\epsilon}{2}\Bigl)^2+\Bigl(\frac{2}{\epsilon}-\frac{2}{\epsilon}\Bigr)}\\ &{}=\frac{\epsilon}{2} < \epsilon, \end{align*} co que $d(A,B)=0$.