Dinâmica relativística


Até o momento discutimos o movimento de partículas livres e a transformação de seu movimento entre dois referenciais inerciais. Partículas livres descrevem retas em \(M_4\) e estas retas são levadas em outras retas por meio de transformações de Lorentz, já que elas são transformações lineares. Concluímos que, assim como acontece na mecânica clássica sob transformações de Galileu, a inércia não fica alterada de um referencial para outro. Qualquer desvio na linearidade do movimento de uma partícula deve ser atribuído à presença de alguma interação, uma força agindo sobre ela.

Para construir uma dinâmica devemos definir massa e momento sobre esta teoria. Na teoria Newtoniana a massa é uma constante de proporcionalidade entre a aceleração e a força. Na TRE tentamos seguir de perto, tanto quanto possível, as definições e conceitos da mecânica clássica, principalmente tendo em mente que a teoria relativística deve se reduzir à clássica no caso limite de baixas velocidades, em particular no que se refere às leis de conservação.

Construímos, na seção anterior, os quadrivetores
$$
u^{\mu} = \frac{dx^{\mu}}{d \tau} = \left( \gamma c, \gamma v \right), \text{} p^{\mu} = mu^{\mu} = \left( \gamma mc, \gamma mv \right) .
$$

Vimos que as partes espaciais destes quadrivetores se relacionam com a velocidade e o momento linear ordinários em 3 dimensões de forma simples,
$$
u_{\left( 4 \right)}^i = \gamma v_{\left( 3 \right)}^i ; p_{\left( 4
\right)}^i = \gamma p_{\left( 3 \right)}^i .
$$

Gostaríamos agora de explorar um pouco mais o significado do componente temporal \(p^0\) do quadrivetor momento, o que faremos na próxima seção, juntamente com o conceito de força generalizada.

Além dos vetores \(u^{\mu}\) e \(p^{\mu}\) , contruídos à partir da linha mundo \(x^{\mu} \left( \tau \right)\) , podemos definir um terceiro vetor
interessante
$$
K^{\mu} = m \frac{d^2 x^{\mu}}{d \tau} = \frac{dp^{\mu}}{d \tau} =
\frac{d}{d \tau} \left( \gamma mc, \gamma mv \right) .
$$

a chamada força generalizada de Minkowsky.\(\mathbb{}\) Denotaremos o componente espacial desta força de \(\vec{F}\) e portanto \(K = \left( K^0, \vec{F} \right)\). Em particular estamos interessados em descobrir as quantidades que se conservam nesta teoria.

Contraindo a força generalizada e a 4-velocidade podemos obter um esclarecimento sobre \ natureza do componente \(p^0\) do momento. Começamos
por notar que
$$
u^{\mu} K_{\mu} = mu^{\mu} \frac{du_{\mu}}{d \tau} = 0.
$$

A expressão acima se anula pois
$$
0 = \frac{d}{d \tau} \left( u_{\mu} u^{\mu} \right) = u_{\mu}
\frac{du^{\mu}}{d \tau} = \left( \frac{du_{\mu}}{d \tau} \right) u^{\mu} =
2 u_{\mu} \frac{du^{\mu}}{d \tau},
$$

já que \(u_{\mu} u^{\mu} = – c^2\) é uma constante. Observe também que usamos neste cálculo o fato de que \(\eta_{\mu \nu}\) é formado por constantes e portanto
$$
u^{\mu} \frac{du_{\mu}}{d \tau} = u^{\mu} \frac{d \left( \eta_{\mu \nu}
u^{\nu} \right)}{d \tau} = \eta_{\mu \nu} u^{\mu} \frac{du^{\nu}}{d \tau}
= u_{\mu} \frac{du^{\mu}}{d \tau} .
$$

Por outro lado
$$
0 = u^{\mu} K_{\mu} = – \left( u^0 K^0 \right) + u^i K_i = – \gamma cK^0 +
\gamma v^i K_i,
$$

de onde tiramos uma expressão para \(K^0\) ,
$$
K^0 = \frac{1}{c} v^i K_i = \frac{1}{c} \vec{v} . \vec{F} .
$$

Prosseguindo na analogia com o caso clássico relembramos a equação 2. Se \(T\) é a energia cinética de uma partícula então
$$
\frac{dT}{dt} = \vec{F} . \vec{v},
$$

o que sugere a adoção da seguinte notação: fazemos
$$
P^0 = \gamma mc = \frac{E}{c}
$$

e, por conseguinte,
$$
K^0 = \frac{1}{c} \frac{dE}{d \tau},
$$

onde \(E\) é a energia total da partícula, cujo sentido exploraremos em seguida. Usando estas definições temos

(7)

$$
E = \gamma mc^2 \text{e} \vec{p} = \gamma m \vec{v}, \label{emc2}
$$
generalizações da energia e do momento ordinário, podemos escrever o vetor quadri-momento como

(8)

$$
p^{\mu} = \left( \frac{E}{c}, \vec{p} \right) . \label{pmu}
$$
A norma deste vetor é invariante,
$$
p^{\mu} p_{\mu} = – \left( \frac{E}{c} \right)^2 + p^2 = – m^2 c^2,
$$

sendo \(p = \left| \vec{p} \right|\). Uma expressão útil pode ser obtida daí,
$$
E^2 = m^2 c^4 + p^2 c^2,
$$

uma expressão que associa a energia total da partícula com sua massa e velocidade. No referencial comóvel, onde \(\gamma = 1\) e \(p = 0\) temos a famosa equação de Einstein
$$
E = mc^2,
$$

válida, como já indicado, apenas no referencial da partícula. Outra relação interessante pode ser obtida para o caso de baixas velocidades, \(\beta \ll 1\). Neste caso usamos a expansão em séries de potências mantendo apenas os termos mais relevantes para escrever \(\gamma \approx \left( 1 + \beta^2 / 2 \right)\) e a equação 7 para a energia se torna
$$
E = \gamma mc^2 \approx \left( 1 + \frac{\beta^2}{2} \right) mc^2 = mc^2 +
\frac{1}{2} mv^2 .
$$

Para baixas velocidades a energia definida na equação 7 é a energia cinética ordinária mais um termo constante que denominaremos energia de repouso da partícula.

Diversos fenômenos observados confirmam a correção destas expressões. Um exemplo interessante é o da aniquilação de um elétron e um pósitron que resulta na completa aniquilação da massa de repouso das partículas iniciais resultando na emissão de fótons com massa de repouso nula que transportam toda a energia inicial do sistema. Reações atômicas que ocorrem dentro de reatores nucleares ou bombas atômicas se utilizam da fissão nuclear, a quebra de núcleos, para a liberação de grandes quantidades de energia. Os núcleos partidos possuem massa menor que a massa inicial, a diferença sendo liberada sob forma de energia transportada por radiação eletromagnética. Um processo análogo, porém inverso, ocorre no interior das estrelas onde núcleos leves, basicamente hidrogênio e hélio, são fundidos em núcleos mais pesados, resultando na liberação de energia.

Leis de conservação

Na Mecânica Clássica as simetrias do sistema considerado levam às leis de conservação. Um sistema homogêneo por translações de coordenadas exibe conservação do momento linear enquanto sistemas isotrópicos apresentam conservação do momento angular. Se um sistema é homogêneo por translaçãoes temporais então ele possue a energia total conservada.

Na Teoria da Relatividade Especial os escalares são as quantidades conservadas. Escalares são invariantes quando se troca de um sistema de coordenada estabelecido em um referencial inercial para outro sistema inercial. Em um referencial comóvel uma partícula tem o 4-momento
$$
p^{\mu} = \left( m_0 c, \vec{0} \right),
$$

onde \(m_0\) é a chamada massa de repouso da partícula, a massa medida por um observador no referencial comóvel. Calculamos \(p^{\prime \mu}\) obtido por meio de uma transformação de Lorentz sobre o momento anterior
$$
p^{\prime \mu} = \Lambda_{\hspace{0.75em} \alpha}^{\mu} p^{\alpha} = \left[
\begin{array}{cccc}
\gamma & \gamma v / c & \hspace{0.75em} 0 & \hspace{0.75em} 0\\
\gamma v / c & \gamma & \hspace{0.75em} 0 & \hspace{0.75em} 0\\
0 & 0 & \hspace{0.75em} 1 & \hspace{0.75em} 0\\
0 & 0 & \hspace{0.75em} 0 & \hspace{0.75em} 1
\end{array} \right] \left[ \begin{array}{c}
m_0 c\\
0\\
0\\
0
\end{array} \right] = \left[ \begin{array}{c}
\gamma m_0 c\\
\gamma m_0 v\\
0\\
0
\end{array} \right],
$$

ou seja,
$$
p^{\prime \mu} = \gamma \left( m_0 c, \hspace{0.25em} m_0 v
\hspace{0.25em}, 0 \hspace{0.25em}, 0 \right) .
$$

Se pretendemos manter a expressão para o momento como composto por energia e momento, \(p^{\mu} = \left( \frac{E}{C}, \hspace{0.75em} m \mathbf{v} \right)\) teremos então que definir
$$
m = \gamma m_0 = \frac{m_0}{\sqrt{1 – \beta^2}}
$$

que mostra a dilatação da massa para partículas em altas velocidades. Nenhum objeto com massa de repouso não nula pode ser acelerado até uma velocidade igual ou superior à velocidade da luz.

Podemos mostrar que, na TRE, o quadrivetor momento-energia é uma entidade conservada em um sistema de partículas. Definindo a variação total de momento-energia em um referencial como
$$
\Delta p^{\mu} = \left( \sum^n_a p_a^{\mu} \right)_{final} – \left(
\sum^n_a p_a^{\mu} \right)_{inicial}
$$

onde a soma é realizada sobre todas as partículas do sistema. Em outro referencial os momentos são transformados, para cada partícula, da seguinte forma
$$
p_a^{\prime \mu} = \Lambda_{\nu}^{\mu} p_a^{\nu}
$$

e, portanto, a variação total do momento-energia é
$$
\Delta p^{\prime \mu} = \left( \sum^n_a \Lambda_{\nu}^{\mu} p_a^{\nu}
\right)_{final} – \left( \sum^n_a \Lambda_{\nu}^{\mu} p_a^{\nu}
\right)_{inicial} = \Lambda_{\nu}^{\mu} \Delta p^{\nu} = \Delta p^{\mu} .
$$

Isto significa que se a variação total é nula em um referencial então ela será nula em qualquer referencial inercial. Observe que, para concluir isto, seria suficiente afirmar que a variação total, sendo composta por somas de vetores, é também um vetor. Se transformarmos este vetor para o referencial comóvel os componentes de \(\mathbf{p}\) são, como vimos na equação 8, a energia e o momento ordinário, ambos quantidades conservadas em qualquer reação ou interação de forma que a variação total do sistema será \(\Delta p^{\prime \mu} = 0\). Concluimos assim que
$$
\Delta p^{\mu} = 0
$$

em qualquer referencial inercial. Note, no entanto, que o momento e a energia não se conservam isoladamente.

Convenções e notação

O espaço-tempo é denominado \(M_4\) , o espaço de Minkowsky, cujos pontos são os eventos
$$
\mathbf{x =} \left( x^0, x^1, x^2, x^3 \right) \text{ ou, resumidamente, }
\mathbf{x =} \left\{ x^{\mu} \right\} .
$$

Vetores de \(M_4\) são representados por letras em negrito, \(\mathbf{x, u, p}\) enquanto vetores de \(I \hspace{-4pt} R^3\) são representados por meio de setas \(\vec{x} = \left( x, y, z \right)\) ou \(\vec{x} = \left\{ x^i \right\}\).Algumas vêzes é interessante separar o vetor em suas partes temporal e espacial fazendo, por exemplo,
$$
\mathbf{p} = \left( p^0, \vec{p} \right)
$$

Usamos índices gregos como índices do espaço-tempo,
$$
\alpha, \beta, \mu, \nu = 0, 1, 2, 3,
$$

enquanto índices latinos são puramente espaciais:
$$
i, j, k = 1, 2, 3.
$$

\(\left\{ \mathbf{\hat{e}}_{\mu} \right\}\) é a base canônica de \(M_4\), onde \(\mathbf{\hat{e}}_0\) é um vetor unitário puramente temporal e \(\mathbf{\hat{e}}_1 = \hat{\imath}, \mathbf{\hat{e}}_2 = \hat{\jmath}, \mathbf{\hat{e}}_3 = \hat{k}\).A métrica de Minkowsky é \(\eta_{\mu \nu} = \textit{diag} \left( -, +, +, + \right)\). A base canônica \(\left\{ \mathbf{\hat{e}}_{\mu} \right\}\) é ortonormal em relação à métrica de Minkowsky, ou seja

$$
\mathbf{\eta} \left( \mathbf{\hat{e}}_0, \mathbf{\hat{e}}_0 \right) = – 1,
$$

$$
\mathbf{\eta} \left( \mathbf{\hat{e}}_i, \mathbf{\hat{e}}_j \right) = \delta_{ij} .
$$

A convenção de Einstein para o somatório, onde índices repetidos são somados, é adotada em quase todo o texto. Com ela podemos escrever, por exemplo,

$$
ds^2 = \sum^3_{\mu, \nu = 0} dx^{\mu} dx^{\nu} \eta_{\mu \nu} = dx^{\mu}
dx^{\nu} \eta_{\mu \nu} .
$$

Bibliografia

  • Carrol, Sean, M.: Lecture Notes in General Relativity, gr-qc/9712019, Santa Barbara, 1997.
  • Lopes, J. L.: A Estrutura Quântica da Matéria, Editora UFRJ, Rio e Janeiro, 1993.
  • Misner, C., Thorne, K., Wheeler, A.: Gravitation, W. H. Freeman and Co., San Francisco, 1970.
  • Ohanian, H., Ruffini: Gravitation and Spacetime, W. W. Norton & Company, New York, 1994.
  • Ramond, P.: Field Theory, A Modern Primer, Addison-Wesley, New York, 1990.
  • Weinberg, S.: Gravitation and Cosmology, Principles and Applications of General Theory of Relativity, John Wiley and Sons, New York, 1971.

 

Início: TRE

A estrutura do espaço-tempo

Um evento

O espaço onde os fenômenos ocorrem, segundo a TRE, é um espaço vetorial de quatro dimensões que denotaremos por \(M_4\), o espaço de Minkowsky (que é similar ao \(R^4\), mas não euclidiano, como veremos). Cada ponto deste espaço é denominado um evento e será marcado com as coordenadas \((ct, \hspace{0.25em} x, \hspace{0.25em} y, \hspace{0.25em} z)\) que descrevem quando e onde o evento ocorreu. Cada ponto, portanto, pode ser associado a um quadrivetor \(\mathbf{x} = \left\{ x^{\mu} \right\} = \left( ct, \hspace{0.25em} x, \hspace{0.25em} y, \hspace{0.25em} z \right)\).

Com esta definição podemos reescrever a separação infinitesimal na forma
$$
ds^2 = – c^2 dt^2 + dx^2 + dy^2 + dz^2 = – \left( dx^0 \right)^2 + \left(
dx^1 \right)^2 + \left( dx^2 \right)^2 + \left( dx^3 \right)^2 = \eta_{\mu
\nu} dx^{\mu} dx^{\nu}
$$

onde escrevemos

(6)

$$
\eta_{\mu \nu} = \left( \begin{array}{cccc}
– 1 & 0 & 0 & 0\\
\hspace{0.75em} 0 & 1 & 0 & 0\\
\hspace{0.75em} 0 & 0 & 1 & 0\\
\hspace{0.75em} 0 & 0 & 0 & 1
\end{array} \right) . \label{etaMikowsky}
$$
Por construção as transformações de Lorentz deixam invariante este intervalo. Estas transformações, dadas pelas equações 5, podem ser escrita da seguinte forma:
$$
x^{\prime 0} = \gamma \left( x^0 – \frac{v}{c} x^1 \right),
\hspace{1.5em} x^{\prime 2} = x^2
$$

$$
x^{\prime 1} = \gamma \left( x^1 – \frac{v}{c} x^0 \right), \hspace{1.5em} x^{\prime 3} = x^3 .
$$

Em forma matricial temos
$$
\left[ \begin{array}{c}
x^{\prime 0}\\
x^{\prime 1}\\
x^{\prime 2}\\
x^{\prime 3}
\end{array} \right] = \left[ \begin{array}{cccc}
\gamma & – \gamma v / c & \hspace{0.75em} 0 & \hspace{0.75em} 0\\
– \gamma v / c & \gamma & \hspace{0.75em} 0 & \hspace{0.75em} 0\\
0 & 0 & \hspace{0.75em} 1 & \hspace{0.75em} 0\\
0 & 0 & \hspace{0.75em} 0 & \hspace{0.75em} 1
\end{array} \right] \left[ \begin{array}{c}
x^0\\
x^1\\
x^2\\
x^3
\end{array} \right]
$$

ou ainda, em forma compacta,
$$
x^{\prime \mu} = \Lambda_{\nu}^{\mu} x^{\nu}, \hspace{0.75em} \mu = 0, 1, 2, 3;
$$

onde a soma sob o índice \(\nu\) está subentendida. A invariância do intervalo, \(ds^{\prime 2} = ds^2\) , implica em
$$
\eta_{\mu \nu} dx^{\prime \mu} dx^{\prime \nu} = \eta_{\mu \nu}
\Lambda_{\hspace{0.3em} \alpha}^{\mu} dx^{\alpha} \Lambda_{\hspace{0.3em}
\beta}^{\nu} dx^{\beta} = \eta_{\mu \nu} dx^{\mu} dx^{\nu}
$$

e, por conseguinte, vale
$$
\eta_{\mu \nu} \Lambda_{\hspace{0.3em} \alpha}^{\mu}
\Lambda_{\hspace{0.3em} \beta}^{\nu} = \eta_{\alpha \beta} .
$$

A exigência da invariância entre separações de eventos define uma métrica \(\eta\) no espaço-tempo, a chamada métrica de Minkowsky. Tomando \(\mathbf{x}\) e \(\mathbf{y}\) como vetores de \(M_4\) defnimos uma aplicação bilinear e simétrica satisfazendo

  • \(\mathbf{\eta} \left( \mathbf{x}, \mathbf{x} \right) = \left|
    \mathbf{x} \right|^2\) , onde \(\left| \mathbf{x} \right|\) é a norma ou comprimento de \(\mathbf{x}\)
  • \(\mathbf{\eta} \left( \mathbf{x}, \mathbf{y} \right) = \mathbf{\eta}
    \left( \mathbf{y, x} \right)\)
  • \(\eta \left( \mathbf{x}, \mathbf{x} \right) \hspace{0.75em} \left\{
    \begin{array}{c}
    = 0\\
    > 0\\
    < 0
    \end{array} \right. \begin{array}{c}
    \hspace{0.75em} \text{separação tipo luz,}\\
    \hspace{0.75em} \text{tipo espaço,}\\
    \hspace{0.75em} \text{tipo tempo.}
    \end{array}\)
Tipo de vetores

Observe, no entanto, que ela não é positiva como a métrica euclidiana, definida pelo produto interno ou produto escalar. Dizemos que \(M_4\) é um
espaço pseudo-euclidiano. Usando como base de \(M_4\) os vetores \(\left\{ \mathbf{\hat{e}}_{\mu} \right\} = \left\{ \hat{t}, \hat{\imath}, \hat{\jmath},
\hat{k} \right\}\) podemos obter os componentes da métrica
$$
\eta_{\mu \nu} = \mathbf{\eta} \left( \mathbf{\hat{e}}_{\mu} \mathbf{,
\hat{e}_{\nu}} \right) = \left\{
\begin{array}{cl}
\mathbf{\eta} \left( \mathbf{\hat{e}}_0 \mathbf{, \hat{e}_0} \right) & =
– 1\\
\mathbf{\eta} \left( \mathbf{\hat{e}}_i \mathbf{, \hat{e}}_j \right) & =
\delta_{ij}\\
\mathbf{\eta} \left( \mathbf{\hat{e}}_0 \mathbf{, \hat{e}}_i \right) & =
0.
\end{array} \right. .
$$

São estes os componentes já exibidos na equação (5).

Observe que dois eventos ligados por um feixe de luz, como a emissão e captação de um fóton, por exemplo, estão separados por uma distância nula, ou seja, um vetor não nulo pode ter comprimento nulo. Para ver isto fazemos
$$
ds^2 = – c^2 dt^2 + dx^2 + dy^2 + dz^2 =
$$

$$
= dt^2 \left[ – c^2 + \frac{dx^2}{dt^2} + \frac{dy^2}{dt^2} +
\frac{dz^2}{dt^2} \right] = dt^2 \left[ – c^2 + v^2 \right] = 0
$$

já que para o fóton \(v = c. \hspace{0.75em}\) Observe ainda que um vetor pode ter norma negativa ou, ainda, um vetor não nulo pode ter norma nula.
Este é o caso de vetores sobre o cone de luz
$$
– c^2 t^2 + x^2 + y^2 + z^2 = 0,
$$

Figura 6: Cone de luz

ilustrado na figura 6. A partir de um evento colocado na origem \(O\), o espaço fica dividido em três regiões distintas: o futuro e o passado de \(O\) , dentro do cone, e uma região sem conexão causal com \(O\).

O passado é composto por pontos onde ocorreram eventos que podem influenciar o evento em \(O\) por meio de alguma interação causal. Por outro lado \(O\) pode influenciar todos os eventos dentro do cone do futuro. Nenhum evento fora do cone pode afetar \(O\) nem ser por ele afetado pois não podem estar conectados por nenhuma interação com velocidade menor ou igual à da luz. A velocidade da luz é uma velocidade limite para a transmissão de qualquer informação dentro do panorama de Relatividade Especial.

Vetores e tensores de M4

(8) Com frequência usaremos um abuso de linguagem, comum na literatura, dizendo que o vetor \(\mathbf{x}\) é simplesmente \(x^{\mu}\).

O espaço-tempo é um espaço vetorial de quatro dimensões onde a métrica ou produto interno foi definido de modo a manter invariante a separação entre eventos. Se \(\mathbf{x} \in M_4\) então \(\mathbf{x =} x^{\mu} \mathbf{\hat{e}}_{\mu}\). Usaremos a notação(8)
$$
\mathbf{x =} \left( x^0, x^1, x^2, x^3 \right) \text{ ou, abreviadamente, } \mathbf{x =} \left\{ x^{\mu} \right\} .
$$

Observe que \(\mathbf{x}\) é um objeto geométrico que nada tem a ver com o sistema de coordenadas escolhido enquanto enquanto os componentes \(x^{\mu}\) dependem da escolha da base \(\left\{ \mathbf{\hat{e}}_{\mu} \right\}\) e, portanto, do sistema de coordenadas utilzado. De acordo com a definição da norma temos
$$
\left| \mathbf{x} \right|^2 = \mathbf{\eta} \left( \mathbf{x}, \mathbf{x}
\right) = \mathbf{\eta} \left( x^{\mu} \mathbf{\hat{e}}_{\mu}, x^{\nu}
\mathbf{\hat{e}}_{\nu} \right) = x^{\mu} x^{\nu} \mathbf{\eta} \left(
\mathbf{\hat{e}}_{\mu}, \mathbf{\hat{e}}_{\nu} \right) = x^{\mu} x^{\nu}
\eta_{\mu \nu}
$$

e, portanto, \(\mathbf{x}\) tem comprimento invariante sob transformações de Lorentz. Diremos que \(x^{\mu}\) são os componentes contravariantes do vetor enquanto
$$
x_{\mu} = \eta_{\mu \nu} x^{\nu}
$$

são os componentes covariantes. Observe que \(x_0 = \eta_{0 \nu} x^{\nu} = – x^0\) e que, com esta notação,
$$
\left| \mathbf{x} \right|^2 = x^{\mu} x_{\mu} = – \left( x^0 \right)^2 +
x^i x_i = – \left( x^0 \right)^2 + \vec{x} \cdot \vec{x} .
$$

Se definirmos como \(\eta^{\mu \nu}\) como os componentes da matriz inversa de \(\mathbf{\eta,}\) de forma que
$$
\mathbf{\eta}^{- 1} \mathbf{\eta = I} \Rightarrow \eta^{\mu \alpha}
\eta_{\alpha \nu} = \delta_{\nu}^{\mu}
$$

então podemos retornar aos componentes contravariantes fazendo
$$
x^{\mu} = \eta^{\mu \nu} x_{\nu} .
$$

Definiremos como vetores de \(M_4\) todas as quantidades que se transformam da mesma forma que \(\mathbf{x.}\) O comprimento de todos os vetores, assim como o produto interno de dois vetores
$$
\mathbf{\eta} \left( \mathbf{u}, \mathbf{v} \right) = \mathbf{\eta} \left(
u^{\mu} \mathbf{\hat{e}}_{\mu}, v^{\nu} \mathbf{\hat{e}}_{\nu} \right) =
u^{\mu} v^{\nu} \mathbf{\eta} \left( \mathbf{\hat{e}}_{\mu},
\mathbf{\hat{e}}_{\nu} \right) = u^{\mu} v^{\nu} \eta_{\mu \nu} = u^{\mu}
v_{\mu},
$$

denominado a contração de \(\mathbf{u}\) e\(\mathbf{v,}\) são escalares, independentes do sistema de referência. Em particular será útil definir os vetores velocidade e momento, o que faremos a seguir.

Uma trajetória em \(M_4\) é uma curva parametrizada também chamada de linha mundo da partícula,
$$
P \left( \tau \right) = \mathbf{x} \left( \tau \right) = x^{\mu} \left(
\tau \right) \mathbf{\hat{e}}_{\mu},
$$

onde \(\tau\) é um parâmetro qualquer embora, com frequência, seja conveniente usar o tempo próprio. Como \(\mathbf{x}\) é um vetor de \(M_4\) então
$$
\mathbf{u =} \frac{d \mathbf{x}}{d \tau} = \frac{dx^{\mu}}{d \tau}
\mathbf{\hat{e}}_{\mu} = u^{\mu} \mathbf{\hat{e}}_{\mu}
$$

onde definimos
$$
u^{\mu} = \frac{dx^{\mu}}{d \tau} .
$$

\(\mathbf{u,}\) a quadri-velocidade, é também um vetor, tangente à linha mundo. Seus componentes são
$$
u^0 = \frac{dx^0}{d \tau} = \frac{cdt}{d \tau} = \frac{c}{\sqrt{1 –
\beta^2}},
$$

$$
u^i = \frac{dx^i}{d \tau} = \frac{dt}{d \tau} \frac{dx^i}{dt} =
\frac{v^i}{\sqrt{1 – \beta^2}} .
$$

Portanto
$$
\mathbf{u} = \left( \frac{c}{\sqrt{1 – \beta^2}}, \frac{v_x}{\sqrt{1 –
\beta^2}}, \frac{v_y}{\sqrt{1 – \beta^2}}, \frac{v_z}{\sqrt{1 – \beta^2}}
\right) = \gamma \left( c, \hspace{0.75em} \vec{v} \right) .
$$

A partir desta velocidade construimos outro vetor paralelo à 4-velocidade, o 4-momento
$$
\mathbf{p =} m \mathbf{u} = mu^{\mu} \mathbf{\hat{e}}_{\mu},
$$

onde \(m\) é a massa da partícula. Seus componentes são
$$
\mathbf{p} = \left( \frac{mc}{\sqrt{1 – \beta^2}}, \frac{m \vec{v}}{\sqrt{1
– \beta^2}} \right) = m \gamma \left( c, \sim \vec{v} \right) .
$$

No referencial comóvel \(\vec{v} = 0\) e \(\gamma = 1\) e, portanto, estes vetores assumem as formas particulares
$$
u^{\mu} = \left( c, \vec{0} \right) \hspace{1.5em} \text{ e } \hspace{1.5em} p^{\mu} = \left( mc, \vec{0}
\right) .
$$

Como se verá \(\mathbf{p}\) é uma constante do movimento enquanto o momento linear tridimensional \(\vec{p} = m \vec{v} \mathbf{,}\) que é uma quantidade conservada classicamente, não se conserva na TRE. As normas de \(\mathbf{u}\) e\(\mathbf{p,}\) em qualquer referencial inercial, são
$$
\left| \mathbf{u} \right|^2 \mathbf{=} u^{\mu} u_{\mu} = – \left( u^0
\right)^2 + u^i u_i = \gamma^2 \left( – c^2 + v^2 \right) = \frac{- c^2 +
v^2}{1 – \beta^2} = – c^2 ;
$$

$$
\left| \mathbf{p} \right|^2 = p^{\mu} p_{\mu} = m^2 u^{\mu} u_{\mu} = – m^2
c^2 .
$$

Daremos a seguir a definição de tensores do espaço-tempo. O mais simples do stensores é um escalar, um tensor de ordem zero. Escalares são invariantes sob transformações de Lorentz, como ocorre com a separação de eventos \(ds^2\) , com o tempo próprio \(\tau\) , ou com a norma do vetor quadrivelocidade, \ \(\left| \mathbf{u} \right|^2 = – c^2\).

Um vetor é um tensor de ordem um, um objeto de quatro componentes que se transforme como \(x^{\mu}\) :
$$
A^{\prime \mu} = \Lambda_{\nu}^{\mu} A^{\nu} .
$$

O vetor quadri-velocidade e o quadri-momento são exemplos. Um tensor mais geral, de ordem \(r\) é um objeto com \(4^r\) componentes que se transforma deacordo com
$$
A^{\prime \alpha \beta \ldots \gamma} = \Lambda_{\mu}^{\alpha}
\Lambda_{\nu}^{\beta} \ldots \Lambda_{\rho}^{\gamma} A^{\mu \nu \ldots
\rho} .
$$

Um exemplo é o tensor formada pelo produto externo \(x^{\mu} x^{\nu}\).

 

Dinâmica Relativística

As transformações de Lorentz


A teoria da relatividade afirma que observadores em movimento relativo concordam quanto à forma das equações que descrevem os fenômenos observados. é necessário então descobrir a lei de transformação que leva à descrição feita em um referencial para o outro. Matematicamente esta é uma transformação particular de coordenadas, que passamos a explorar.

Suponhamos que dois observadores em movimento relativo analisam um pulso de luz. Cada observador está em repouso nos referenciais \(S\) e \(S^{\prime}\) com origens respectivamente em \(O\) e \(O^{\prime} . \hspace{0.75em} S^{\prime}\) se move com velocidade \(v\) no direção do eixo \(Ox\) em relação a \(S\). Como a velocidade da luz é a mesma em todos os referenciais inerciais, o que foi demonstrado pelo experimento de Michelson-Morley, os observadores devem ver o pulso de luz se afastando de forma esférica. Se isto não fosse verdade um dos observadores seria capaz de determinar seu movimento relativo em relação ao outro, o que contradiz o princípio da relatividade. Consideremos ainda dois eventos infinitesimalmente próximos ligados por este raio de luz. Para os observadores em \(S\) e \(S^{\prime}\) estes eventos estarão separados por \(ds^{\prime}\) e \(ds^{\prime,}\) respectivamente dados por
$$
ds^2 = – dt^2 + dx^2 + dy^2 + dz^2,
$$

$$
ds^{\prime 2} = – dt^{\prime 2} + dx^{\prime 2} + dy^{\prime 2} +
dz^{\prime 2} .
$$

(5) Na verdade esta conclusão é uma inferência. Experimentalmente não é possível
observar o movimento de uma partícula em um ambiente totalmente livre de campos de força.

(6) Transformação lineares levam retas em retas.

Devido à invariância da velocidade da luz estas separação deverão ser iguais, \(ds^{\prime 2} = ds^2\). Observamos que a transformação de Galileu não deixa invariante uma frente de onda de luz que satisfaz, no referencial em repouso com relação à fonte, a equação \(x^2 + y^2 + z^2 = c^2 t^2\). Sabemos da observação(5) que partículas livres seguem trajetórias que são linhas retas e isto deve ser preservado em qualquer referencial inercial. Procuramos então uma transformação linear(6) na forma de
$$
\begin{array}{cl}
x^{\prime} & = \alpha x + \mu t\\
y^{\prime} & = y\\
z^{\prime} & = z\\
t^{\prime} & = \lambda x + \delta t,
\end{array}
$$

onde \(\alpha, \hspace{0.75em} \beta, \hspace{0.75em} \gamma \hspace{0.75em} \text{e} \hspace{0.75em} \delta \hspace{0.75em} \)
são constantes a determinar. Sem perda de generalidade podemos colocar o observador fixo na origem de \(S^{\prime}\) e, portanto, sua
coordenada \(x^{\prime} = 0\) enquanto \(x\) será sua coordenada do ponto de vista do observador em \(S\). Como consequência
$$
x^{\prime} = \alpha x + \mu t = 0 \Rightarrow \frac{x}{t} = v = –
\frac{\mu}{\alpha} .
$$

Já um observador fixo na origem de \(S\) \(\left( x = 0 \right)\) terá em \( S^{\prime} \) as coordenadas
$$
x^{\prime} = – \alpha vt ; \hspace{0.75em} t^{\prime} = \delta t.
$$

O referencial \(S\) se afasta de \(S^{\prime}\) com velocidade \(– v\) e
$$
\frac{x^{\prime}}{t^{\prime}} = – v = – \frac{\alpha}{\delta} v
$$

e, portanto \(\alpha = \delta\). Resta descobrir \(\alpha\) e \(\gamma\) na transformação
$$
\begin{array}{cl}
x^{\prime} & = \alpha \left( x – vt \right)\\
t^{\prime} & = \lambda x + \alpha t.
\end{array}
$$

Para o observador em \(S^{\prime}\) a frente de onda será vista como
$$
x^{\prime 2} + y^{\prime 2} + z^{\prime 2} = c^2 t^{\prime 2} \Rightarrow
\alpha^2 \left( x – vt \right)^2 + y^2 + z^2 = c^2 \left( \lambda x +
\alpha t \right)^2 \Rightarrow
$$

$$
x^2 \left( \alpha^2 – \lambda^2 c^2 \right) + y^2 + z^2 – 2 xt \left(
\alpha^2 v + c^2 \alpha \lambda \right) = c^2 t^2 \left( \alpha^2 –
\alpha^2 v^2 / c^2 \right) .
$$

Para igualarmos esta expressão à \(x^2 + y^2 + z^2 = c^2 t^2\) devemos ter
$$
\alpha^2 – \lambda^2 c^2 = 1 ; \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \alpha^2 – \alpha^2 v^2 / c^2 ;
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \alpha^2 v
+ c^2 \alpha \lambda = 0,
$$

cuja solução é
$$
\alpha = \frac{1}{\sqrt{1 – \left( v / c \right)^2}}, \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \lambda = \frac{- v /
c^2}{\sqrt{1 – \left( v / c \right)^2}} .
$$

As transformações de coordenadas que deixam invariante a frente de onda luminosa são as chamadas transformações de Lorentz e são dadas por

(5)

$$
x^{\prime} = \frac{x – vt}{\sqrt{1 – \left( v / c \right)^2}},
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} y^{\prime} = y
$$

$$
t^{\prime} = \frac{t – vx / c^2}{\sqrt{1 – \left( v / c \right)^2}},
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em} z^{\prime} =
z. \label{TransfLorentz}
$$
As transformações inversas, para se transformar a descrição do referencial \(S^{\prime}\) para \(S\) , pode ser obtida simplesmente lembrando que \(S\) se move com velocidade \(– v\) em relação a \(S^{\prime}\). Portanto
$$
x = \frac{x^{\prime} + vt^{\prime}}{\sqrt{1 – \left( v / c \right)^2}},
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} y = y^{\prime}
$$

$$
t = \frac{t^{\prime} + vx^{\prime} / c^2}{\sqrt{1 – \left( v / c
\right)^2}}, \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} z = z^{\prime} .
$$

Revisando a contração espacial e dilatação temporal

Uma vez obtidas as transformações de Lorentz os efeitos da contração espacial e dilatação \ temporal se tornam mais fáceis de serem verificados. Suponha por exemplo, que queremos medir o comprimento de uma régua que tem uma ponta em \(x_1\) e a outra em \(x_2\). No referencial de repouso seu comprimento será
$$
L_0 = x_2 – x_1 .
$$

Para um observador em movimento, com velocidade \(v\) ao longo do comprimento da régua, seu comprimento será
$$
L = x_2^{\prime} \left( t^{\prime} \right) – x_1^{\prime} \left( t^{\prime}
\right) .
$$

Observe que as medidas de cada ponto devem ser feitas no mesmo instante, \(t^{\prime}\). De acordo com a transformação de Lorentz temos
$$
x^{\prime} = \gamma \left( x – vt \right) \Rightarrow x = \gamma \left(
x^{\prime} + vt^{\prime} \right)
$$

e, portanto,
$$
\begin{array}{cl}
x_2 = & \gamma \left( x_2^{\prime} + vt^{\prime} \right)\\
x_1 = & \gamma \left( x_1^{\prime} + vt^{\prime} \right)
\end{array} .
$$

Dai podemos concluir que o observador em movimento mede um comprimento \(L\) para a régua menor que o medido no referencial de repouso:
$$
L_0 = x_2 – x_1 = \gamma \left( x_2^{\prime} – x_1^{\prime} \right) =
\gamma L.
$$

Invariância da equação de onda

Um exercício interessante pode ser feito para mostrar que a equação a equação de onda para a luz é invariante sob a transformação de Lorentz. Das equações de Maxwell se pode deduzir que a luz obedece a equação
$$
\left[ \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2} +
\frac{\partial^2}{\partial z^2} – \frac{1}{c^2} \frac{\partial^2}{\partial
t^2} \right] \Phi \left( x, y, z, t \right) = 0,
$$

que é a equação de onda se propagando com velocidade \(c\). Em um referencial em movimento \(S^{\prime}\) teremos
$$
\left[ \frac{\partial^2}{\partial x^{\prime 2}} +
\frac{\partial^2}{\partial y^{\prime 2}} + \frac{\partial^2}{\partial
z^{\prime 2}} – \frac{1}{c^2} \frac{\partial^2}{\partial t^{\prime 2}}
\right] \Phi \left( x^{\prime}, y^{\prime}, z^{\prime}, t^{\prime} \right)
= 0
$$

sendo que \(\Phi\) é um escalar, satisfazendo portanto \(\Phi \left( x, y, z, t \right) = \Phi \left( x^{\prime}, y^{\prime}, z^{\prime}, t^{\prime} \right)\). Para simplificar as operações vamos considerar o caso de uma onda plana, com propagação na direção de \(x\) apenas, descrita por \(\Phi \left(x, t \right)\). Para relacionar as derivadas temos
$$
x^{\prime} = \gamma \left( x – vt \right) ; \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} t^{\prime} = \gamma \left( t – vx / c^2
\right),
$$

e, portanto, as derivadas espaciais e temporal em termos das novas
variáveis:
$$
\frac{\partial \Phi}{\partial x} = \frac{\partial \Phi}{\partial
x^{\prime}} \frac{\partial x^{\prime}}{\partial x} + \frac{\partial
\Phi}{\partial t^{\prime}} \frac{\partial t^{\prime}}{\partial x} = \gamma
\frac{\partial \Phi}{\partial x^{\prime}} – \frac{\gamma v}{c^2}
\frac{\partial \Phi}{\partial t^{\prime}},
$$

$$
\frac{\partial \Phi}{\partial t} = \frac{\partial \Phi}{\partial
x^{\prime}} \frac{\partial x^{\prime}}{\partial t} + \frac{\partial
\Phi}{\partial t^{\prime}} \frac{\partial t^{\prime}}{\partial t} = –
\gamma v \frac{\partial \Phi}{\partial x^{\prime}} + \gamma \frac{\partial
\Phi}{\partial t^{\prime}} .
$$

Os operadores derivadas se relacionam, nos dois sistemas de coordenadas, da seguinte forma:
$$
\frac{\partial}{\partial x} = \gamma \frac{\partial}{\partial x^{\prime}} –
\frac{\gamma v}{c^2} \frac{\partial}{\partial t^{\prime}} ;
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \frac{\partial}{\partial t}
= – \gamma v \frac{\partial}{\partial x^{\prime}} + \gamma
\frac{\partial}{\partial t^{\prime}} .
$$

Podemos construir a regra de transformação para as derivadas segundas,
$$
\frac{\partial^2}{\partial x^2} = \frac{\partial}{\partial x} \left(
\frac{\partial}{\partial x} \right) = \left( \gamma
\frac{\partial}{\partial x^{\prime}} – \gamma \frac{v}{c^2}
\frac{\partial}{\partial t^{\prime}} \right) \left( \gamma
\frac{\partial}{\partial x^{\prime}} – \gamma \frac{v}{c^2}
\frac{\partial}{\partial t^{\prime}} \right) =
$$

$$
= \gamma^2 \left( \frac{\partial^2}{\partial x^{\prime 2}} – \frac{2
v}{c^2} \frac{\partial^2}{\partial x^{\prime} \partial t^{\prime}} +
\frac{v^2}{c^4} \frac{\partial^2}{\partial t^{\prime 2}} \right) ;
$$

$$
\frac{\partial^2}{\partial t^2} = \frac{\partial}{\partial t} \left(
\frac{\partial}{\partial t} \right) = \left( – \gamma v
\frac{\partial}{\partial x^{\prime}} + \gamma \frac{\partial}{\partial
t^{\prime}} \right) \left( – \gamma v \frac{\partial}{\partial x^{\prime}}
+ \gamma \frac{\partial}{\partial t^{\prime}} \right) =
$$

$$
= \gamma^2 \left( v^2 \frac{\partial^2}{\partial x^{\prime 2}} – 2 v
\frac{\partial^2}{\partial x^{\prime} \partial t^{\prime}} +
\frac{\partial^2}{\partial t^{\prime 2}} \right) .
$$

Escrevendo a equação de onda no referencial em movimento temos
$$
\left[ \frac{\partial^2}{\partial x^2} – \frac{1}{c^2}
\frac{\partial^2}{\partial t^2} \right] \Phi = 0 \Rightarrow
$$

$$
\gamma^2 \left[ \frac{\partial^2 \Phi}{\partial x^{\prime 2}} \left( 1 –
\frac{v^2}{c^2} \right) – \frac{1}{c^2} \frac{\partial^2 \Phi}{\partial
t^{\prime 2}} \left( 1 – \frac{v^2}{c^2} \right) \right] = 0,
$$

ou, simplesmente,
$$
\frac{\partial^2 \Phi}{\partial x^{\prime 2}} – \frac{1}{c^2}
\frac{\partial^2 \Phi}{\partial t^{\prime 2}} = 0,
$$

o que mostra a invariância da equação de onda sob transformações de Lorentz. De fato se pode mostrar que as equações de Maxwell são invariantes sob estas transformações. Lorentz deduziu corretamente a formas destas transformações à partir das equações do eletromagnetismo, mas não foi capaz de aplicá-las ao uso da mecânica, como fez Einstein.

Transformação de velocidades

A partir das transformações de Lorentz
$$
x^{\prime} = \gamma \left( x – vt \right), \hspace{0.75em} \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} y^{\prime} = y, \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} z^{\prime} = z,
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em} t^{\prime}
= \gamma \left( t – vx / c^2 \right),
$$

podemos obter uma expressão para a relação entre velocidades nos dois referenciais inerciais. Denotamos por
$$
u_x = dx / dt \text{e} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
u_x^{\prime} = dx^{\prime} / dt^{\prime}
$$

as velocidades em \(S\) e \(S^{\prime}\) respectivamente e calculamos as diferenciais
$$
dx^{\prime} = \gamma \left( dx – vdt \right), \hspace{0.75em}
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} dy^{\prime} = dy,
\hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em} dz^{\prime}
= dz, \hspace{0.75em} \hspace{0.75em} \hspace{0.75em} \hspace{0.75em}
dt^{\prime} = \gamma \left( dt – v / c^2 dx \right) .
$$

O componente em \(x\) da velocidade é
$$
u_x^{\prime} = \frac{dx^{\prime}}{dt^{\prime}} = \frac{dx – vdt}{dt – v /
c^2 dx} = \frac{u_x – v}{1 – v / c^2 u_x} .
$$

Na última igualdade dividimos numerador e denominador por \(dt\). Da mesma forma podemos encontrar o componente \(y\) ,
$$
u_y^{\prime} = \frac{dy^{\prime}}{dt^{\prime}} = \frac{dy}{\gamma \left( dt
– v / c^2 dx \right)} = \frac{u_y}{\gamma \left( 1 – v / c^2 u_x \right)},
$$

e o componente \(z\) ,
$$
u_z^{\prime} = \frac{dz^{\prime}}{dt^{\prime}} = \frac{dz}{\gamma \left( dt
– v / c^2 dx \right)} = \frac{u_z}{\gamma \left( 1 – v / c^2 u_x \right)} .
$$

Isto mostra que os vetores velocidades não se somam da mesma forma que na mecânica de Newton.

Exemplo: Uma partícula A se move com velocidade \(v_A = 0, 5 c\) no referencial do laboratório, e emite uma partícula B
com velocidade \(v_B = 0, 5 c\) em relação à sua própria velocidade. Qual a velocidade \(W\) da partícula B no laboratório? O laboratorio tem velocidade \(– v_A\) em relação a partícula:
$$
W = \frac{v_A + v_B}{1 + v_A v_B / c^2} = \frac{c}{1 + \left( 0, 5
\right)^2} = 0, 8 c.
$$

Tempo Próprio

Vimos que as medidas do tempo variam com a velocidade do observador que analisa o fenômeno sob consideração. O tempo próprio \(\tau\) de uma partícula é definido como o tempo medido por um observador que se move junto com a partícula, no chamado referencial comóvel. Neste caso \(dx = dy = dz = 0\) para o este observador. Como a separação em \(M_4\) é invariante temos, em comparação com um outro observador qualquer, temos que
$$
ds^2 = – c^2 d \tau^2 = – c^2 dt^2 + dx^2 + dy^2 + dz^2,
$$

ou seja,
$$
d \tau^2 = dt^2 – \frac{1}{c^2} \left( dx^2 – dy^2 – dz^2 \right) = \left(
1 – \frac{v^2}{c^2} \right) dt^2,
$$

onde foi feita a substituição
$$
v^2 = \left( \frac{dx}{dt} \right)^2 + \left( \frac{dy}{dt} \right)^2 +
\left( \frac{dz}{dt} \right)^2,
$$

sendo \(v\) a velocidade relativa entre os dois referenciais e, por conseguinte, a velocida da partícula estudada pelo observador não comóvel. Podemos ainda escrever
$$
d \tau = dt \sqrt{1 – \left( v / c \right)^2} = dt \sqrt{1 – \beta^2}
$$

e, como consequência
$$
\frac{dt}{d \tau} = \frac{1}{\sqrt{1 – \beta^2}} .
$$

O tempo próprio é um escalar
$$
d \tau^2 = \frac{- 1}{c^2} ds^2
$$

e portanto invariante sob mudanças de coordenadas que satisfazem as transformações de Lorentz. Por este motivo é um bom candidato a ser usado como parâmetro nas equações do movimento.

 

A estrutura do espaço-tempo

Consequências da invariância da velocidade da luz


Como veremos, a simples exigência de que a velocidade da luz seja a mesma quando medida por um observador em um referencial inercial qualquer implica em profundas consequências tanto para o entendimento da mecânica quanto da estrutura do espaço-tempo.

Simultaneidade

Considere a situação ilustrada na figura 2. Dois eventos ocorrem em \(P\) e \(P^{\prime}\) igualmente distantes do observador \(O\) que está em repouso. Está observador poderá, por exemplo, coletar luz emitida pelos eventos e concluirá que os eventos foram simultâneos.

Figura 2

Outro observador \(O^{\prime}\) está em movimento na direção da separação entre os eventos. Como os sinais de luz levam algum tempo para alcançá-lo ele terá se deslocado de \(\Delta x\) na direção de \( P^{\prime}\) e, portanto, afirmará que \(P^{\prime}\) ocorreu antes que \(P\). Isto mostra que a simultaneidade não é um conceito absoluto. No entanto um observador em movimento transversal com relação à separação \(PP^{\prime}\), com qualquer velocidade, afirmará que os eventos ocorreram ao mesmo tempo.

Dilatação temporal

Na apresentação da TRE Einstein muitas vezes considerou necessário descrever uma forma operacional para se medir uma determinada quantidade. Para medir um intervalo de tempo, por exemplo, nada melhor que construir um relógio de luz, dada a constância de sua velocidade para todos os referenciais inerciais. Considere que dois observadores medem um intervalo de tempo, um deles no referencial \(O\) que se move com velocidade v em relação a \(O^{\prime}\). Um sinal de luz é emitido do ponto \(P_1\) , refletido por um espelho e coletado de volta em \(P_2\) ,como ilustrado na figura 3.

Figura 3

O observador \(O\) carrega consigo o relógio de luz e verifica que o tempo completo de ida e volta do sinal de luz é \(T = 2 \Delta t\) onde
$$ \Delta t = \frac{L}{c} . $$

O observador \(O^{\prime}\) , por sua vez, vê o relógio passar com velocidade \(v\) e medirá um intervalo de tempo \(T^{\prime} = 2 \Delta t^{\prime}\). Observe na figura que, pelo teorema de Pitágoras, temos
$$
L^{\prime 2} + \left( v \Delta t^{\prime} \right)^2 = \left( c \Delta
t^{\prime} \right)^2
$$

e, portanto,
$$
L^{\prime 2} = \Delta t^{\prime 2} \left( c^2 – v^2 \right) .
$$

Concluimos dai que
$$
\Delta t^{\prime} = \frac{L^{\prime}}{\sqrt{c^2 – v^2}} =
\frac{L^{\prime}}{c} \frac{1}{\sqrt{1 – \left( v / c \right)^2}} .
$$

Observe que \(L^{\prime} = L\) , pois não há ambiguidade no comprimento de distâncias perpendiculares à direção do movimento, logo
$$
T = \frac{2 L}{c}, \hspace{0.75em} T^{\prime} = \frac{2 L}{c}
\frac{1}{\sqrt{1 – \left( v / c \right)^2}} .
$$

Concluimos que
$$
T^{\prime} = \frac{T}{\sqrt{1 – \left( v / c \right)^2}},
$$
ou seja, o observador \(O^{\prime}\) mede intervalos de tempo maiores para o relógio em movimento, se comparado com as medidas do observador \(O\) , que está em repouso em relação ao relógio.

Contração espacial

Colocamos agora uma régua para medir a distância entre \(P_1\) e \(P_2\) nos dois referenciais. No primeiro caso ilustrado na figura 4, um observador \(O^{\prime}\) em repouso em relaçao à régua vê o feixe de luz ser emitido em \(P_1\) e recoletado em \(P_2\).

Figura 4

Como, para este observador, o intervalo de tempo gasto pela luz para percorrer o trajeto de ida é volta é \(T^{\prime}\), dado pela equação 3, a distância medida é \(R_0 =\) \(\overline{P_1 P_2} = vT^{\prime}\). Do ponto de vista do observador em \(O\) o relógio está fixo enquanto régua se move com velocidade \(– v\) e o tempo envolvido é \(T\). Portanto a distância percorrida é \( R = vT. \) Como conclusão os dois observadores medem uma distância diferente, relacionadas por
$$
\frac{R_0}{R} = \frac{T^{\prime}}{T} = \frac{1}{\sqrt{1 – \left( v / c
\right)^2}},
$$

o que representa uma contração espacial no sentido do movimento. O observador em movimento em relação à régua, vê seu comprimento como
$$
R = \sqrt{1 – \left( v / c \right)^2} R_0,
$$

onde \(R_0\) é o comprimento obtido por um observador parado em relação à régua.

é costume se definir os seguintes termos para o uso no contexto da TRE. A velocidade relativa do referencial ou objeto em estudo é
$$
\beta = \frac{v}{c},
$$

enquando

(4)

$$
\gamma = \frac{1}{\sqrt{1 – \left( \frac{v}{c} \right)^2}} =
\frac{1}{\sqrt{1 – \beta^2}} . \label{Gamma}
$$
Com estas definições podemos escrever
$$
T^{\prime} = \gamma T^{\prime}, \text{} R^{\prime} = R \sqrt{1 – \beta^2} .
$$

Concluímos que dois observadores em movimento relativo obtém diferentes resultados para medidas de intervalos de tempo e de distância ao longo do movimento. Cada observador verá as réguas do outro com menores comprimentos e seus relógios batendo mais devagar. Este fenômeno é irrelevante para os objetos da experiência diária, que têm velocidades pequenas se comparadas à da luz. No entanto dentro de aceleradores de partículas é possível acelerar partículas até velocidades muito próximas de \(c\) e, nesta situação, os efeitos relativísticos se tornam importantes.

(4) Como veremos mais tarde, a velocidade da luz não pode ser atingida por uma partícula com massa não nula.

Inúmeros exemplos podem ser citados como comprovação experimental destes resultados. Dentro dos aceladores de partículas são produzidas partículas \(\tau\) (tau), que têm meia-vida aproximada de \(3, 05 \times 10^{- 13}\) s quando observadas por um observador em repouso no referencial do laboratório. Elas se apresentam com velocidades muito altas, bem próximas da velocidade da luz(4). Portanto, estas partículas não pode viajar em média uma distância superior a
$$
d = 3 \times 10^8 \hspace{0.25em} \text{m.s}^{- 1} \times 3, 05 \times
10^{- 13} \hspace{0.25em} \text{s} = 9, 15 \times 10^{- 5} \hspace{0.25em}
\text{m},
$$

antes que decaiam sob a forma de outras partículas. No entanto se observa que elas viajam por distâncias muito superiores a esta! A solução para o aparente paradoxo está na TRE. No referencial do laboratório as partículas estão em altas velocidades e por isto seus relógios internos batem mais devagar, permitindo uma viagem mais longa antes do decaimento. Para um referencial colocado sobre as partículas, o chamado referencial comóvel, o tempo flui inalterado mas as distâncias ao longo do movimento ficam contraídas e o resultado final é o mesmo.

Ambos os fenômenos dependem do fator \(\gamma\) definido acima. Partículas \(\tau\) geradas no SLAC, Stanford Linear Accelerator Collider atingem tipicamente \(\gamma = 20\) e as partículas viajam por uma distância média de
$$
20 \times (9, 15 \times 10^{- 5} \hspace{0.25em} \text{m}) = 1, 8 \times
10^{- 2} \hspace{0.25em} \text{m} \approx 1, 8 \hspace{0.25em}
\text{mm}.
$$

Na prática, em um laboratório, a medida do alcance média das partículas é usada para se calcular a meia-vida do \(\tau\).

 

As transformações de Lorentz

Fundamentos Históricos da TRE


Issac Newton

Até o final do século XIX a física se baseava sobre dois pilares: a mecânica de Newton e a sua teoria da gravitação universal e o eletromagnetismo propostos por Faraday e resumidos nas equações de Maxwell. Logo ficou claro, no entanto, que as equações do eletromagnetismo não eram invariantes sob as mesmas leis de transformação que deixavam inalteradas as equações de Newton, as transformações de Galileu. Em outras palavras os processos eletromagnéticos, tais como interação entre cargas e correntes ou a propagação das ondas eletromagnéticas, não são igualmente observados em todos os referenciais inerciais. Além disto Maxwell mostrou sem ambiguidade que a luz é uma onda que se propaga mesmo no vácuo. Deveria haver, portanto, um meio responsável por esta propagação. Formulou-se então o conceito de um sistema de referencial privilegiado que correspondia a este meio, em relação ao qual se poderia determinar o movimento absoluto de todos os corpos. A esse sistema ideal se chamou éter cósmico.

Diversas tentativas foram feitas para resolver a contradição. A primeira possibilidade consistia em considerar que o princípio da relatividade não era aplicável aos fenômenos electromagnéticos, ponto de vista defendido por G. Lorentz, o fundador da teoria eletrônica. Segundo esta visão um sistema inercial parado em relação ao éter é um sistema privilegiado, onde valem as leis de Maxwell. Somente neste sistema a velocidade da luz no vácuo é igual em todas as direções. A segunda possibilidade era a de alterar as equações de Maxwell para que se tornassem invariantes sob as transformações de Galileu, mantendo intactos os conceitos de espaço e tempo clássicos. Esta foi a abordagem adotada por G. Hertz, entre outros. Segundo ele o éter é arrastado pelos corpos em movimento de forma que os fenômenos eletromagnéticos ocorrem da mesma para observadores parados ou em movimento. O princípio da relatividade de Galileu fica assim preservado.

(3) A velocidade da luz, no vácuo, é de aproximadamente \(c = 3 \times 10^{10} cms^{-1}\).


De acordo com as leis da eletrodinâmica a luz é uma onda que se progaga no vácuo com velocidade igual(3) em todas as direções. Por outro lado, de acordo com a composição de velocidades da mecânica de Newton, a velocidade seria diferente se observada por observadores em movimento relativo à fonte. Diversos experimentos foram propostos para detectar este meio. Em 1881 os cientistas americanos Michelson e Morley, entre outros pesquisadores, construiram um aparato com o objetivo de descobrir a velocidade com que a Terra supostamente se desloca através do éter cósmico. O aparelho, representado esquematicamente na figura 1, consistia em uma fonte de luz em \(F\) , refletida por uma placa semi-espelhada \(M\) que divide o feixe de luz. Os espelhos \(M_1\) e \(M_2\) refletem de volta o feixe que é coletado pelo detetor em \(O\). Inicialmente um dos braços do instrumento foi alinhado com a direção de movimento da Terra, ficando o outro na perpendicular.

Experimento de Michelson e Morley

Qualquer atraso na coleta de um os feixes de luz causaria figuras de interferência formadas em \(F\) , observadas por meio do interferômetro de Michelson, o que dotava a montagem de alto grau de precisão. A experiência foi tentada para diversas orientações dos braços, em diferentes horas do dia e épocas do ano, sempre com resultado nulo. Esta é provalvelmente a mais famosa experiência a se tornar importante por seu resultado negativo! Não foi possível observar o movimento da Terra em relação ao éter e a hipótese da existência de um sistema de referência privilegiado foi rejeitada experimentalmente.

Uma terceira possibilidade para a solução do confito entre a teoria eletromagnética e a mecânica clássica consiste na rejeição das noções clássicas sobre o espaço e tempo, a reconstrução das equações do movimento e a manutenção das equações de Maxwell. Esta foi, como veremos, a atitude adotada por Einstein e que deu origem à TRE.

Albert Einstein

A teoria de Einstein está baseada sobre dois postulados:

  • A velocidade da luz é a mesma para todos os observadores, independentemente de seu movimento relativo.
  • As leis da física são as mesmas em qualquer referencial inercial.

O primeiro postulado estabelece que a velocidade da luz, que denotaremos por \(c\), é uma constante universal da natureza. Um feixe de luz disparado por
uma fonte em alta velocidade terá a mesma velocidade que um feixe disparado por uma fonte em repouso, em relação ao observador. O segundo representa um conceito importante, mesmo para a física clássica, embora não tenha sido justamente discutido e considerado no contexto clássico, antes da apresentação da Relatividade. Ele se baseia no conceito de que as leis da natureza devem ser válidas para quaisquer observadores postados em diferentes referenciais referenciais. Em outras palavras a forma matemática sob que estas leis estão expresas deve ser invariante para os diversos observadores.

Einstein desenvolveu uma teoria do movimento consistente com a invariância da velocidade da luz e com as propriedades de transformação da teoria de Maxwell. Ela é denominada Teoria da Relatividade Especial para se diferenciar da Teoria da Relatividade Geral, que generaliza a teoria especial com leis que são invariantes sob transformações gerais de coordenadas e que é a melhor descrição conhecida para a interação gravitacional.

Página manuscrita de Einstein sobre a Teoria da Relatividade Geral, publicada em Annalen der Physik in 1916.

 

Relatividade de Galileu

Relatividade de Galileu


O ponto de partida para a descrição matemática de uma lei da natureza é a definição de um sistema de referencial e de coordenadas. Na mecânica os referenciais inerciais são particularmente importantes pois neles as equações do movimento tomam sua forma mais simples. Referenciais inerciais são aqueles em que os observadores não estão sujeitos à ação de forças externas e, portanto, estão em repouso ou se deslocam em movimento retilíneo uniforme. Estabeleceremos um
sistema de coordenadas em um destes referenciais marcando cada “ponto”, que chamaremos de evento, com os números \((t, \hspace{0.25em} x, \hspace{0.25em} y, \hspace{0.25em} z)\) descrevendo quando e onde o evento ocorreu.

Suponha que um observador no referencial \(S\) associa a um evento as coordenadas \((t, \hspace{0.25em} x, \hspace{0.25em} y, \hspace{0.25em} z)\) enquanto outro, no referencial \(S \acute{}\) associa a um evento as coordenadas \((t^{\prime}, \hspace{0.25em} x^{\prime}, \hspace{0.25em} y^{\prime}, \hspace{0.25em} z^{\prime})\). Se o referencial \(S \acute{}\) se move em relação a \(S\) com velocidade \(v\) constante, por exemplo na direção do eixo \(x\), então os dois sistemas de coordenadas se relacionam da seguinte forma:

$$
\left\{ \begin{array}{cl}
t^{\prime} = & t\\
x^{\prime} = & x – vt\\
y^{\prime} = & y\\
z^{\prime} = & z.
\end{array} \right.
$$

No caso mais geral do referencial \(S^{\prime}\) com velocidade \(v = \left( v_x, \hspace{0.25em} v_y, \hspace{0.25em} v_z \right)\) em relação a \(S\) a regra de transformação de coordenadas e sua inversa são dadas respectivamente por
$$
\left\{ \begin{array}{cl}
t^{\prime} = & t\\
x^{\prime} = & x – v_x t\\
y^{\prime} = & y – v_y t\\
z^{\prime} = & z – v_z t.
\end{array} \right. \hspace{0.75em} \hspace{0.75em} \text{ e } \hspace{0.75em} \left\{
\begin{array}{cl}
t = & t^{\prime}\\
x = & x^{\prime} + v_x t\\
y = & y^{\prime} + v_y t\\
z = & z^{\prime} + v_z t.
\end{array} \right.
$$

Espaço-tempo clássico

Uma nota sobre o espaço onde a mecânica clássica atua pode ser interessante como uma preparação para o estudo da relatividade. Suponhamos que dois eventos \(P\) e \(P^{\prime}\) ocorrem respectivamente sob as coordenadas
$$
P = (t,\;x,\;y,\;z)\hspace{2.0em} \text{e}\hspace{2.0em} P^{\prime} = (t^{\prime},\;x^{\prime}, \;y^{\prime}, \;z^{\prime}).
$$

Podemos calcular as distâncias
$$
\begin{array}{cl}
\Delta t = & t^{\prime} – t\\
& \\
\Delta s = & \sqrt{\left( x^{\prime} – x \right)^2 + \left( y^{\prime} –
y \right)^2 + \left( z^{\prime} – z \right)^2}
\end{array}
$$

que são as mesmas para qualquer observador que as observe. Na mecânica de Newton tempo é universal e independe do movimento do observador. O afastamento espacial entre os eventos, \(\Delta s\), é um objeto geométrico, invariante para qualquer sistema de coordenada que possamos usar. Dizemos que esta distância é invariante sob reparametrizações do espaço. Podemos escrever sob forma matricial
$$
\Delta s^2 = \Delta x^2 + \Delta y^2 + \Delta z^2 = \left( \Delta x
\hspace{0.75em} \Delta y \hspace{0.75em} \Delta z \right) \left(
\begin{array}{ccc}
1 & 0 & 0\\
0 & 1 & 0\\
0 & 0 & 1
\end{array} \right) \left( \begin{array}{c}
\Delta x\\
\Delta y\\
\Delta z
\end{array} \right)
$$

ou, alternativamente \(\Delta s^2 = \sum_{i, j} \Delta x^i \Delta x^j \delta_{ij} = \Delta x^i \Delta x^j \delta_{ij}\), onde \(\delta_{ij}\) são os componentes da métrica de Euclides,
$$
\delta_{ij} = \left( \begin{array}{ccc}
1 & 0 & 0\\
0 & 1 & 0\\
0 & 0 & 1
\end{array} \right) \hspace{4pt}\text{ ou } \hspace{4pt} \delta_{ij} = \left\{
\begin{array}{cl}
1 & \hspace{4pt}\text{ se } \hspace{4pt} i = j\\
0 & \hspace{4pt}\text{ se } \hspace{4pt} i \neq j
\end{array} \right.
$$

e a convenção de Einstein foi usada para indicar a soma sobre as quantidades com índices repetidos. Isto mostra que o espaço onde ocorrem os fenômenos clássicos é o produto cartesiano de \(I \hspace{-4pt} R^3\), um espaço euclidiano de três dimensões mais uma dimensão temporal.

Uma revisão adicional pode tornar mais fácil o estudo a seguir. Sendo \(I \hspace{-4pt} R^3\) um espaço vetorial escolhemos nele a base ortonormal canônica
$$
\left\{ \mathbf{\hat{e}}_i \right\} = \left\{ \hat{\imath}, \hat{\jmath}, \hat{k} \right\}.
$$

Qualquer vetor de \(I \hspace{-4pt} R^3\) pode ser escrito como uma combinação linear dos vetores da base
$$
\vec{v} = \sum^3_{i = 1} v^i \mathbf{\hat{e}}_i = v^i \mathbf{\hat{e}}_i.
$$

Neste espaço definimos o produto interno ou produto escalar, uma aplicação bilinear, simétrica e positiva definida, com o seguinte efeito sobre os vetores da base ortonormal,
$$
\left\langle \mathbf{\hat{e}}_i, \mathbf{\hat{e}}_j \right\rangle = \delta_{ij}.
$$

Então, se \(\vec{u} = u^i \mathbf{\hat{e}}_i\) é outro vetor temos
$$
\left\langle \vec{u}, \vec{v} \right\rangle = \left\langle u^i
\mathbf{\hat{e}}_i, v^j \mathbf{\hat{e}}_j \right\rangle = u^i v^j
\left\langle \mathbf{\hat{e}}_i, \mathbf{\hat{e}}_j \right\rangle = u^i v^j
\delta_{ij},
$$

que é o produto escalar usual \(\left\langle \vec{u}, \vec{v} \right\rangle = u^1 v^1 + u^2 v^2 + u^3 v^3\). A norma ou comprimento de um vetor é
$$
\left| \vec{u} \right| = \sqrt{\left\langle \vec{u}, \vec{u} \right\rangle}
= \sqrt{\left( u^1 \right)^2 + \left( u^2 \right)^2 + \left( u^3 \right)^2}.
$$

As equações do movimento

Vamos denotar por \(\vec{r} = \left( x, y, z \right)\) o vetor posição de um ponto em \(I \hspace{-4pt} R^3\). Uma trajetória neste espaço, percorrida por uma partícula, pode ser representada por uma curva parametrizada sob a forma
$$
\vec{r} \left( t \right) = \left( x \left( t \right), y \left( t \right), z \left( t \right) \right),
$$

sendo que o parâmetro \(t\) é o tempo. Sua velocidade é definida como a variação instantânea da posição com o tempo, ou seja
$$
\vec{v} (t) = \frac{d}{dt} \vec{r} \left( t \right) = \left( \dot{x}
\left( t \right), \dot{y} \left( t \right), \dot{z} \left( t \right) \right)
$$

onde a notação \(\mathbf{\dot{x}}\) foi introduzida para indicar a derivada com relação ao tempo. A aceleração de uma partícula é a derivada segunda
$$
\vec{a} (t) = \frac{d^2}{dt^2} \vec{r} \left( t \right) = \left( \ddot{x}
\left( t \right), \ddot{y} \left( t \right), \ddot{z} \left( t \right) \right).
$$

A equação de Newton uma equação diferencial
$$
\vec{F} = m \vec{a} (t),
$$

cuja solução é a trajetória da partícula.

Exemplo: Na teoria de Newton as trajetórias de partículas livres, i.e., não submetidas a nenhuma força, são retas de \(I \hspace{-4pt} R^3\). Temos
$$
\vec{F} = 0 \Rightarrow \vec{a} = 0,
$$

o que representa três equações diferenciais
$$
\ddot{x} \left( t \right) = 0, \hspace{0.75em} \ddot{y} \left( t \right) = 0, \hspace{0.75em} \ddot{z} \left( t \right) = 0,
$$

com soluções
$$
x \left( t \right) = at + b, \hspace{0.75em} y \left( t \right) = ct + d, \hspace{0.75em} z \left( t \right) = et + f,
$$

onde \(a, \hspace{0.3em} b, \hspace{0.3em}c, \hspace{0.3em}d, \hspace{0.3em}e, \hspace{0.3em}f \)
são constantes que podem ser determinadas pelas condições iniciais. Observe que
$$
\vec{r} \left( 0 \right) = \vec{r}_0 = \left( b, \hspace{0.25em} d,
\hspace{0.25em} f \right) \hspace{0.8em} \text{e} \hspace{0.8em} \vec{v} \left( 0 \right) = \vec{v}_0 =
\left( a, \hspace{0.25em} c, \hspace{0.25em} e \right)
$$

são, respectivamente, a posição e a velocidade inicial da partícula.

Para calcular a distância percorrida podemos usar a fórmula do comprimento de arco \(s\), obtida da seguinte forma: para variações infinitesimais do parâmetro \(t\) o arco tem o comprimento infinitesimal
$$
ds^2 = dx^2 + dy^2 + dz^2 = \left[ \left( \frac{dx}{dt} \right)^2 + \left(
\frac{dy}{dt} \right)^2 + \left( \frac{dy}{dt} \right)^2 \right] dt^2
$$

pois cada função coordenada é função de \(t\) apenas e \(dx = \left( dx / dt \right) dt\) , e análogos para \(y\) e \(z\). Para uma varição finita do parâmetro encontramos o comprimento de arco por meio da integral definida
$$
s = \int_{t_1}^{t_2} \sqrt{\dot{x}^2 + \dot{y}^2 + \dot{z}^2} dt,
$$

que é a distância total percorrida pela partícula.

A energia cinética de uma partícula é um escalar, definido como
$$
T = \frac{1}{2} mv^2
$$

onde \(v = \left| \vec{v} \right| = \sqrt{\dot{x}^2 + \dot{y}^2 + \dot{z}^2}\) , enquanto o momento linear de uma partícula é o vetor
$$
\vec{p} = m \vec{v} \mathbf{=} m \left( \dot{x}, \dot{y}, \dot{z} \right) .
$$

Podemos portanto escrever a equação de movimento de Newton como
$$
\vec{F} = \frac{d \vec{p}}{dt},
$$

válida mesmo que a massa não seja uma constante. Para uma partícula de massa constante temos uma relação entre a energia cinética e o
momento que será útil futuramente. Lembrando que \(v^2 =\) \(\vec{v} \mathbf{.} \vec{v} \mathbf{}\) temos que a taxa de variação de \(T\) com o tempo é

$$
\frac{dT}{dt} = \frac{1}{2} m \frac{d}{dt} \left( \vec{v} \mathbf{.}
\vec{v} \right) = m \vec{v} \mathbf{.} \frac{d \vec{v}}{dt} = \vec{v} .
\vec{F} . \label{energiacinetica}
$$
Para um sistema de \(N\) partículas temos que a energia cinética e o momento são as somas
$$
T = \sum_{i = 1}^N \frac{1}{2} m_i v_i^2, \vec{p} = \sum_{i = 1}^N m_i
\vec{v}_i .
$$

Estas definições de energia e momento são motivadas pelo fato experimental de que a soma das energias, cinética e potencial, e o momento são quantidades que se conservam durante a trajetória de uma partícula ou de um sistema de partículas.

Exercícios

  • Faça um esboço da trajetória em \(I \hspace{-4pt} R^2\) descrita em forma paramétrica por
    $$
    \mathbf{x} \left( t \right) = \left( R \cos \omega t, R \textit{sen} \omega t \right)
    $$
    Mostre que a aceleração, neste caso, é sempre perpendicular á velocidade.
  • Faça um esboço da trajetória em \(I \hspace{-4pt} R^3\) descrita em forma paramétrica por
    $$
    \mathbf{x} \left( t \right) = \left( \cos \omega t, \textit{sen} \omega t,
    t \right) .
    $$
  • Encontre o comprimento da trajetória acima de \(t = 0\) até \(t = 1\).

 

Consequências da invariância da velocidade da luz

Teoria da Relatividade Especial

Introdução

“Após dez anos de reflexões tal princípio emergiu de um paradoxo que eu já tinha antevisto quando tinha 16 anos: se eu perseguir um feixe de luz com a mesma velocidade que uma frente de onda (a velocidade da luz no vácuo) então eu deveria observar este feixe como um campo eletromagnético constante e periódico no espaço. No entanto tal coisa não parece existir, nem com base na experimentação nem de acordo com as equações de Maxwell…” Einstein (1951)

“Daqui por diante o espaço e o tempo estão fadados a desaparecer como meras sombras e apenas um tipo de união entre os dois terá preservada sua realidade independente” Minkowski, 1908.

Introdução

(1) O Cálculo foi desenvolvido simultâneamente e de forma independente por Leibniz. Muitos outros matemáticos contribuíram para o aperfeiçoamente desta disciplina.

A Mecânica é o ramo da física que estuda a ação das forças sobre os corpos e o comportamento dos sistemas materiais sujeitos à atuação dessas forças. Seus fundamentos foram lançados por Issac Newton no século XVII, apoiado sobre as contribuições de Galileu, Copérnico e Kepler. Para descrever com precisão a teoria recém elaborada Newton desenvolveu o formalismo matemático do Cálculo Diferencial e Integral(1).A mecânica de Newton é baseada em três axiomas fundamentais:

  • A lei da inércia, esboçada previamente por Galileu: um corpo não submetido à ação de forças externas conserva seu estado de repouso ou movimento.
  • Um corpo de massa \(m\) submetido à ação de uma força externa \(\vec{F}\) modifica estado de movimento de acordo com a relação

    $$\vec{F} = m \vec{a} \mathbf{,} $$

    onde \(\vec{a}\) é o vetor aceleração deste corpo. A massa é uma constante de proporcionalidade que exprime a relação entre a força aplicada e a aceleração obtida.

  • A lei de ação e reação: todo corpo A, submetido a uma força aplicada por outro corpo B, aplicará sobre o último uma força de mesma intensidade e sentido contrário.
(2) Esse axioma foi questionado e revisto pela Teoria da Relatividade de Einstein.

Três importantes teoremas de conservação são resultantes destes postulados:

  • Todo sistema físico fechado contém uma quantidade de matéria invariante(2), independentemente dos processos que ali ocorrem.
  • Sistemas com simetria linear em alguma direção exibem conservação do momento linear relativo a esta direção. Sistemas isotrópicos, com simetria por rotações em torno de algum eixo exibem conservação do momento angular relativo a este eixo.
  • A energia total em um sistema fechado é constante.

A mecânica de Newton, ou mecânica clássica, é uma teoria testada com alto grau de precisão para uma ampla faixa de experimentos. Ele descreve com excelente prescisão o movimento de bolas de bilhar, automóveis, satélites artificiais e o movimento planetário. Existe, no entanto, diversos fenômenos observados que não se encaixam dentro do panorama clássico, em particular os fenômenos relativos à átomos e moléculas,bem como às partículas subatômicas, e aqueles que envolvem partículas com velocidades muito altas, comparáveis à velocidade daluz. A primeira classe destes fenômenos foi corretamente descrita no finaldo século XIX e início do século XX por meio da Mecânica Quântica. A segunda foi encontrada por Albert Einstein.

Em 1905 Einstein publicou três artigos que revolucionaram a ciência física e abriram novas frentes em pesquisa fundamental. Um deles tratava do movimento browniano, em outro Einstein apresentava uma solução para o problema do efeito fotoelétrico que representou um impulso na formulação da teoria quântica. No terceiro ele apresentava a solução para uma divergência encontrada há algum tempo entre as teorias do eletromagnetismo de Maxwell e a mecânica de Newton. As duas teorias, embora estivessem ambas bem fundamentadas teórica eexperimentalmente, não eram compatíveis entre si. Devido a crença profunda de que a teoria de Newton, capaz de descrever com precisão os movimentos observados na experiência diária, estava correta, a comunidade científica preferia manter inalterada a mecânica clássica e buscar por modificações da teoria eletromagnética.

Einstein, por outro lado, estivera interessado sobre como veria uma frente de onda luminosa se estivesse viajando com ela, na mesma velocidade. Ele compreendeu que a teoria de Maxwell estava correta e que, para altas velocidades quando comparadas à velocidade da luz, a mecânica deveria ser modificada. Desta forma ele desenvolveu a Teoria da Relatividade Especial, que passaremos a designar simplesmente por TRE.

Esta teoria se baseia em uma afirmação fundamental: a velocidade da luz é a mesma para qualquer observador, independentemente de sua velocidade. As consequências disto são curiosas. Um comprimento ao longo da direção do movimento se torna mais curto e relógios em movimento batem mais devagar. Espaço e tempo são aspectos de um mesmo fenômeno. Outro efeito interessante previsto é o de que a massa de um objeto aumenta,tendendo a infinito quando sua velocidade se aproxima da velocidade da luz.Este fenômeno é observado, por exemplo, dentro de um acelerador de partículas. Einstein mostrou ainda que matéria e energia são dois aspectos de uma mesmo princípio, podendo ser transformadas uma na outra, como ocorre dentro de um reator nuclear, de uma bomba de hidrogênio ou no interior de uma estrela.

A descoberta da teoria da relatividade não implica em que a teoria de Newton está incorreta. Pelo contrário, as equações clássicas do movimento estão contidas nas equações relativísticas como um caso particular, em situações onde as velocidades envolvidas são pequenas quando comparadas à velocidade da luz. Elas descrevem corretamente, ou com excelente aproximação, os fenômenos que ocorrem no cotidiano. Para o movimento em altas velocidades, tais como o que acontece dentro dos aceleradores de partículas, nas partículas cósmicas que atingem aatmosfera da Terra ou no interior de estrelas superquentes torna-se necessário usar a TRE que, sob estas condições, tem sido testada em inúmeros experimentos, com grande grau de precisão.

 

Fundamentos Históricos da TRE

Probabilidade e Estatística

O estudo matemático das probabilidades e da estatística, além de sua evidente importância prática, representa uma grande oportunidade para o uso dos conceitos da Teoria dos Conjuntos. Por isso faremos uma revisão dos conceitos relevantes.

Conjuntos

O conceito de conjuntos é um conceito primário, básico ao entendimento de toda a matemática. Conjuntos são coleções de objetos, não necessariamente envolvendo números ou outra entidade matemática. É comum representarmos os conjuntos exibindo explicitamente seus elementos, como em

$$ C_{1}=\{\spadesuit,\clubsuit,\diamondsuit,\heartsuit\} $$
onde os elementos são os naipes de cartas de baralho, ou
$$ C_{2}=\{1,3,5,7,9\}=\{\text{um inteiro ímpar menor que 10}\}. $$

Na segunda forma de descrever o conjunto usamos a notação:
$$ \text{Conjunto } =\{x_i|\; \text{ alguma propriedade satisfeita pelos elementos} \}.$$
Em muitas situações o conjunto pode ser muito grande ou possuir infinitos elementos, de forma que não podemos explicitá-los, tais como o conjunto de todos os inteiros pares
$$ C_{3}=\{\left.n_i \in \mathbb{N}\right|n_i \,\,\text{ par}\} $$
ou o conjunto de pontos no plano \(\mathbb{R}^2\) sobre a circunferência de raio 1,
$$ C_{4}=\{\left.(x,\,y)\in\mathbb{R}^2\right|(x^2+y^2=1)\}. $$

Se os elementos de um conjunto podem ser contados ele é dito enumerável e sua ordem, que denotaremos por \(\text{ord}(A)=n\), é o número de seus elementos. Nos exemplos acima temos \(\text{ord}(C_{1})=4\), \(\text{ord}(C_{2})=5\). O conjunto \(C_{3}\) é enumerável, com infinitos elementos, e \(C_{4}\) não é enumerável (também possuindo infinitos elementos).

Dizemos que um elemento \(a\) pertence à um conjunto \(C\) se \(a\) é um dos elementos de \(C\). Denotamos esta relação por \(a\in C\). Caso contrário escrevemos \(a\notin C\).

A contido em B

Dizemos que um conjunto \(A\) está contido no conjunto \(B\) se todos os elementos de \(A\) estão também em \(B\). Denotamos esta relação por \(A\subset B\). Caso contrário escrevemos \(A\not\subset B\). Observe que vale a seguinte afirmação: se \(A\subset B\) e \(x\in A\Rightarrow x\in B.\)

União e Intersecção

Conjuntos podem ser combinados de várias maneiras. Por exemplo, se \(A\) e \(B\) são dois conjuntos podemos encontrar a união dos dois, \(A\cup B\), ou sua intersecção \(A\cap B\), ilustradas na figura 1. Observe que
$$ x\in A\cup B \Rightarrow x\in A\text{ ou }x\in B, $$
$$ x\in A\cap B \Rightarrow x\in A\text{ e }x\in B. $$

Um número maior de conjuntos podem também ser combinados. Se \(A_{i}\) é uma coleção de conjuntos (\(i=1,\ldots,\,n)\) denotamos a união e intersecção destes conjuntos por: \(\underset{i=1}{\cup}A_{i}, \underset{i=1}{\cap}A_{i},\) respectivamente. Observe que dois conjuntos são disjuntos se \(A\cap B=\emptyset\).

 

Definição: Se \(A\subset S\) definimos \(\bar{A},\) o complementar de \(A,\) como o conjunto de todos os elementos de \(S\) que não estão em \(A\),
$$ \bar{A}=\{x\in S;\,\,x\notin A\}. $$

Observe que \(A\cup\bar{A}=S\).

Se \(S\) é finito ou numerável com \(n\) elementos então existem \(2^{n}\) eventos associados (subconjuntos de \(S\)).

 

O produto externo é outra forma de combinar conjuntos:

$$ A\times B=\left\{ (a,b)|a\in A,b\in B\right\}. $$

Seus elementos são os pares ordenados \((a,b)\). Observe que \(\mathbb{R}^n = \mathbb{R}\times\ldots\times\mathbb{R}.\)

Experimento aleatório e espaço amostral

Um experimento é não determinístico ou aleatório se seu resultado não pode ser determinado previamente, à partir das condições iniciais do sistema usado. Na prática um experimento pode ser considerado aleatório se o conjunto das condições iniciais e sua evolução até a obtenção do resultado forem muito complexas e de difícil análise. Por exemplo, quando se atira uma moeda todas as leis envolvidas no movimento são causais e é possível prever o resultado (com que face ela cairá ao solo) se todas as condições iniciais forem conhecidas. No entanto estas condições envolvem um grande número de variáveis (tais como as colisões com partículas do ar) e é, quase sempre, mais apropriado considerar que o resultado será aleatório. Na natureza macroscópica poucos experimentos são realmente aleatórios. No nível microscópico (quântico) temos fenômenos completamente aleatórios, tais como o momento em que uma substância radioativa sofrerá um decaimento e emitirá uma partícula ou radiação.

O conjunto dos resultados possíveis para um dado experimento é denomidado seu espaço amostral. Denotaremos por \(\varepsilon\) os experimentos e \(S\) seu espaço amostral. Alguns exemplos de experimentos aleatórios (dentro das ressalvas dadas acima) são:

\(\varepsilon_{1}:\) Jogue uma moeda 4 vezes e observe número de caras resultantes. \(S=\{0,1,2,3,4\} \).

\(\varepsilon_{2}:\) Jogue uma moeda 4 vezes e verifique a sequência de caras (que denotaremos por h) e coroas (que denotaremos por t). \(S=\{ \text{(hhhh), (hhht), …, (tttt)}\} \).

\(\varepsilon_{3}:\) Jogue uma moeda 4 vezes e verifique quantas caras e coroas resultam. \(S=\{(0,4),\,(1,3),\,(2,2),\,(3,1),\,(4,0)\} \).

\(\varepsilon_{4}:\) Deixe uma lâmpada acesa até queimar. Verifique o tempo de vida da lâmpada (um espaço amostral contínuo).

\(\varepsilon_{5}:\) Em um lote com 10 peças, sendo 3 defeituosas, retire 1 de cada vez, sem repor, até que todas com defeito sejam removidas. Quantas peças serão retiradas? \(S=\{3,4,5,6,7,8,9,10\}\).

\(\varepsilon_{5′}:\) Mesmo experimento anterior. Quantas peças podem ser retiradas sem que alguma tenha defeito? \(S=\{1,2,3,4,5,6,7\}\).

Definição: Um evento relativo ao experimento \(\varepsilon\) é um subconjunto de \(S\).

Exemplo 1: São eventos associados aos experimentos já listados:

\(\varepsilon_1\): \(A=\{2\} ,\) duas caras ocorrem,

\(\varepsilon_3\): \(B=\{(3,1),\,(4,0)\}\), mais caras que coroas,

\(\varepsilon_4\): \(C=\{t |\, t \lt 3000h \}\), lâmpada queima antes de 3000 horas.

Observe que, com esta definição, \(S\) e \(\emptyset\) são ambos eventos.

Se \(A\) e \(B\) são eventos então também são eventos:

\(A\cup B\) ocorre se \(A\) ou \(B\) ocorrem,
\(A\cap B\) ocorre se \(A\) e \(B\) ocorrem,
\(\bar{A}\) ocorre se \(A\) não ocorre.

No caso de diversos eventos \(A_{i}\) associados ao experimento:

\(\underset{i}{\cup}A_{i}\) ocorre se um dos \(A_i\) ocorre,
\(\underset{i}{\cap}A_{i}\) ocorre se todos os \(A_i\) ocorrem.

Notação: Se um experimento consiste na execução do experimento \(\varepsilon\) \(n\) vezes denotamos seu espaço amostral por meio do produto externo
$$ \text{S}\times\ldots\times\text{S}=\left\{ \left(s_{1},\cdots,\,s_{n}\left|s_{i}\in S\right.\right)\right\}.$$

Definição: Dois eventos \(A\) e \(B\) são mutuamente excludentes se não podem ocorrer simultaneamente. Neste caso \(A\cap B=\emptyset\).

Definição: Uma coleção de eventos \(\{A_i\}\) é uma partição de \(S\) se

1. \(A_{i}\cap A_{j}=\emptyset\) para \(i\neq j\),

2. \(\underset{i}{\cup}A_{i}=S\),

3. \(P\left(A_{i}\right)>0,\forall i\).

Portanto, uma partição é uma coleção de subconjuntos de \(S\) mutuamente disjuntos, que cobrem todo o conjunto \(S.\) Devido à propriedade 1, quando um experimento é realizado apenas um dos eventos de uma partição ocorre de cada vez.

Definição: A cada evento de \(S\) associado ao experimento \(\varepsilon\) associamos uma probabilidade de ocorrência \(P\left(A\right)\), um número real, satisfazendo

1. \(0\leq P\left(A\right)\leq1\),

2. \(P\left(S\right)=1\),

3. Se \(A\cap B=\emptyset\) então \(P\left(A\cup B\right)=P\left(A\right)+P\left(B\right)\).

Se \(\{A_{i}\}\) é uma coleção de eventos disjuntos (\(A_i \cap A_j=\emptyset\) para \(i\neq j\)) então \(P\left(\cup A_{i}\right)=\sum P\left(A_{i}\right)\).

Teorema: \(P(\emptyset)=0\)

Demonstração: \(A=A\cup\emptyset\) portanto \(P(A)=P\left(A\cup\emptyset\right)=P\left(A\right)+P\left(\emptyset\right)\Rightarrow P\left(\emptyset\right)=0 \)

Teorema: \(P(\overline{A})=1-P(A)\)

Demonstração: \(S=A\cup\overline{A}\), uma união disjunta. \(P\left(S\right)=1=P\left(A\right)+P\left(\overline{A}\right)\ \).

Esta última propriedade é muito interessante em alguns casos onde é mais fácil calcular \(P\left(\overline{A}\right)\), a probabilidade de não ocorrer o evento \(A\).

Teorema: \(P\left(A\cup B\right)=P\left(A\right)+P\left(B\right)-P\left(A\cap B\right)\)

Demonstração: \(A\cup B=A\cup\left(B\cap\overline{A}\right)\) e \(B=\left(B\cap A\right)\cup\left(B\cap\overline{A}\right)\). Como ambas uniões são disjuntas temos que
$$ P\left(A\cup B\right)=P\left(A\right)+P\left(B\cap\overline{A}\right)\,\,\,\text{e}\,\,\,P\left(B\right)=P\left(A\cap B\right)+P\left(\overline{A}\cap B\right) $$
$$ \Rightarrow P\left(A\cup B\right)=P\left(A\right)+P\left(B\right)-P\left(A\cap B\right).\ $$

Aplicando-se este mesmo resultado 2 vezes temos

$$
\begin{array}{rl}
P(A\cup B\cup C)= & P(A)+P(B)+P(C) \\
& -P(A\cap B)-P(B\cap C)-P(C\cap A)+P(A\cap B\cap C)
\end{array}
$$

Teorema: Se \(A\subset B\Longrightarrow P\left(A\right)\leq P\left(B\right)\)

Demonstração: Escreva \(B=A\cup\left(B\cap\overline{A}\right)\Longrightarrow P(B)=P(A)+P(B\cap\overline{A})\Longrightarrow P\left(A\right)\leq P\left(B\right).\)

Espaços amostrais finitos

Vamos considerar, nesta seção, experimentos cujos resultados são descritos por um espaço amostral consistindo de um número finito de \(k\) elementos, \(S={ a_1,\ldots,\,a_k}\). Chamaremos de um evento simples (ou elementar) a um evento formado por um resultado simples, \(A={a_i} \). A cada evento simples associaremos uma probabilidade \(p_i=P({a_i})\) satisfazendo

(a) \(0\leq p_{i}\leq1\),

(b) \(\sum_{i}^{k}p_{i}=1.\)

Notamos que \(\left\{ a_{i}\right\} \cap\left\{ a_{j}\right\} =\emptyset,\;i\neq j,\) o que significa que a coleção de todos os eventos simples de \(S\) é uma partição do espaço amostral.

Se tomarmos um evento constituído de \(r\) destes eventos simples (\(1\leq r\leq k)\; A={a’_1,\ldots,\,a’_r}\) (uma combinação de \(r\) eventos quaisquer de S) então
$$ P\left(A\right)=p_{1}+p_{2}+\ldots+p_{r}=\sum^{r}p{}_{i.} $$

Isto significa que conhecemos a probabilidade de \(A\) se conhecermos a probabilidade dos elementos simples que a compõem.

Se todos os \(k\) resultados são igualmente verossímeis (ocorrem com a mesma probabilidade) então
$$ p_{i}=\frac{1}{k}\;\;\text{e}\;\;P(A)=\frac{r}{k}. $$

Resumindo, se \(A\) é formado por \(k\) resultados simples igualmente prováveis então
$$ P(A)=\frac{\text{número de casos favoráveis}.}{\text{número de casos possíveis}} $$

Exemplo 2: Atirando uma moeda 2 vezes (ou duas moedas, ao mesmo tempo) qual é a probabilidade de se obter 1 cara? O experimento consiste em contar o número de caras resultantes e o espaço amostral é \(S={0,1,2}\). O evento favorável é \(A={1 \text{ cara }}={1 h}\). Note que \(P(A)\neq\frac{1}{3}\) pois os eventos de \(S\) não são igualmente verossímeis. Uma descrição mais apropriada do espaço amostral seria:
$$
S’=\{(h,h),\,(h,t),\,(t,h),\,(t,t)\}
$$

O espaço amostral \(S’\) consiste de 4 casos possíveis, dois deles favoráveis. Portanto
$$ P(A)=P(1\text{cara})=\frac{2}{4}=0,5. $$

Isto mostra a importância de se conhecer técnicas de contagens de eventos.

Exemplo 3: Um dado honesto (bem balanceado) cai com qualquer das faces virada para cima com a mesma probabilidade. Jogando-se o dado uma vez, qual a probabilidade de que ele caia com um número maior que 2? O espaço amostral é \(S=\{1,2,3,4,5,6\}\), o evento favorável é \(A=\{3,4,5,6\}\). A probabilidade procurada é \(P(A)=4/6=2/3.\)

Exemplo 4: Jogando-se um dado 2 vezes, qual é a probabilidade de que a soma dos números obtidos seja 6?

Neste caso o espaço amostral é
$$ S=\left\{\begin{array}{cccc}
(1,1) & (1,2) & \ldots & (1,6) \\
\vdots & & & \vdots \\
(6,1) & (6,2) & \ldots & (6,6)
\end{array}\right\}.
$$

Destes eventos simples os únicos favoráveis são \(A=\{(1,5),\,(2,4),\,(3,3),\,(4,2),\,(5,1)\}.\) Portanto \(P(A)=5/36.\)

Métodos de enumeração ou contagem

Vemos que é importante saber contar quantos eventos podem resultar de um certo experimento. Consideremos então a questão: de quantas maneiras diferentes podemos dispor de \(n\) objetos (permutações)? O primeiro pode ser escolhido entre \(n\) objetos, o segundo entre \(n-1\), até o útimo objeto restante. Como ilustrado na figura, o número resultante é \(n \times (n-1) \times \cdots \times 1 =n!\).

Como notação escreveremos \(_{n}P_{n}=n!\) para indicar a permutaçao de \(n\) objetos.

De quantas formas diferentes podemos escolher apenas \(r,\;(r\lt n)\) entre \(n\) objetos diferentes? Agora a escolha é interrompida após a seleção do \(r\)-ésimo objeto. Denotando por \(_{n}A_{r}\) este número temos
$$ _{n}A_{r}=n\left(n-1\right)\cdots\left(n-r+1\right)=\frac{n!}{\left(n-r\right)!}.$$

Se a ordem em que estes \(r\) elementos entram na seleção não é relevante então temos que remover da contagem acima as seleções repetidas. Temos que \(r\) objetos podem ser permutados de \(r!\) formas diferentes. Então, denotando por \(C\) o número de modos de permutar \(r\) entre \(n\) elementos, temos
$$ C=\frac{_{n}A_{r}}{r!}=\frac{n!}{r!\left(n-r\right)!}. $$

O número de combinações de \(n\) elementos em grupos de \(r\) elementos, sem que a ordem seja importante, aparece em diversas aplicações da matemática e recebe uma notação especial:
$$ C=\left(\begin{array}{c} n \\ r \end{array}\right)=\frac{n!}{r!\left(n-r\right)!}. $$
Estes são os chamados coeficientes binomiais. Eles possuem diversas propriedades interessantes. Entre elas, se \(n\) é um inteiro positivo e \(0\leq r\leq n\) então

$$
\left( \begin{array}{c} n \\ r \end{array}\right) =
\left(\begin{array}{c} n \\ n-r \end{array}\right), \;\;\;\;
\left(\begin{array}{c} n \\ r \end{array}\right)=
\left(\begin{array}{c} n-1 \\ r-1 \end{array}\right) +
\left(\begin{array}{c} n-1 \\ r \end{array}\right)
$$

Exemplo 5:. Na Loteria brasileira Megasena uma aposta simples consiste em escolher 6 entre 60 números. Qual a probabilidade de se escolher os 6 números sorteados? Temos que
$$ C=\left(\begin{array}{c} 60 \\ 6 \end{array}\right)=\frac{60!}{6!(54)!}=50063860 $$

é o número de resultados possíveis. A probabilidade de se acertar com um jogo simples é \(1/50063860\).

Observe que a operação acima pode ser simplificada da seguinte forma:
$$ \frac{60!}{6!(54)!}=\frac{55\times56\times57\times58\times59\times60}{2\times3\times4\times5\times6}=50063860. $$
(Os primeiros \(54\) fatores no numerador são cancelados por \(54!\) no denominador.)

Probabilidade Condicionada

Vamos usar de um exemplo para mostrar a diferença entre escolher objetos de um lote inicial, fazendo ou não a reposição dos objetos retirados após cada escolha.

Exemplo 6: Em um lote com 100 peças, 20 são defeituosas. Retiramos 2 peças e definimos dois eventos: \(\;A=\){1ª peça com defeito} \(B=\){2ª peça com defeito}. Se há reposição da peça retirada temos:
$$P(A)=\frac{20}{100}=\frac{1}{5},\;\;\; P(B)=\frac{1}{5}.$$

Mas, se não há a reposição, após a retirada da primeira peça restam 99, mas não sabemos quantas são defeituosas. Vamos denotar por \(P(B|A)\) = a probabilidade condicionada do evento \(B,\) tendo ocorrido o evento \(A.\) Se a primeira peça tinha defeito, restam 19 peças com defeito em um lote de 99, e \(P(B|A)=\frac{19}{99}\).

Como \(A\) ocorreu, o espaço amostral fica reduzido. Observe ainda que a probabilidade de \(B\) se \(A\) não tiver ocorrido é \(P(B|\overline{A})=\frac{20}{99}\).

Exemplo 7: Ex.: Dois dados são lançados e representamos o resultado por \(\left(x_{1},\,x_{2}\right).\) O espaço amostral é

$$
S=\left\{ \begin{array}{cccc}
(1,1) & (1,2) & \ldots & (1,6) \\
(2,1) & (2,2) & \ldots & (2,6) \\
\vdots & & & \vdots \\
(6,1) & (6,2) & \ldots & (6,6)
\end{array}\right\},
$$
consistindo de 36 eventos simples. Considere 2 eventos: \(A\) onde a soma dos dados é 10; \(B\) onde o primeiro resultado é maior que o segundo:

$$
\begin{array}{rl}
A= & \{(x_1,x_2)|x_1 + x_2=10\} = \{(4,6),(5,5),(6,4)\} \\ & \\
B= & \left\{(x_1,x_2)|x_1 \gt x_2\right\} \\
= & \left\{(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),\right. \\
& \left.(5,2),(5,3),(5,4),(6,1),(6,2),(6,3),(6,4),(6,5)\right\}
\end{array}
$$

A probabilidade de ocorrerem \(A\) e \(B\) são, respectivamente,
$$ P\left(A\right)=\frac{3}{6},\;\;P(B)=\frac{15}{36},$$
enquanto a probabilidade condicionada de ocorrer \(B\) tendo ocorrida \(A\) é $$ P(B|A)=\frac{1}{3}. $$ O espaço amostral se reduz para \(A={(4,6),\,(5,5),\,(6,4)}\) e, entre estes eventos apenas \((6,4)\) é favorável. Da mesma forma a probabilidade de ocorrer \(A\) tendo ocorrido \(B\) é
$$ P(A|B)=\frac{1}{15}, $$

pois \(\text{ord}(B)=15\) e apenas o evento \(\left(6,4\right)\) é favorável. Observe ainda que a probabilidade de que \(A\) e \(B\) ocorram simultaneamente é
$$ P(A\cap B)=\frac{1}{36}.$$

Note que:
$$P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{1}{36}\frac{36}{15}=\frac{1}{15}$$
$$P(B|A)=\frac{P(B\cap A)}{P(A)}=\frac{1}{36}\frac{36}{3}=\frac{1}{3}$$

Isto sugere a definição de probabilidade condicionada (que pode ser formalmente demostrada):

$$ P(B|A)=\frac{P(A\cap B)}{P(A)} $$

para \(P(A)\gt 0\). É claro que, se \(P(A)=0\), \(P(B|A)=0\). Podemos então escrever

$$ P(A\cap B)=P(B|A)P(A)=P(A|B)P(B). $$

Exemplo 8: Entre 100 calculadoras temos aparelhos novos (N) e usados (U), eletrônicos (E) e manuais (M), de acordo com a tabela:

Uma é escolhida ao acaso e verifica-se que é nova. Qual probabilidade de que ela seja eletrônica?

Como já se vericou que a calculadora é nova, o espaço amostral fica reduzido à apenas 70 unidades. Nele apenas 40 calculadoras são eletrônicas. Usando a definição de probabilidade condicionada temos

$$ P(E|N)=\frac{P(E\cap N)}{P(N)}=\frac{40/100}{70/100}=\frac{4}{7}.$$

Exemplo 9: Retomamos a situação das 100 peças, sendo 20 com defeito. Qual a probabilidade de se escolher 2, sem reposição, e serem ambas defeituosas?

Definimos os eventos A = {1ª com defeito}; B = {2ª com defeito}. O evento favorável é \(A\cap B\) e sua probabilidade é

$$ P(A\cap B)=P(B|A)P(A)=\frac{19}{99}\frac{20}{100}=\frac{19}{495}. $$

Uma observação será útil antes de prosseguirmos: seja \(\{M_{i}\}\) \(i=1,\ldots,\,k,\) é uma partição de \(S\). Podemos decompor \(B\) em partes mutuamente excludentes

$$ A=(A\cap M_{1})\cup\cdots\cup(A\cap M_{k}). $$

Portanto:

$$ P(A)=\sum_{i}P(A\cap M_{i})=\sum_{i}P(A|M_{i})P(M_{i}). $$


Exemplo 10: Na mesma situação anterior, qual a probabilidade de, escolhendo 2 peças, a segunda ter defeito? Novamente temos \(A=\) {1ª com defeito}; \(B=\) {2ª com defeito}. Queremos calcular \(P(B)\). Podemos escrever \(B\) como a união disjunta \(B=\left(B\cap A\right)\cup\left(B\cap\bar{A}\right)\). Então

$$
\begin{array}{rl}
P(B)= & P\left(B\cap A\right)+P\left(B\cap\bar{A}\right)=P(B|A)P(A)+P(B|\bar{A})P(\bar{A}) \\
= & \frac{19}{99}\frac{1}{5}+\frac{20}{99}\frac{4}{5}=\frac{1}{5}.
\end{array}
$$

Exemplo 11: Um produto é manufaturado por 3 fábricas diferentes que chamaremos de \(F_{1},\,F_{2}\)e \(F_{3}\). A quantidade de peças produzida por cada fábrica e a porcentagem de defeitos são exibidas na tabela:

Fábrica produção/dia peças com defeito
F1 2 2%
F2 1 2%
F3 1 4%

Após um certo tempo a produção das 3 fábricas é colocada em um depósito e uma peça é retirada ao acaso. Qual é a probabilidade dela ser defeituosa? Vamos definir os seguintes eventos \(D=\) {peça com defeito}; \(F_i\) = {peça fabricada por \(F_i\)}, \(i=1,2,3\). Podemos usar a união disjunta \(D=\cup_{i}(D\cap F_{i})\) para calcular

$$
\begin{array}{rl}
P(A)=& \sum_{i}P(D\cap F_{i})=\sum_{i}P(D|F_{i})P(F_{i})\\
=& P(D|F_{1})P(F_{1})+P(D|F_{2})P(F_{2})+P(D|F_{3})P(F_{3}) \\
=& 00,2\frac{1}{2}+00,2\frac{1}{4}+00,4\frac{1}{4}=0,025.
\end{array}
$$

Podemos ainda fazer a seguinte pergunta: Suponha que a peça retirada é defeituosa. Qual é a probabilidade de que ela tenha sido produzida na \(F_1?\) Queremos, portanto, \(P(F_{1}|D)\). Usamos

$$
\begin{array}{rl}
P(F_1|D)= & \frac{P(D|F_1)P(F_1)}{P(D)}=\frac{P(D|F_1)P(F_{1})}{\sum_{i=1}^{3}P(D|F_i)P(F_i)}= \\
& \frac{(0,02)\frac{1}{2}}{(0,02)\frac{1}{2}+(0,02)\frac{1}{4}+(0,04)\frac{1}{4}}=0,04,
\end{array}
$$

onde, na segunda igualdade, foi usado o fato de que \({F_i}\) é uma partição do espaço amostral.

Teorema de Bayes

Seja \({B_i}\) uma partição do espaço amostral e \(A\) um evento de \(S.\) Então
$$ P(B_i|A)=\frac{P(A|B_i)\,P(B_i)}{\sum_{k=1}^{3}P(A|B_k)\,P(B_k)},\:i=1,…,\,n. $$

Eventos independentes

Dois eventos são ditos independentes se a ocorrência de um não afeta a probabilidade de ocorrência do outro.

Exemplo 12: Um dado é jogado 2 vezes. Definimos os eventos \(A=\){1º mostra número par}, \(B=\){2º cai 5 ou 6}. Vemos que são dois eventos não relacionados. Temos

$$ P(A)=\frac{1}{2},\;\; P(B)=\frac{1}{3}.$$
$$ P(A\cap B)=\frac{6}{36}=\frac{1}{6}, $$

pois \(A\cap B=\{(2,5),(2,6),(4,5),(4,6),(6,5),(6,6)\}\). Consequentemente

$$ P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{1}{2}. $$

Observamos que \(P(A|B)=P(A).\) Da mesma forma \(P(B|A)=P(B).\)

Definição: \(A\)e \(B\)são eventos independentes se, e somente se, \(P(A\cap B)=P(A)P(B).\)

Uma boa revisão sobre a Teoria dos Conjuntos pode ser vista em Gigamatematica: Conjuntos Enumeráveis

5 – Singularidades e Resíduos

Como vimos a analiticidade de uma função complexa é uma característica bastante restritiva. é possível que uma função seja analítica em uma região e não seja em outra, ou que deixe de ser analítica apenas em um número finito de pontos de seu domínio.

Definição: Se uma função \(f\) é analítica em uma região \(R\), exceto em um subconjunto \(S\) de \(R\) então os pontos de \(S\) são chamandos de pontos singulares desta função ou, simplesmente, singularidades. Como exemplo, \(z_0=0\) é singularidade de \(1/z\) e \(1/z^{2}\), enquanto \(z_0=\pm i\) são as singularidares de \(1/(z^{2}+1)\). Por outro lado a função \(f(z) =\left\vert z\right\vert^{2}\) não tem nenhum ponto singular já que não é analítica em nenhum ponto de seu domínio. As séries de Laurent representam o instrumento adequado para o estudo das sigularidades de uma função.

Singularidades isoladas

Se \(f\) é analítica em alguma vizinhança de um ponto \(z_0\), exceto no próprio ponto \(z_0\), então dizemos que \(z_0\) é uma singularidade isolada da função \(f\). Como exemplo temos que a função
$$
f(z) =\frac{1}{1-\cos z}
$$
é singular nos pontos \(z=2n\pi,\;\;n=0,\pm 1,\ \pm 2,\cdots\), que são os pontos onde o denominador se anula. Se \(z_0\) é uma singularidade isolada de uma função \(f\) então ela admite o desenvolvimento de Laurent
$$
f(z)=\sum\limits_{n=1}^{\infty}\frac{a_{-n}}{(z-z_0)^{n}}+\sum\limits_{n=0}^{\infty}a_{n}(z-z_0)^{n}=\sum\limits_{n=-\infty }^{\infty }a_{n}(z-z_0)^{n},
$$
válido na região \(0\lt \left\vert z-z_0\right\vert \lt r,\;\) a chamada vizinhança perfurada de \(z_0\). Os coeficientes da expansão são, como já vimos,

(1)

$$
a_{n}=\frac{1}{2\pi i}\oint\limits_{C}\frac{f(z) dz}{(z-z_0)^{n+1}},
$$
onde \(C\) é um contorno fechado que envolve \(z_0\) uma vez, no sentido positivo. Em particular estaremos interessados em obter o coeficiente \(a_{-1}\), definido abaixo, por um motivo que logo ficará claro.

Definição: Ao coeficiente \(a_{-1}\) da expansão de Laurent para uma função \(f\) analítica em uma vizinhança perfurada de \(z_0\) chamamos de resíduo de \(f\) no ponto singular isolado \(z_0\) e denotamos

(2)

$$
\text{Res}( f,z_0) =a_{-1}=\frac{1}{2\pi i}\oint\limits_{C}f(z) dz.
$$

A expressão acima fornece uma forma para o cálculo de uma integral de contorno com integrando complexo. Para isto basta encontrar a expansão de Laurent em séries para o integrando e identificar o resíduo da função em seu ponto singular Embora pela equação (2) acima já sabemos que \(\oint\nolimits_{C}f(z) dz=2\pi i\text{Res}( f,z_0)\), pode ser esclarecedor, apesar de repetitivo, mostrar o seguinte procedimento. Se \(z_0\) é ponto singular isolado de \(f\) então esta função admite a série de Laurent
$$
f(z) =\sum\limits_{n=-\infty }^{\infty }a_{n}(z-z_0)^{n}.
$$
Dentro da região de convergência da série ela pode ser integrada termo a termo,

(3)

$$
I=\oint\limits_{C}f(z) dz=\sum\limits_{n=-\infty }^{\infty}a_{n}\oint\limits_{C}(z-z_0)^{n}dz.
$$
Fazendo \(z-z_0=\delta e^{i\theta }\) temos \(dz=i\delta e^{i\theta }d\theta\) e, caso \(n\neq -1\),
$$
\oint\limits_{C}(z-z_0)^{n}dz=i\delta^{n+1}\int_0^{2\pi}e^{i\theta ( n+1)}d\theta =i\delta^{n+1}\left. \frac{e^{i\theta ( n+1)}}{i( n+1)}\right\vert _0^{2\pi }=\frac{\delta^{n+1}}{n+1}\left[ e^{2( n+1) i\pi }-1\right] =0.
$$
O único termo não nulo ocorre para \(n=-1\),
$$
\oint\limits_{C}\frac{dz}{z-z_0}=2\pi i.
$$
Como já afirmado, a integral avaliada em (3) é
$$
\oint\limits_{C}f(z) dz=2\pi i\ a_{-1}.
$$

O uso do cálculo de resíduos para calcular integrais sobre contornos fechados de uma função que envolve pontos singulares isolados é exemplificado a seguir.

Exemplo 1: Podemos calcular a integral
$$
I=\oint\limits_{\left\vert z\right\vert =2}e^{-z}(z-1)^{-2}dz
$$
simplesmente encontrando o resíduo do integrando. A única singularidade deste integrando é \(z_0=1\), um ponto que está na região interior ao contorno de integração. Devemos então encontrar a série de Laurent para o integrando. Para isto observe que
$$
e^{-z}=e^{-z+1-1}=e^{-1}e^{-(z-1)
}=e^{-1}\sum\limits_{n=0}^{\infty }\frac{(-1)^{n}}{n!}(
z-1)^{n},
$$
e, portanto,
$$
f=\frac{e^{-z}}{(z-1)^{2}}=\frac{e^{-z}}{(z-1)^{2}}\left[ 1-(z-1) +\frac{(z-1)^{2}}{2!}-\frac{(z-1)^{3}}{3!}+\ldots \right],
$$
$$
=\frac{e^{-z}}{(z-1)^{2}}\left[ \frac{1}{(z-1)^{2}}-\frac{1}{(z-1)}+\frac{1}{2!}-\frac{(z-1)}{3!}+\ldots \right]
$$
de onde ser observa que \(a_{-1}=\text{Res}( f,1) =-e^{-1.}\) Portanto temos que
$$
\oint\limits_{\left\vert z\right\vert =2}e^{-z}(z-1)^{-2}dz=2\pi i\text{Res}( f,1) =-\frac{2\pi i}{e}.
$$

Exemplo 2: Para calcular \(\oint\nolimits_{\left\vert z\right\vert =1}\exp ( 1/z^{2}) dz\) observamos que a única singularidade do integrando é \(z=0\), um ponto interior ao contorno de integração. Observe que, fazendo \(u=1/z^{2}\) temos
$$
e^{u}=\sum\limits_{n=0}^{\infty }\frac{u^{n}}{n!}=\sum\limits_{n=0}^{\infty }\frac{1}{n!}\frac{1}{z^{2n}}=1+\frac{1}{z^{2}}+\frac{1}{2!z^{4}}+\frac{1}{3!z^{6}}+\ldots ,
$$
convergente em \(\left\vert z\right\vert \gt 0\). O resíduo é \(\text{Res}( f,0) =0\) e
$$
\oint\limits_{\left\vert z\right\vert =1}\exp ( 1/z^{2}) dz=2\pi i\text{Res}( f,0) =0.
$$

O teorema dos resíduos

Enunciamos a seguir o teorema dos resíduos, útil para o cálculo de integrais realizada sobre um caminho que circula um número finito de singularidades. Observamos que, se uma função possui um número finito de pontos singulares em um domínio então estes pontos são necessariamente isolados.

Teorema: Seja \(f\) uma função analítica sobre o contorno fechado \(C\) e em seus pontos interiores, exceto em um número finito de pontos, \(z_{1},\ z_{2},\ldots ,\ z_{n}\), interiores a \(C\). Então
$$
\oint\limits_{C}f(z) dz=2\pi i\sum\limits_{k=1}^{n}\text{Res}( f,z_{k}) ,
$$
onde o contorno é percorrido uma vez, no sentido positivo e \(\text{Res}( f,z_{k})\) é o resíduo da função \(f\) no ponto \(z_{k}\).

Demonstração: Como os pontos singulares são isolados podemos construir círculos \(C_{k}\) com centro em \(z_{k}\) e raios suficientemente pequenos para que cada círculo envolva apenas a singularidade em seu centro. Em seguida construimos o caminho \(\gamma =C\cup (-C_{1}) \cup(-C_{2}) \cup \ldots \cup (-C_{k}),\) como mostrado na figura 1.

Figura 1.

A função \(f\) é analítica em \(\gamma\) e seu interior de forma que
$$
0=\oint\limits_{\gamma }f(z) dz=\oint\limits_{C}f(
z) dz-\oint\limits_{C_{1}}f(z)
dz-\oint\limits_{C_{2}}f(z) dz-\ldots
-\oint\limits_{C_{n}}f(z) dz
$$
ou seja
$$
\oint\limits_{C}f(z)
dz=\sum\limits_{k=1}^{n}\oint\limits_{C_{1}}f(z) dz=2\pi
i\sum\limits_{k=1}^{n}\text{Res}( f,z_{k}).
$$

Exemplo 3: Para mostrar a utilidade do teorema acima vamos calcular
$$
\oint\limits_{\left\vert z\right\vert =2}\frac{5z-2}{z(z-1)}dz.
$$
Observamos, inicialmente, que os pontos sigulares do integrando são \(z=0\) e \(z=1\), ambos interiores à região circundada por \(C\). Devemos determinar os resíduos do integrando nestes pontos. Em torno de \(z=0\) a função \(1/( 1-z)\) é analítica e tem série de Taylor dada por
$$
\frac{1}{z-1}=-\sum\limits_{n=0}^{\infty }z^{n},\ \left\vert z\right\vert \lt 1.
$$
O integrando pode ser escrito como
$$
\frac{5z-2}{z}\frac{1}{z-1}=\frac{2-5z}{z}\sum\limits_{n=0}^{\infty}z^{n}=( \frac{2}{z}-5) \sum\limits_{n=0}^{\infty }z^{n}=
$$
$$
=2\sum\limits_{n=0}^{\infty }z^{n-1}-5\sum\limits_{n=0}^{\infty }z^{n}=\frac{2}{z}-3\sum\limits_{n=0}^{\infty }z^{n},
$$
válida em \(0\lt \left\vert z\right\vert \lt 1\). Concluímos que \(\text{Res}( f,0) =2\).

Por outro lado, na vizinhança de \(z=1\) temos que \(1/z\) é a função analítica. Queremos escrever o integrando em potências de \((z-1)\) para descobrir qual é o seu resíduo neste ponto. Fazemos
$$
\frac{1}{z}=\frac{1}{z-1+1}=\sum\limits_{n=0}^{\infty }(-1)^{n}(z-1)^{n},\;\; \left\vert z-1 \right\vert \lt 1,
$$
e, portanto,
$$
\frac{5z-2}{z(z-1)}=( \frac{5z-5+3}{z-1}) \frac{1}{z}=( 5+\frac{3}{z-1}) \sum\limits_{n=0}^{\infty }(-1)^{n}(z-1)^{n}=
$$
$$
=5\sum\limits_{n=0}^{\infty }(-1)^{n}(z-1)
^{n}+3\sum\limits_{n=0}^{\infty }(-1)^{n}(z-1)
^{n-1}=\frac{3}{z-1}+2\sum\limits_{n=0}^{\infty }(-1)
^{n}(z-1)^{n}.
$$
Na última igualdade foi feito:
$$
3\sum\limits_{n=0}^{\infty }(-1)^{n}(z-1)^{n-1}=\frac{3}{z-1}+3\sum\limits_{n=1}^{\infty }(-1)^{n}(
z-1)^{n-1}=\frac{3}{z-1}+3\sum\limits_{n=0}^{\infty }(
-1)^{n+1}(z-1)^{n}.
$$
O resíduo neste ponto é \(\text{Res}( f,1) =3\) e
$$
\oint\limits_{\left\vert z\right\vert =2}\frac{5z-2}{z(z-1)}dz=2\pi i\left[ \text{Res}( f,0) +\text{Res}(
f,1) \right] =10\pi i.
$$

Observe que, neste caso, seria mais fácil escrever o integrando usando frações parciais,
$$
\frac{5z-2}{z(z-1)}=\frac{2}{z}+\frac{3}{z-1}
$$
e, portanto,
$$
\oint\limits_{\left\vert z\right\vert =2}\frac{5z-2}{z(z-1)}dz=2\oint\limits_{\left\vert z\right\vert =2}\frac{dz}{z}+3\oint\limits_{\left\vert z\right\vert =2}\frac{dz}{z-1}=10\pi i.
$$
Nem sempre é possível, no entanto, proceder desta última forma e, frequentemente a integração pelo método dos resíduos representa uma ferramenta poderosa para a solução de integrais definidas, como veremos.

Singularidades tipo pólo

Se a série de Laurent de uma função
$$
\begin{array}{ccc}
f(z)=& \underbrace{\sum\limits_{n=1}^{\infty }\frac{a_{-n}}{(z-z_0)^{n}}} & +\underbrace{\sum\limits_{n=0}^{\infty}a_{n}(z-z_0)^{n}}, \\
& \text{ parte principal} & \text{ parte analítica}
\end{array}
$$
é composta por um número finito de termos na parte principal então existe um maior inteiro \(m\) tal que \(a_{-m}\) seja não nulo e

(4)

$$
f(z)=\frac{a_{-1}}{z-z_0}+\frac{a_{-2}}{(z-z_0)^{2}}+\ldots +\frac{a_{-m}}{(z-z_0)^{m}}+\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n}.
$$
Neste caso \(z_0\) é dito um pólo de ordem \(m\). Se \(m=1\) então o pólo é simples. Se a parte principal tem infinitos termos o pólo é dito essencial.

Exemplo 4: A função
$$
f(z) =\frac{z^{2}+1}{z-1}
$$
tem um pólo simples em \(z=1\). Para confirmar isto fazemos
$$
f(z) =\frac{(z-1)^{2}+2z}{z-1}=(z-1) +\frac{2z-2+2}{z-1}=(z-1) +2+\frac{2}{z-1}.
$$
Além disto \(\text{Res}( f,~1) =2\).

Exemplo 5: A função
$$
f(z) =\frac{z^{2}-2z+3}{z-2}
$$
pode ser escrita como
$$
f(z) =\frac{(z-2)^{2}+2z-1}{z-2}=(z-2) +\frac{2z-4+3}{z-2}=(z-2) +2+\frac{3}{z-2}.
$$
Então \(z=2\) é um pólo simples e \(\text{Res}( f,~2)=3\).

Exemplo 6: A seguinte função tem um pólo em \(z=0\) de ordem 3 e \(\text{Res}( f,0) =0:\)
$$
f(z) =\frac{\text{ senh }z}{z^{4}}=\frac{1}{z^{4}}(z+\frac{z^{3}}{3!}+\frac{z^{5}}{5!}+\frac{z^{7}}{7!}+\ldots ) =\frac{1}{z^{3}}+\frac{1}{3!}+\frac{z}{5!}+\frac{z^{3}}{7!}+\ldots .
$$
Já o \(\cosh ( 1/z)\) tem uma singularidade essencial em \(z=0\) e resíduo nulo:
$$
\cosh \left( \frac{1}{z} \right) =\sum\limits_{n=0}^{\infty }\frac{1}{(2n) !}\frac{1}{z^{2n}}.
$$
Recordamos que
$$
\cosh z=\frac{1}{2}( e^{z}+e^{-z}) =\frac{1}{2}(
\sum\limits_{n=0}^{\infty }\frac{z^{n}}{n!}+\sum\limits_{n=0}^{\infty
}(-1)^{n}\frac{z^{n}}{n!}) =
$$
$$
=\sum\limits_{n=\text{par}}^{\infty }\frac{z^{n}}{n!}=\sum\limits_{n=0}^{\infty }\frac{z^{2n}}{( 2n) !}.
$$

Suponha que \(f\) tem um pólo de ordem \(m\) em \(z_0\). Neste caso a função
$$
\phi (z) =(z-z_0)^{m}f(z) ,
$$
definida em \(0 \lt |z-z_0|\lt r_{1}\) é uma função analítica definida em uma vizinhança de \(z_0\), exceto no próprio \(z_0\), uma vez que \(f\) não é definida neste ponto. Devido à expressão de Laurent para \(f\), dada em (4) podemos escrever

(5)

$$
\phi (z) =a_{-1}(z-z_0)^{m-1}+a_{-2}(z-z_0)^{m-2}+\ldots +a_{-m}+\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{m+n},
$$
onde \(a_{-m}\neq 0\). Se definirmos esta função no ponto \(z_0\) como \(\phi (z_0) =a_{-m}\) então a representação em (5), sendo convergente, é válida na vizinhança de \(z_0\) incluindo o próprio ponto \(z_0\), definindo uma função analítica \(\phi\). A definição de \(\phi (z_0)\) dada acima é equivalente à
$$
\phi (z_0) =\lim_{z\rightarrow z_0}(z-z_0)^{m}f(z) =a_{-m}.
$$
Como \(a_{-m}\) é finito e não nulo concluímos que \(|f(z) |\) deve necessariamente tender a infinito quando \(z\rightarrow z_0\).

Um outro tipo de singularidade é a denominada ponto singular removível: se uma função \(\phi\) pode se tornada analítica em seu ponto singular \(z_0\) simplesmente por meio da atribuição de um valor conveniente para \(\phi (z_0)\) então dizemos que \(z_0\) é um ponto singular removível de \(\phi\). Um exemplo disto é a função \(\phi (z) =(z-z_0)^{m}f(z)\), definida à partir de \(f\), uma função com pólo de ordem \(m\) em \(z_0\). Observe que esta função tem representação em séries de Taylor dada por (5), de forma que

(6)

$$
a_{-1}=\frac{\phi^{( m-1)}(z_0)}{(m-1)!}.
$$
Em particular, quando o pólo é simples, \(m=1\) e \(a_{-1}\) é o resíduo da função \(f\) no ponto \(z_0\) temos que
$$
a_{-1}=\phi (z_0) =\lim_{z\rightarrow z_0}(z-z_0) f(z).
$$
Por outro lado, se uma função \(f\) é tal que o produto
$$
(z-z_0)^{m}f(z) =\phi (z)
$$
possa ser definido em \(z_0\) de modo a ser analítico neste ponto podemos encontrar a representação de Taylor
$$
(z-z_0)^{m}f(z) =\phi (z)
=\sum\limits_{n=0}^{\infty }\frac{\phi^{( n)}(z_0)}{n!}(z-z_0)^{n}.
$$
Um uma vizinhança de \(z_0\), para pontos distintos de \(z_0\) temos
$$
f(z) =\frac{\phi (z)}{(z-z_0)^{m}}=\sum\limits_{n=0}^{\infty }\frac{\phi^{( n)}(z_0)}{n!}(z-z_0)^{n-m}=\sum\limits_{n=-m}^{\infty }\frac{\phi^{(n+m)}(z_0)}{( n+m) !}(z-z_0)^{n}.
$$
Concluimos dai que \(f\) tem um pólo de ordem \(m\) em \(z=z_0\) e que seu resíduo é dado pela fórmula (6). Estas considerações implicam em um teste para a existências de pólos, descrito no teorema que se segue.

Teorema: Se \(f\) uma função singular no ponto \(z_0\) mas, para algum inteiro \(m\) a função
$$
\phi (z) =(z-z_0)^{m}f(z) ,\;\; \phi (z_0) \neq 0,
$$
é analítica em \(z_0\) então \(z_0\) é pólo de ordem \(m\) de \(f\) e

(7)

$$
\text{Res}(f,~z_0) =\left\{
\begin{array}{ll}
\phi (z_0) =\lim_{z\rightarrow z_0}(z-z_0)f(z) ,\; & \text{ se }\; m=1, \\
\frac{\phi^{(m-1)}(z_0)}{(m-1)!}, & \text{se }\; m \gt 1.
\end{array}
\right.
$$
Note que, em particular, as condições do teorema são satisfeitas se
$$
f(z) =\frac{\phi (z)}{(z-z_0)^{m}},\;\;m=1,2,\ldots ,
$$
e a função \(\phi\) é analítica em \(z_0\), com \(\phi (z_0)\) não nulo.

Exemplo 7: A função
$$
f(z) =\frac{\exp ( -2z)}{z^{3}}
$$
satisfaz às condições do teorema. Ela tem um ponto singular em \(z_0=0\), e
$$
\phi (z) =\exp ( -2z)
$$
é analítica e não nula em \(z=0\). Como \(m=3\) seu resíduo neste ponto, de acordo com a fórmula (7), é
$$
\text{Res}( f,\ 0) =\frac{\phi^{( 2)}(0)}{2!}=2.
$$

Exercícios :

1. Encontre os pólos, suas ordens e os resíduos das funções para cada pólo:
$$
\begin{array}{lll}
\text{ a. }\;\; \frac{z+4}{z(z^{2}+1)} & \text{ b. }\;\;
\frac{\text{sen }z}{z^{3}(z-\pi )} & \text{ c. }\;\;\frac{1}{z\text{sen }^{2}\pi z} \\
\text{ d. }\;\;\frac{1-e^{z}}{z^{4}\text{sen }( 1+z)} &
\text{ e. }\;\;\frac{e^{z}}{z( 1-e^{-z})} & \text{ f. }\;\;\frac{1}{(e^{iz}-1)^{2}}\; \\
\text{ g. }\;\;\frac{\cosh z}{z( 1-\cos z)} & \text{ h. }\;\;\frac{\text{ senh }z}{z\text{sen }^{2}(z+\pi /2)}
\end{array}
$$

2. Mostre que \(z=0\) é singularidade removível em cada uma das funções abaixo. Determine o valor a se atribuir em \(z=0\) para que as funções sejam analíticas.
$$
\begin{array}{lll}
\text{ a. }\;\; \frac{z}{e^{z}-1} & \text{ b. }\;\;\frac{e^{z}-1}{\text{sen }2z} & \text{ c. }\;\;\frac{\cosh 2z-1}{\text{sen }^{2}z} \\
\text{ d. }\;\;\frac{1}{e^{z}-1}-\frac{1}{z} & \text{ e. }\;\;\frac{1}{z}-\frac{1}{\text{sen }z} & \text{ f. }\;\;\frac{1}{(e^{iz}-1)^{2}} \\
\text{ g. }\;\;\frac{\cosh z}{z( 1-\cos z)} & \text{ h. }\;\;\frac{\text{ senh }z}{z\text{sen }^{2}(z+\pi /2)} &
\end{array}
$$

3. Encontre a parte principal da função \(f(z) =1/z(z-i)^{2}\) em relação ao pólo \(z=i\).

Algumas respostas e sugestões:

1a. \(z=0,\; i,\; -i,\;\) de ordens \(1,\, 2\) e \(2\) respectivamente.

1c. \(z=0\) de ordem 3, \(z=\pm 1,\pm 2, \pm 3, \ldots \) de ordem \(2\), cada.

1e. \(z=0\) de ordem 2, \(z=2k\pi , k\neq 0\) inteiro, de ordem 1, cada.

1g. \(z=0\) de ordem 3, \(z=2k\pi ,\; k\neq 0\;\) inteiro, de ordem 2, cada.

3. \(\frac{-i}{(z-i)^{2}}+\frac{1}{z-i}\)

Cálculo de Integrais Impróprias

Uma aplicação importante para o cálculo de integrais complexas usando a teoria dos resíduos está na avaliação de integrais impróprias com integrandos reais. Podemos desde já fornecer um exemplo deste uso.

Exemplo 8: Vamos usar o teorema dos resíduos para calcular a integral
$$
I=\int_{-\infty }^{\infty }\frac{dx}{x^{2}+1}.
$$
Embora esta seja uma integral real, efetuada sobre todo o eixo real, ela pode ser colocada como parte de uma integração no plano complexo, mais fácil de ser calculada. Para ver isto considere a integral
$$
\oint\limits_{C}\frac{dz}{z^{2}+1}
$$
onde \(C\) é o contorno \(C=C_{R}\cup L\), representado na figura 2. \(C_{R}\) é o arco de circunferência de raio \(R\) em \(y\gt 0\), enquanto \(L\) é o segmento de reta de \(-R\) até \(R\) sobre o eixo real.

Figura 2.

O integrando é
$$
\frac{1}{z^{2}+1}=\frac{1}{z+i}\frac{1}{z-i}=\frac{1}{2i}\frac{1}{z-i}+\frac{1}{4}\sum ( \frac{i}{2})^{n}(z-i)^{n}
$$
que tem um pólo simples em \(z=i\), o único envolvido pelo contorno, e resíduo, neste ponto \(\text{Res}( f,i) =1/2i\). Alternativamente, usando a fórmula (7) temos que
$$
(z-i) \frac{1}{z^{2}+1}=\frac{1}{z+i}=\phi
$$
que é analítica em \(z=i\). Dai o pólo é simples e
$$
\text{Res}( \frac{1}{z^{2}+1},\ i) =\phi ( i) =\frac{1}{2i}.
$$
Dai concluimos que
$$
\oint\limits_{C}\frac{dz}{z^{2}+1}=\pi .
$$
Observamos que \(\oint\nolimits_{C}=\int_{I}+\int_{C_{R}}\), ou seja,
$$
\pi =\int_{-R}^{R}\frac{dx}{x^{2}+1}+\int_{C_{R}}\frac{dz}{z^{2}+1}.
$$
Resta apenas observar que, no limite \(R\rightarrow \infty\) a segunda integral é nula. Para ver isto note que sobre \(C_{R}\) temos que \(\left\vert z\right\vert =R\) e
$$
\left\vert z^{2}+1\right\vert \geq \left\vert z^{2}\right\vert -1=R^{2}-1,
$$
onde usamos a desigualdade
$$
\left\vert z_{1}+z_{2}\right\vert \geq \left\vert z_{1}\right\vert -\left\vert z_{2}\right\vert .
$$
Como consequência
$$
\left\vert \int_{C_{R}}\frac{dz}{z^{2}+1}\right\vert \leq \frac{1}{R^{2}-1}\int_{C_{R}}\left\vert dz\right\vert =\frac{\pi R}{R^{2}-1}\underset{R\rightarrow \infty }{\longrightarrow }0.
$$
Resta apenas a integral que queríamos calcular:
$$
\int_{-\infty }^{\infty }\frac{dx}{x^{2}+1}=\pi .
$$

O procedimento mostrado acima pode ser generalizado para o cálculo de integrais na forma de
$$
\int_{-\infty }^{\infty }\frac{P(x)}{Q(x)}dx
$$
onde \(P\) e \(Q\) são polinômios que diferem, em graus, da seguinte forma
$$
\text{grau }Q-\text{grau }P=m\geq 2.
$$
Como antes, tomamos as extensões das funções envolvidas, \(P(z)\) e \(Q(z)\) e construímos um contorno \(C=C_{R}\cup L\), idêntico ao da figura 2, usada no exemplo anterior. Como \(z^{m}P(z)\) e \(Q(z)\) têm o mesmo grau, o limite
$$
\lim_{z\rightarrow \infty }\frac{z^{m}P(z)}{Q(z)}=M
$$

é finito e não nulo. Em outras palavras, para \(|z|=R\) suficientemente grande temos que
$$
\left\vert \frac{P(z)}{Q(z)}\right\vert \leq \frac{M}{\left\vert z\right\vert^{m}}=\frac{M}{R^{m}}.
$$
A integração sobre o arco de circunferência se anula pois
$$
\left\vert \int_{C_{R}}\frac{P(z)}{Q(z)}dz\right\vert \leq \frac{M}{R^{m}}\int_{C_{R}}\left\vert dz\right\vert =\frac{\pi MR}{R^{m}}=\frac{\pi M}{R^{m-1}},
$$
que se anula quando \(R\rightarrow \infty\) pois \(m\geq 2\). Neste limite resta, portanto,
$$
\int_{-\infty }^{\infty }\frac{P(x)}{Q(x)}dx=\oint_{C}\frac{P(z)}{Q(z)}dz=2\pi i\sum_{k=1}^{n}\text{Res}( \frac{P(z)}{Q(z)},z_{k}),
$$
onde a soma é feita sobre todos os pólos do integrando no semiplano \(y\gt 0\).

Exercícios :

1. Calcule as integrais indefinidas:
$$
\begin{array}{lll}
\text{ a. }\;\; \int_{-\infty }^{\infty }\frac{dx}{x^{4}+1} &
\text{ b. }\;\; \int_{-\infty }^{\infty }\frac{dx}{ax^{2}+bx+c}, & a,b,c\in \mathbb{R}, b^{2}\lt 4ac. \\
\text{ c. }\;\; \int_0^{\infty }\frac{x^{2}dx}{x^{4}+9} &
\text{ d. }\;\; \int_{-\infty }^{\infty }\frac{dx}{x^{2}-x+1} &
\text{ e. }\;\; \int_0^{\infty }\frac{dx}{x^{6}+1}\; \\
\text{ f. }\;\; \int_{-\infty }^{\infty }\frac{xdx}{(x^{2}+4x+13)^{2}} &
\text{ g. }\;\; \int_0^{\infty }\frac{x^{2}dx}{(x^{2}+a^{2})^{2}}, a\gt 0, &
\text{ h. }\;\; \int_0^{\infty }\frac{x^{2}+1}{x^{4}+1}dx
\end{array}
$$

2) Mostre que \(\int_0^{\infty }\frac{dx}{(x^{2}+a^{2})(x^{2}+b^{2})}=\frac{\pi }{2ab( a+b)}\).

Algumas respostas e sugestões:

1a. \(\pi /\sqrt{2}\)
1b. \(2\pi /\sqrt{4ac-b^{2}}\)
1c. Observe que o integrando é par, logo \(\int_0^{\infty }=\frac{1}{2}\int_{-\infty }^{\infty }\).
1d. \(\pi \sqrt{2}/4\sqrt{3}\)
1f. \(-\pi /27\)
1g. \(\pi /4a\).

4 – Séries de Potências

Revisão: Sequências e Séries

Antes de iniciarmos o estudo de séries de números e funções complexas faremos uma revisão destes conceitos utilizando números e funções reais, de variáveis reais. Para maiores detalhes consulte qualquer livro texto de Cálculo II.

Sequências Infinitas

Definiremos uma sequência infinita como um conjunto infinito de números que podem ser colocados em uma relação biunívoca com o conjunto dos números inteiros positivos. Denotaremos por \(\left\{a_n\right\}\) a uma sequência, sendo \(a_n\), com \(n=1,2,..\). os elementos individuais desta sequência.

Exemplo 1: Considere \(\left\{a_{n}\right\}\) a sequência com termo genérico \(a_{n}=1/n\). Neste caso
$$
\left\{a_{n}\right\} =\left\{1,\frac{1}{2},\frac{1}{3},\cdots \right\}.
$$
Observe que os termos desta sequência se aproximam de \(0\) para \(n\) suficientemente grande.

Definição: Dizemos que a sequência converge para um número \(L\), ou tem limite \(L\), se, dado qualquer número \(\varepsilon \gt 0\) existe um número \(N\) tal que
$$
n\gt N\Rightarrow \left\vert a_{n}-L\right\vert \lt\varepsilon.
$$
Usaremos como notação
$$
L=\lim_{n\rightarrow \infty }a_{n},\;\;\;\text{ ou }\;\; a_{n}\rightarrow L.
$$
Observe que, se \(\left\vert a_{n}-L\right\vert \lt\varepsilon\) então
$$
-\varepsilon \lt a_{n}-L\lt\varepsilon \Longleftrightarrow L-\varepsilon \lt a_{n}\lt L+\varepsilon.
$$
Portanto a convergência de uma sequência para um valor \(L\) significa que \(a_{n}\) fica arbitrariamente próximo de \(L\) quando se toma \(n\) suficientemente grande. Se uma sequência não converge para nenhum número dizemos que ela diverge.

Exemplo 2: A sequência do exemplo 1, \(a_n=1/n\) converge para \(L=0\).

Exemplo 3: A seguinte sequência converge para \(L=2/3\)
$$
a_{n}=\frac{2n^{2}+n-1}{3n^{2}-n}.
$$
Para ver isto dividimos o numerador e o denominador por \(n^{2}\),
$$
L=\lim_{n\rightarrow \infty }\frac{2n^{2}+n-1}{3n^{2}-n}=\lim_{n\rightarrow \infty }\frac{2+1/n-1/n^{2}}{3-1/n}=\frac{2}{3},
$$
onde usamos o fato de que \(1/n\rightarrow 0\) e \(1/n^{2}\rightarrow 0\).

Exemplo 4: A sequência \(\left\{\text{sen }n\right\}\) não converge para nenhum número, oscilando indefinidamente entre \(\,-1\) e \(1\). A sequência \(a_{n}=(n^{2}+1) /n\) também não converge pois tende a infinito com \(n\rightarrow \infty\).

Séries Infinitas

Definiremos uma série infinita como a soma dos elementos de uma sequência infinita. Denotaremos a série por
$$
S=\sum_{n=0}^{\infty }a_{n}=a_0+a_{1}+a_{2}+a_{3}+\cdots.
$$
A soma de infinitos termos não tem um significado óbvio e imediato. Para atribuir a ela um sentido inequívoco definiremos antes a soma dos \(N\) primeiros termos da série, denominada a soma reduzida,
$$
S_{N}=\sum_{n=1}^{N}a_{n}.
$$
Observe agora que o conjunto destas somas reduzidas forma uma sequência \(\left\{S_{n}\right\} =S_{1},S_{2},S_{3},\cdots\), que pode convergir ou não. Dizemos que a série infinita converge para um número \(L\) se a sequência \(\left\{S_{n}\right\}\) converge para \(L\), ou seja,
$$
S_{n}\rightarrow L\Longleftrightarrow \sum_{n=1}^{\infty }a_{n}=L.
$$
Caso contrário a série diverge e denotamos
$$
\sum_{n=1}^{\infty }a_{n}=\infty \;\;\;\text{ ou }\;\;\sum_{n=1}^{\infty}a_{n}=-\infty,
$$
conforme o caso.

Exemplo 5: Um exemplo interesssante de uma série convergente é o seguinte:
$$
\sum_{n=0}^{\infty }\frac{1}{n!}=1+1+\frac{1}{2!}+\frac{1}{3!}+\cdots =\text{e},
$$
onde, por convenção, fazemos \(0!=1\). Este é um caso particular da série mais geral
$$
\sum_{n=0}^{\infty }\frac{x^{n}}{n!}=1+x+\frac{x^{2}}{2!}+\frac{x^{3}}{3!}+\cdots =\text{ e}^{x}.
$$
No último exemplo a função exponencial foi escrita como uma soma infinita de termos em potências de \(x\). As séries de potências são importantes no estudo das funções e suas aplicações.

Dizemos que uma série \(\sum_{n=0}^{\infty }a_{n}\) converge absolutamente se a série \(\sum_{n=0}^{\infty }\left\vert a_{n}\right\vert\) converge. Observe que toda a série absoluta convergente é convergente, isto é,
$$
\sum_{n=0}^{\infty }\left\vert a_{n}\right\vert \; \text{ converge } \Rightarrow \sum_{n=0}^{\infty }a_{n} \text{ converge.}
$$

Testes de convergência

Os seguintes testes são os mais utilizados para a verificação de convergencia de uma série.

Teste da Comparação: Se duas séries \(\Sigma a_n\) e \(\Sigma b_n\) são séries de termos não negativos (i.e. \(a_n\geq 0\) e \(b_n\geq 0\) para todo \(n)\) e \(a_n\leq\) \(b_n\) para todo \(n\), então
$$
\begin{array}{lll}
(i) & \;\;\text{ se }\;\;\;\Sigma b_n\text{ converge}\Rightarrow & \Sigma a_n\text{
converge} \\
(ii) & \;\;\text{ se }\;\;\;\Sigma a_n\;\;\text{diverge}\Rightarrow & \Sigma b_n\;\;\text{diverge.}
\end{array}
$$

Teste da Razão: \(\;\) Se \(\Sigma a_n\) é uma séries de termos positivos, definimos o limite
$$
R=\lim_{n\rightarrow \infty }\frac{a_{n+1}}{a_n}.
$$
Então, se
$$
\begin{array}{ll}
R \lt 1\Rightarrow & \Sigma a_n\text{ converge} \\
R \gt 1\Rightarrow & \Sigma a_n\;\;\text{diverge} \\
R=1, & \text{o teste é inconclusivo.}
\end{array}
$$

Teste da Integral: Se \(f(x)\) é uma função positiva não crescente para \(x\gt 0\), então a série \(\Sigma f(n)\) converge se, e somente se, a integral imprópria \(\int_1^\infty f(x)dx\) converge. Além disto vale a desigualdade
$$
\sum_{n=2}^Nf(n)\leq \int_1^Nf(x)dx\leq \sum_{n=1}^{N-1}f(n).
$$

Exemplo 6: Usamos o teste da razão para testar a convergência da série
$$
\sum_{n=1}^{\infty }\frac{n^{2}}{n!}.
$$
Temos, neste caso,
$$
a_{n}=\frac{n^{2}}{n!},\;\;a_{n+1}=\frac{( n+1)^{2}}{(n+1)!}
$$
Calculamos o limite
$$
R=\lim_{n\rightarrow \infty }\frac{( n+1)^{2}}{(n+1)!}\frac{n!}{n^{2}}=\lim_{n\rightarrow \infty }\frac{1}{n+1}( \frac{n+1}{n})
^{2}=\lim_{n\rightarrow \infty }\frac{n+1}{n^{2}}=0.
$$
Como \(R \lt 1\) concluimos que a série converge.

Séries de Maclaurin e de Taylor

Uma função que pode ser expressa em termos de uma série infinita de potências em torno do ponto \(x=x_0\),

(1)

$$
f(x)=a_0+a_{1}( x-x_0) +a_{2}( x-x_0)
^{2}+\cdots =\sum_{n=0}^{\infty }a_{n}( x-x_0)^{n}
$$
é dita uma função analítica (neste ponto). Os coeficientes \(a_{n}\) podem ser obtidos do seguinte modo. Calcule o valor de \(f\) e suas derivadas no ponto \(x_0\)
$$
f(x_0)=a_0,
$$
$$
f'(x)=a_{1}+2a_{2}( x-x_0) +3( x-x_0)^{2}+\cdots =\sum_{n=1}^{\infty }na_{n}( x-x_0)^{n-1},
$$
$$
f'(x_0)=a_{1},
$$
$$
f^{\prime \prime }(x)=2a_{2}+2.3a_{3}( x-x_0) +\cdots=\sum_{n=2}^{\infty }n( n-1) a_{n}( x-x_0)^{n-2},
$$
$$
f^{\prime \prime }(x_0)=2a_{2}\Rightarrow a_{2}=\frac{1}{2}f^{\prime\prime }(x_0),
$$
$$
f^{(3)}(x)=2.3a_{3}( x-x_0) +\cdots =\sum_{n=3}^{\infty}n( n-1) ( n-2) a_{n}( x-x_0)^{n-3},
$$
$$
f^{(3)}(x)=2.3a_{3}\Rightarrow a_{3}=\frac{1}{6}f^{(3)}(x_0).
$$
Continuando este procedimento podemos calcular qualquer um dos coeficientes da série (1), obtendo
$$
a_{n}=\frac{1}{n!}f^{(n)}(x_0).
$$
Com estes coeficientes a série é a chamada série de Taylor,

(2)

$$
f(x)=\sum_{n=0}^{\infty }\frac{1}{n!}f^{(n)}(x_0)( x-x_0)^{n},
$$
onde \(f^{(n)}(x_0)\) indica a derivada n-ésima calculada no ponto \(x=x_0\). Uma série de Maclaurin é uma série de Taylor que descreve o comportamento de uma função em torno do ponto \(x_0=0\).

Resumindo: Sobre a série de potências \(S=\sum_{n=0}^{\infty} a_{n}( x-x_0)^{n}\) podemos coletar as seguintes propriedades:

(i) \(S\) converge (escolhido um valor para \(x\)) se existe o limite
$$
\lim_{N\rightarrow \infty }\sum_{n=0}^Na_n( x-x_0)^n.
$$

(ii) Se a série converge absolutamente, ou seja, existe o limite
$$
\lim_{N\rightarrow \infty }\sum_{n=0}^N\left| a_n( x-x_0)^n\right|,
$$
então ela converge.

(iii) Teste da razão: Definindo
$$
R=\lim_{n\rightarrow \infty }\left| \frac{a_{n+1}( x-x_0)^{n+1}}{a_n( x-x_0)^n}\right| =\left| x-x_0\right| \lim_{n\rightarrow
\infty }\left| \frac{a_{n+1}}{a_n}\right|
$$
então a série é absolutamente convergente no ponto \(x\) se \(R \lt 1\) e é divergente se \(R\gt 1\). O teste é inconclusivo se \(R=1\).

(iv) Se a série \(S\) converge em \(x=a\) então ela converge absolutamente para \(x\) no intervalo \(\left[ x-a,\;x+a\right]\). Se a série \(S\) diverge em \(x=a\) então ela diverge para \(x\) fora deste intervalo.

(v) O intervalo máximo de valores de \(x\) para os quais a série converge absolutamente é chamado o intervalo de convergência. O raio de convergência é \(\rho\) é definido de forma que \(\left[x_0-\rho ,x_0+\rho \right]\) é este intervalo.

Algumas considerações finais sobre o uso do sinal de somatório podem ser úteis. O índice usado pode ser substituído de acordo com as conveniências
$$
\sum_{i=1}^{N}a_{i}=\sum_{j=1}^{N}a_{j},
$$
e as parcelas da soma podem ser agrupadas ou isoladas, como nos exemplos a seguir:
$$
\sum_{i=1}^{N}a_{i}=\sum_{i=1}^{N-1}a_{i}+a_{N}=a_{1}+\sum_{i=2}^{N}a_{i},
$$
$$
\sum_{i=1}^{N}a_{i}=\sum_{i=1}^{P}a_{i}+\sum_{i=P+1}^{N}a_{i},\;\;1 \lt P \lt N.
$$
Pode ser mostrado por indução que
$$
\sum_{i=1}^{N}( a_{i}+b_{i})
=\sum_{i=1}^{N}a_{i}+\sum_{i=1}^{N}b_{i},
$$
$$
\sum_{i=1}^{N}ka_{i}=k\sum_{i=1}^{N}a_{i},\;\;\forall k\in \mathbb{R}.
$$
Se \(a_{i}=a\), uma constante, então
$$
\sum_{i=1}^{N}a_{i}=\sum_{i=1}^{N}a=Na.
$$

Uma série de potências, se convergente, pode ser derivada termo a termo e a derivada obtida desta forma será uma representação fiel da derivada da função que ela representa:
$$
y(x) =\sum_{n=0}^{\infty}a_{n}x^{n}=a_0+a_{1}x+a_{2}x^{2}+\cdots +a_{r}x^{r}+\cdots,
$$
$$
y^{\prime }( x) =\sum_{n=1}^{\infty}na_{n}x^{n-1}=a_{1}+2a_{2}x+\cdots +ra_{r}x^{r-1}+\cdots ,
$$
$$
y^{\prime \prime }(x) =\sum_{n=2}^{\infty }n( n-1)a_{n}x^{n-2}=2a_{2}x+\cdots +r(r-1) a_{r}x^{r-2}+\cdots.
$$

Séries de funções complexas

Uma série infinita de funções complexas é uma série
$$
s(z) =\sum_{n=0}^{\infty }f_{n}(z) =f_0(z) +f_{1}(z) +f_{2}(z) +\ldots
$$
onde as \(f_{i}(z)\) são funções complexas, de variáveis complexas e com um domínio comum. Definimos a soma parcial ou reduzida como
$$
s(z) =\sum_{n=0}^{N}f_{n}(z) =f_0(z)+f_{1}(z) +\ldots +f_{N}(z)
$$
e dizemos que a série converge se a sequência das somas parciais, \(\left\{s_0,\;s_{1},\;s_{2},\ldots \right\}\), converge, ou seja, quando existe o limite \(\lim_{n\rightarrow \infty }s_{n}(z)\). Neste caso
$$
s(z) =\sum_{n=0}^{\infty }f_{n}(z)=\lim_{n\rightarrow \infty }s_{n}(z).
$$
A expressão
$$
r_{n}(z) =s(z) -s_{n}(z)=\sum_{k=n+1}^{\infty }f_{k}(z)
$$
é denonimada o resto da série à partir de \(n+1\) e mede o quanto a soma parcial até o enésimo termo se aproxima da soma total.

Convergência simples ou pontual

Considere uma série
$$
s(z) =\sum_{n=0}^{\infty }f_{n}(z) ,
$$
convergente para todo \(z\) dentro de alguma região \(R\) do plano complexo. Então, dado \(\varepsilon \gt 0\) qualquer, para cada \(z\in R\), existe \(N\) tal que
$$
n\geq N\Rightarrow \left\vert s(z) -s_{n}(z)\right\vert \lt \varepsilon ,
$$
onde \(s_{n}(z)\) é a reduzida da série \(s(z)\). Observamos que \(N\) depende de \(\varepsilon\) também do ponto \(z\) onde a convergência é considerada.

Exemplo 7: Uma série geométrica é a soma dos termos de uma progressão geométrica,
$$
s(z) =\sum_{k=0}^{\infty }z^{k}=1+z+z^{2}+\ldots.
$$
Podemos verificar diretamente a convergência desta série e ainda encontrar a região de \(\mathbb{C}\) onde ela converge. Para fazer isto definimos a soma parcial, até o N-ésimo termo,
$$
s_{N}(z) =\sum_{k=0}^{N}z^{k}=1+z+z^{2}+\ldots +z^{N}.
$$
Multiplicando esta expressão por \(z\) temos
$$
zs_{N}(z) =\sum_{k=0}^{N}z^{k+1}=z+z^{2}+z^{3}+\ldots +z^{n+1}.
$$
Subtraindo as linhas acima
$$
s_{N}-zs_{N}=1-z^{N+1},
$$
ou seja, a soma parcial é dada por
$$
s_{N}(z) =\frac{1-z^{N+1}}{1-z}.
$$
Notamos agora que esta soma só converge se \(\left\vert z\right\vert \lt 1\). Neste caso o numerador da expressão acima tende para 1 e, portanto,
$$
s(z) =\sum_{n=0}^{\infty }z^{n}=\frac{1}{1-z}\text{ se }\left\vert z\right\vert \lt 1.
$$
Fora deste círculo ou na fronteira \(\left\vert z\right\vert =1\) a série diverge.

Observaremos, no entanto, que a convergência não é igual para todos os pontos dentro do círculo \(\left\vert z\right\vert \lt 1\). Escolhido um ponto \(z\) temos o resto
$$
r_{n}(z) =s(z) -s_{n}(z) =\frac{1}{1-z}-\frac{1-z^{n+1}}{1-z}=\frac{z^{n+1}}{1-z}.
$$
Em valor absoluto, devemos ter
$$
\left\vert s(z) -s_{n}(z) \right\vert =\frac{\left\vert z\right\vert^{n+1}}{\left\vert 1-z\right\vert } \lt \varepsilon
$$
para \(n \gt N\). Devemos indicar para que valor de \(N\) ocorre um erro menor que \(\varepsilon\). Queremos obter \(n\) em
$$
\left\vert z\right\vert^{n+1} \lt \varepsilon \left\vert 1-z\right\vert.
$$
Tome o logaritmo de base \(\left\vert z\right\vert\) dos dois lados da equação para obter
$$
n+1\gt \log _{\left\vert z\right\vert }( \varepsilon \left\vert
1-z\right\vert ) ,
$$
lembrando que \(\log _{\left\vert z\right\vert }\left\vert z\right\vert^{n+1}=n+1\) e o sinal de desigualdade fica invertido porque o logaritmo de base \(\left\vert z\right\vert \lt 1\) é uma função decrescente. Lembrando ainda que se pode mudar de base do logaritmo de acordo com a expressão
$$
\log _{a}N=\frac{\log _{b}N}{\log _{b}a}
$$
reecrevemos a expressão acima em termos do logaritmo natural
$$
n\gt\frac{\ln ( \varepsilon \left\vert 1-z\right\vert ) }{\ln\left\vert z\right\vert }-1
$$
o que mostra que não se pode determinar um único valor de \(N\) para todo o valor de \(\left\vert z\right\vert\), uma vez que a fração cresce arbitrariamente para \(\left\vert z\right\vert \rightarrow 1\). Em outras palavras a convergência é simples ou pontual. Não é possível determinar \(N\) para qualquer valor de \(z\) dentro do círculo de convergência.

Convergência uniforme

Definição: (i) Uma sequência de funções \(f_{i}(z)\) definidas em um domínio comum \(D\), converge uniformemente para \(f(z)\) se, dado \(\varepsilon \gt 0\) existe um inteiro \(N\) tal que
$$
\forall z\in D,\ n\gt N\Rightarrow \left\vert f(z) -f_{n}(z) \right\vert \lt \varepsilon.
$$
(ii) A série \(s(z) =\sum_{n=0}^{\infty }f_{n}(z)\) converge uniformemente em \(D\) se, dado \(\varepsilon \gt 0\) existe \(N\) inteiro
tal que
$$
\forall z\in D,\ n\gt N\Rightarrow \left\vert s(z) -s_{n}(
z) \right\vert \lt \varepsilon.
$$

A diferença entre convergência pontual e uniforme é que, no segundo caso, a sequência ou a série fica arbitrariamentre próxima de seu valor limite para todos os valores de \(z\) dentro do domínio da função, a partir de algum \(n\) suficientemente grande.

Exemplo 8: Vimos que a série geométrica \(\sum_{n=0}^{\infty }z^{n}\) não converge uniformemente dentro do disco \(\left\vert z\right\vert \lt 1\). O motivo é que ela exige que se considere um número maior de termos a medida que se aproxima da borda do disco. Tal dificuldade desaparece se fixarmos o domínio \(\left\vert z\right\vert \leq \delta \lt 1\). Neste caso temos

(4)

$$
R_{n}=\frac{\left\vert z\right\vert^{n+1}}{\left\vert 1-z\right\vert }\leq
\frac{\delta^{n+1}}{1-\left\vert z\right\vert }\leq \frac{\delta^{n+1}}{1-\delta },
$$
que é menor que \(\varepsilon\) se tomarmos
$$
n \lt \frac{\ln ( \varepsilon \left\vert 1-\delta \right\vert ) }{\ln \delta }-1.
$$
Observe que, na obtenção da desigualdade (4), usamos
$$
\left\vert z_{1}+z_{2}\right\vert \geq \left\vert z_{1}\right\vert
-\left\vert z_{2}\right\vert \Rightarrow \left\vert 1-z\right\vert \geq
1-\left\vert z\right\vert.
$$

O seguinte teorema será útil na obtenção do teste M de Weierstrass que é, por sua vez, uma forma prática para se mostrar a convergência uniforme de uma sequência.

Teorema: Uma condição necessária e suficiente para a a série \(s(z) =\sum_{n=0}^{\infty }f_{n}(z)\) seja uniformemente convergente na região \(D\) é: dado \(\varepsilon \gt 0\) existe um \(N\) inteiro tal que, para todo \(p\) inteiro positivo temos

(5)

$$
\forall z\in D,\ n\gt N\Rightarrow \left\vert s_{n+p}(z)-s_{n}(z) \right\vert \lt \varepsilon.
$$

Observamos, antes de prosseguir com a demonstração, que
$$
s_{n+p}(z) -s_{n}(z) =\sum_{k=0}^{n+p}f_{k}(
z) -\sum_{k=0}^{n}f_{k}(z) =\sum_{k=n+1}^{n+p}f_{k}(
z) =f_{n+1}(z) +\ldots +f_{n+p}(z)
$$
e, portanto, a condição (5) equivale à
$$
\forall z\in D,\ n\gt N\Rightarrow \left\vert f_{n+1}(z) +\ldots
+f_{n+p}(z) \right\vert \lt \varepsilon.
$$

Demonstração: A condição é necessária pois, supondo que a série seja uniformemente convergente em \(D\) temos que, dado \(\varepsilon \gt 0\) existe um \(N\) tal que
$$
n\gt N\Rightarrow \left\vert s_{n}(z) -s(z) \right\vert \lt \varepsilon /2.
$$
Para um índice ainda maior vale certamente \(\left\vert s_{n+p}(z) -s(z) \right\vert \lt \varepsilon /2\), já que a série é convergente. Usando a desigualdade triangular temos
$$
\left\vert s_{n+p}-s_{n}\right\vert =\left\vert s_{n+p}-s+s-s_{n}\right\vert
\lt \left\vert s_{n+p}-s\right\vert +\left\vert s-s_{n}\right\vert \lt \varepsilon
/2+\varepsilon /2=\varepsilon.
$$
Além disto a condição é suficiente pois, supondo \(\left\vert s_{n+p}-s_{n}\right\vert \lt \varepsilon\) observamos que
$$
\lim_{p\rightarrow \infty }s_{n+p}(z) =s(z)
$$
e, portanto,
$$
\lim_{p\rightarrow \infty }\left\vert s_{n+p}-s_{n}\right\vert =\left\vert s-s_{n}\right\vert \lt \varepsilon.
$$
Tomando o limite com \(n\rightarrow \infty\) da mesma expressão temos
$$
\lim_{n\rightarrow \infty }\left\vert s-s_{n}\right\vert \lt \varepsilon ,
$$
que é a condição para que a série seja convergente.

Temos, como consequência do teorema acima temos o teste de Weierstrass:
Teorema: Se \(\sum M_{n}\) é uma série numérica convergente e \(f_{n}(z)\) uma sequência de funções definidas em \(D\), satisfazendo
$$
\left\vert f_{n}(z) \right\vert \leq M_{n},\forall n,\ \forall z\in D
$$
então \(\sum f_{n}(z)\) converge uniformemente em \(D\).

Demonstração: Usando a desigualdade triangular temos que
$$
\left\vert f_{n+1}+\ldots +f_{n+p}\right\vert \leq \left\vert
f_{n+1}\right\vert +\ldots +\left\vert f_{n+p}\right\vert \leq
M_{n+1}+\ldots +M_{n+p}\lt \varepsilon,
$$
onde a última desigualdade decorre de ser \(\sum M_{n}\) uma série convergente. Pelo teorema anterior \(\sum f_{n}(z)\) converge uniformemente em \(D\).

Exemplo 9: A série \(s=\sum_{n=0}^{\infty }z^{n}\) converge uniformemente no disco \(\left\vert z\right\vert \leq \delta \lt 1\) pois \(\left\vert z\right\vert \leq \delta^{n}=M_{n}\) e \(\sum_{n=0}^{\infty }\delta^{n}=1+\delta +\delta^{2}+\ldots =1/( 1-\delta )\) no disco.

Teorema: Seja \(f(z) =\sum_{n=0}^{\infty}f_{n}(z)\) uma série de funções uniformemente convergente em \(D\). Então

(i) Se as funções \(f_{i}(z)\) são contínuas \(f(z)\) é contínua em \(D\).

(ii) Se \(C\) é um contorno inteiramente contido em \(D\) então
$$
\int_{C}f(z) dz=\sum_{n=0}^{\infty }\int_{C}f_{n}(
z) dz.
$$

(iii) Se \(D\) é simplesmente conexa então \(f(z)\) é analítica em \(D\) e sua derivada é
$$
f'(z) =\sum_{n=0}^{\infty }f_{n}^{\prime }(
z).
$$
Sua derivada de ordem \(k\)-ésima é dada por
$$
\frac{d^{k}}{dz^{k}}f(z) =\sum_{n=0}^{\infty }\frac{d^{k}}{dz^{k}}f_{m}(z).
$$

Demonstração: (i) Tome \(\varepsilon \gt 0\) arbitrário e \(z\in D\) qualquer. Denotando a soma parcial e o resto respectivamente por
$$
s_{n}(z) =\sum_{k=0}^{n}f_{k}(z) ,\text{ }r_{n}(z) =\sum_{k=n+1}^{n}f_{k}(z)
$$
temos que \(f(z) =s_{n}(z) +r_{n}(z)\). Para mostrar que a soma infinita das funções é contínua
fazemos

(5)

$$
\begin{array}{ll}
\left\vert f(z) -f(z_0) \right\vert & \leq
\left\vert s_{n}(z) -s_{n}( z_0) \right\vert
+\left\vert r_{n}(z) -r_{n}( z_0) \right\vert
\; \\
& \leq \left\vert s_{n}(z) -s_{n}( z_0) \right\vert
+\left\vert r_{n}(z) \right\vert +\left\vert r_{n}(
z_0) \right\vert.
\end{array}
$$
Como a série converge uniformemente existe \(N\) tal que
$$
z\in D,\ n\gt N\Rightarrow \left\vert r_{n}(z) \right\vert \lt \varepsilon.
$$
Fixado um \(n=N,\;\;s_{N}(z)\) é contínua por ser a soma finita de funções contínuas e, portanto, dado \(\varepsilon \gt 0\) podemos determinar \(\delta\) tal que
$$
\left\vert z-z_0\right\vert \lt \delta \Rightarrow \left\vert s_{N}(z) -s_{N}( z_0) \right\vert \lt \varepsilon.
$$
Dai, e de (5), se pode concluir que
$$
\left\vert f(z) -f(z_0) \right\vert \leq \varepsilon +\varepsilon +\varepsilon =3\varepsilon ,
$$
o que significa que \(f(z)\) é contínua.

(ii) Observamos primeiro que, sendo \(f(z) =s_{n}(z) +r_{n}(z)\) temos
$$
\int_{C}f(z) dz=\int_{C}s_{n}(z) dz+\int_{C}r_{n}(z) dz=
$$
$$
\int_{C}\left[ \sum_{k=0}^{n}f_{k}(z) \right]
dz+\int_{C}r_{n}(z) dz=\sum_{k=0}^{n}\int_{C}f_{k}(
z) dz+\int_{C}r_{n}(z) dz,
$$
onde se usou o fato de que a integral da soma finita de funções é a soma das integrais. Observamos agora que a última integral tende a zero para \(n\rightarrow \infty\), o que é mais fácil ser mostrado em valor absoluto:
$$
\left\vert \int_{C}r_{n}(z) dz\right\vert \leq \int_{C}\left\vert r_{n}(z) \right\vert \left\vert dz\right\vert \leq \varepsilon L,
$$
onde fizemos \(\left\vert r_{n}(z) \right\vert \leq \varepsilon\) e \(\int_{C}\left\vert dz\right\vert =L\), é o comprimento de arco do
contorno \(C\). Tomando \(n\rightarrow \infty\) e lembrando que \(\left\vert r_{n}(z) \right\vert \underset{n\rightarrow \infty }{\rightarrow}0\) temos o resultado desejado:
$$
\int_{C}f(z) dz=\sum_{n=0}^{\infty }\int_{C}f_{n}(z) dz.
$$
(iii) Como cada uma das funções \(f_{k}\) é analítica então
$$
\oint f_{k}(z) dz=0,\ k=0,~1,~2,\;\ldots.
$$
Como consequência \(\oint_{C}f(z) dz=\sum_{k=0}^{\infty }\oint_{C}f_{k}(z) dz=0\) para uma contorno fechado \(C\) arbitrário em \(D\). Pelo teorema de Morera concluímos que \(f\) é analítica. Resta mostrar que \(f’=\sum f_{k}^{\prime }\). Escolhido um \(z\in R\) e \(C\) um contorno envolvendo \(z\) uma vez no sentido positivo (podemos tomar, por exemplo \(C:\left\vert w-z\right\vert =\delta )\) temos que a série
$$
\frac{k!}{2\pi i}\frac{f(w) }{( w-z)^{k+1}}=\frac{k!}{2\pi i}\sum_{n=0}^{\infty }\frac{f_{n}( w) }{( w-z)
^{k+1}}
$$
converge uniformemente para \(w\) sobre o contorno \(C\). Logo ela pode ser integrada termo a termo. Usando a fórmula da derivada \(k-\)ésima temos
$$
f^{( k) }(z) =\frac{k!}{2\pi i}\oint\nolimits_{C}\frac{f(w) }{( w-z)^{k+1}}dw=
$$
$$
f^{( k) }(z) =\frac{k!}{2\pi i}\oint\nolimits_{C}\frac{\sum_{n=0}^{\infty }f_{n}( w) }{( w-z)^{k+1}}dw=
$$
$$
=\frac{k!}{2\pi i}\sum_{n=0}^{\infty }\oint\nolimits_{C}\frac{f_{n}( w) }{( w-z)^{k+1}}dw=\sum_{n=0}^{\infty } f_{n}^{(k) }(z),
$$
como queríamos mostrar.

Séries de potências

Um tipo particular de série de funções é obtido quando as funções envolvidas são simplesmente potências, \(f_{n}(z) =a_{n}(z-z_0)^{n}\). Neste caso temos as séries de potências,

(6)

$$
f(z) =\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)
^{n},\ \ a_{n},\ z_0\in \mathbb{C}.
$$
Esta é a chamada série de Taylor para função \(f(z)\) e seus coeficientes \(a_{n}\) podem ser obtidos, como veremos, de modo análogo ao usado nas séries de funções reais. Em alguns casos, no entanto, podemos obter a séries por comparação com séries previamente conhecidas, como ilustraremos nos exemplos a seguir.

Exemplo 10: Conhecemos a expansão em séries
$$
\frac{1}{1-z}=\sum\limits_{n=0}^{\infty }z^{n},\ \ \left\vert z\right\vert \lt 1.
$$
Fazendo \(u=-z\) na expressão acima temos
$$
\frac{1}{1+u}=\sum\limits_{n=0}^{\infty }( -u)
^{n}=\sum\limits_{n=0}^{\infty }( -1)^{n}u^{n},\ \ \left\vert
u\right\vert \lt 1.
$$
As duas séries convergem dentro do mesmo disco de raio unitário.

Exemplo 11: Podemos obter por comparação a expansão em séries de \(f(z) =1/z\) em torno de \(z_0=2\), ou seja, em potências de \(z-2\) da seguinte forma:
$$
\frac{1}{z}=\frac{1}{z-2+2}=\frac{1/2}{1+( z-2) /2}.
$$
Denotando \(u=( z-2) /2\) temos
$$
\frac{1}{z}=\frac{1}{2}\frac{1}{1+u}=\frac{1}{2}\sum\limits_{n=0}^{\infty
}( -1)^{n}u^{n}=\frac{1}{2}\sum\limits_{n=0}^{\infty }(
-1)^{n}( \frac{z-2}{2})^{n}=\sum\limits_{n=0}^{\infty }\frac{( -1)^{n}}{2^{n+1}}( z-2)^{n},
$$
válida na região
$$
\left\vert \frac{z-2}{2}\right\vert \lt 1\Rightarrow \left\vert z-2\right\vert \lt 2,
$$
ou seja, o disco de raio \(2\) com centro em \(z=2\). Observe que não é possível obter a série de potências, dada pela equação (6), da função \(f(z) =1/z\) em torno de \(z_0=0\), uma vez que, neste ponto, a função não é analítica e nem sequer está definida.

Exemplo 12: A expansão em séries de \(f(z) =1/z\) em potências de \(z+3\) pode ser obtida da seguinte forma:
$$
\frac{1}{z}=\frac{1}{z+3-3}=\frac{-1/3}{1-( z+3) /3}.
$$
Denotando \(u=( z+3) /3\) temos
$$
\frac{1}{z}=-\frac{1}{3}\frac{1}{1-u}=-\frac{1}{3}\sum\limits_{n=0}^{\infty}u^{n}=-\frac{1}{3}\sum\limits_{n=0}^{\infty }( \frac{z+3}{3})
^{n}=-\sum\limits_{n=0}^{\infty }\frac{1}{3^{n+1}}( z+3)^{n},
$$
válida na região
$$
\left\vert \frac{z+3}{3}\right\vert \lt 1\Rightarrow \left\vert z+3\right\vert \lt 3.
$$

Exemplo 13: A função \(f(z)=1/( 6z-3)\) tem a seguinte expansão em torno de \(z_0=2\) :
$$
\frac{1}{6z-3}=\frac{1}{6( z-2) +9}=\frac{1/9}{1+2(
z-2) /3}.
$$
Denotando \(u=2( z-2) /3\) temos
$$
f(z) =\frac{1}{9}\frac{1}{1+u}=\frac{1}{9}\sum\limits_{n=0}^{\infty}(-1)^{n}u^{n}=
$$
$$
=\frac{1}{9}\sum\limits_{n=0}^{\infty}(-1)^{n}(\frac{2}{3})^{n}(z-2)^{n}=\sum\limits_{n=0}^{\infty }( -1)^{n}\frac{2^{n}}{3^{n+2}}( z-2)^{n}.
$$

Esta expansão é válida na região \(\left\vert z-2\right\vert \lt 3/2\).

Definição: Os valores de \(z\) para os quais a série converge absolutamente é a região de convergência da série. Se esta região é o disco \(\left\vert
z-z_0\right\vert \lt r\) então dizemos que \(r\) é o raio de convergência da série.

Teorema: O raio de convergência de \(s=\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n}\;\) é dado por
$$
r=\lim_{n\rightarrow \infty }\left\vert \frac{a_{n}}{a_{n+1}}\right\vert ,
$$
quando este limite existir.

Demonstração: Sabemos que a série dada converge se \(\sum\limits_{n=0}^{\infty }\left\vert a_{n}(z-z_0)^{n}\; \right\vert\) converge. Pelo teste da razão esta última série converge se
$$
L=\lim_{n\rightarrow \infty }\left\vert \frac{a_{n+1}(z-z_0)
^{n+1}}{a_{n}(z-z_0)^{n}}\right\vert \lt 1\Rightarrow
\lim_{n\rightarrow \infty }\frac{\left\vert a_{n+1}\right\vert }{\left\vert
a_{n}\right\vert }\frac{\ \left\vert z-z_0\right\vert^{n+1}}{\left\vert
z-z_0\right\vert^{n}}\lt 1,
$$
ou ainda
$$
\lim_{n\rightarrow \infty }\frac{\left\vert a_{n}\right\vert }{\left\vert
a_{n+1}\right\vert }\frac{1}{\left\vert z-z_0\right\vert }\gt 1\Rightarrow
\lim_{n\rightarrow \infty }\frac{\left\vert a_{n}\right\vert }{\left\vert
a_{n+1}\right\vert }\gt \left\vert z-z_0\right\vert.
$$
Estes são os valores de \(z\) para os quais a série dada converge, ou
seja,
$$
\left\vert z-z_0\right\vert \lt r=\lim_{n\rightarrow \infty }\frac{\left\vert
a_{n}\right\vert }{\left\vert a_{n+1}\right\vert }.
$$

Exemplo 14: Vamos encontrar o raio de convergência da série \(\sum\nolimits_{n=1}^{\infty }( \sqrt{n})^{n}z^{n}\). Temos, neste caso, que \(a_{n}=n^{n}/2\) e, portanto,
$$
r=\lim_{n\rightarrow \infty }\frac{n^{n/2}}{( n+1)^{(
n+1) /2}}=\lim_{n\rightarrow \infty }\left[ \frac{n^{n}}{(
n+1)^{n+1}}\right]^{1/2}=
$$
$$
=\lim_{n\rightarrow \infty }\left[ \frac{n^{n}}{( n+1)^{n}(
n+1) }\right]^{1/2}=\lim_{n\rightarrow \infty }\frac{1}{(
n+1)^{1/2}}( \frac{n}{( n+1) })^{n/2}=0.
$$
O raio de convergência nulo indica que esta série diverge para qualquer valor de \(z\neq 0\).

Exercícios:

1. Mostre que
$$
\begin{array}{ll}
\text{a.}\; \frac{1}{( 1-z)^{2}}=\sum\limits_{n=0}^{\infty}( n+1) z^{n}\; & \text{b.}\; \ln (1-z)=-\sum\limits_{n=1}^{\infty }\frac{z^{n}}{n} \\
\text{c.}\; \frac{1}{1+z}=\sum\limits_{n=0}^{\infty}(-1)^{n}z^{n} & \text{d.}\; \frac{1}{1-z^{2}}=\sum\limits_{n=0}^{\infty}z^{2n}\; \\
\text{e.}\; \ln ( 1+z) =\sum\limits_{n=1}^{\infty }\frac{( -1)^{n+1}}{n}z^{n}.\; &
\end{array}
$$

2. Use o teste de Weierstrass para testar a convergência dasseguintes séries:
$$
\begin{array}{ll}
\text{a. }\ \sum\limits_{n=1}^{\infty }\frac{n\cos 3n}{1+5n}z^{n},\; \text{ no disco }\left\vert z\right\vert \leq r\lt 1,\;
& \text{b. }\; \sum\limits_{n=1}^{\infty }\frac{n^{2}-2\cos n}{10n^{2}+7}z^{2n-1},\; \text{ no disco }\left\vert z\right\vert \leq r\lt 1,\\
\text{c. }\; \sum\limits_{n=1}^{\infty }\frac{n+7\sqrt{n+1}}{(n+1) 2^{n}}z^{2n-1},\; \text{ no disco }\left\vert z\right\vert \leq r\lt \sqrt{2},
& \text{d. }\; \sum\limits_{n=1}^{\infty }\frac{( -1)^{n}n( z-1)^{n}}{n+1}\; ,\ \text{no disco }\left\vert z-1\right\vert \leq r\lt 1, \\
\text{e. }\; \sum\limits_{n=1}^{\infty }\frac{n^{k}}{R^{n}}z^{n},\; \text{ no disco } \left\vert z\right\vert \leq r\lt R,\; \text{ quaisquer }R\;\text{ e }k.
& \text{f. }\; \sum\limits_{n=1}^{\infty }\frac{a^{n}}{n!}z\;^{n},\; \text{ no disco }\left\vert z\right\vert \lt R,\; \text{ quaisquer }R \;\text{ e }\;\;\ a.
\end{array}
$$

3. Obtenha o desenvolvimento em séries de potências em torno do ponto indicado. Represente graficamente a região de convergência.
$$
\begin{array}{l}
\text{a. }\; f(z) =\frac{1}{z} \; \text{ em potências de }\;z+i,\; \\
\text{b. }\; f(z) =\frac{1}{2z-9} \; \text{ em torno de }\;z_0=3,\; \; \\
\text{c. }\; f(z) =\frac{1}{z^{2}} \; \text{ em potências de }\;z-1,\; \; \\
\text{d. }\; f(z) =\frac{1}{2z-3} \; \text{ em torno de }\;z_0=-i.\; \;
\end{array}
$$

4.) Encontre o raio de convergência das séries:
$$
\begin{array}{ll}
\text{a. }\ \sum\limits_{n=0}^{\infty }nz^{n}\; & \text{b. }\
\sum\limits_{n=0}^{\infty }n!z^{n}\; \\
\text{c. }\ \sum\limits_{n=0}^{\infty }\frac{( z-i)^{n}}{n} &
\text{d. }\ \sum\limits_{n=0}^{\infty }\ln ( 3n^{2}+5) (
z\; +i)^{n} \\
\text{e. }\ \sum\limits_{n=0}^{\infty }( \text{ senh }n) z^{n}\; & \text{f. }\ \sum\limits_{n=1}^{\infty }\frac{4^{n}}{n}z^{2n}
\end{array}
$$

Algumas respostas e sugestões:

1.(a, b) Derive e integre termo a termo a série geométrica

1.(c) Faça \(u=-z\). (d) Faça \(u=z^{2}\). (e) Faça \(u=-z\) na série obtida em (1b).

2. Todas as séries convergem nas regiões indicadas.

3a. \(f(z)=\sum\limits_{n=0}^{\infty}(i)^{1-n}(z+i)^{n},\;\;\left\vert z+i\right\vert \lt 1.\)
3b. \(f(z)=\sum\limits_{n=0}^{\infty}\frac{-2^{n}}{3^{n+1}}( z-3)^{n},\;\; \left\vert z-3\right\vert \lt \frac{3}{2}.\)
3c. \(f(z)=\sum\limits_{n=0}^{\infty}(-1)^{n}(n+1)(z-1)^{n},\;\; \left\vert z-1\right\vert \lt 1.\) (Encontre a expressão para \(1/z\) e derive.)
3d. \(f(z)=\sum\limits_{n=0}^{\infty}\frac{-2^{n}}{( 3+2i)^{n+1}}( z+i)^{n},\;\;\left\vert z+i\right\vert \lt \frac{\sqrt{13}}{2}\).

4a.  \(r=1\),   4b.  \(r=0\),   4c.  \(r=\infty\),   4d.  \(r=1\),   4e.  \(r=1/e\),   4f.  \(r=1/2\).

Séries de Taylor

Teorema: Toda série de potências
$$
f(z) =\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n}
$$
representa uma função analítica em seu disco de convergência \(\left\vert z-z_0\right\vert \lt r\). Esta série pode ser derivada termo a termo um número \(n\) arbitrário de vezes e as derivadas possuem o mesmo raio de convergência da série original. Por exemplo, a derivada primeira é
$$
f'(z) =\sum\limits_{n=1}^{\infty }na_{n}(
z-z_0)^{n-1}=\sum\limits_{n=0}^{\infty }( n+1)
a_{n+1}(z-z_0)^{n},
$$
enquanto a derivada segunda é
$$
f^{\prime \prime }(z) =\sum\limits_{n=2}^{\infty }n(
n-1) a_{n}(z-z_0)^{n-2}=\sum\limits_{n=0}^{\infty
}( n+1) ( n+2) a_{n+2}(z-z_0)^{n}.
$$

Teorema: Seja \(f\) uma função analítica em uma região \(R\). Então \(f\) possui um desenvolvimento único em série de potências dado por

(7)

$$
f(z) =\sum\limits_{n=0}^{\infty }\frac{f^{( n) }( z_0) }{n!}(z-z_0)^{n},
$$
onde \(z_0\in R\) e \(\left\vert z-z_0\right\vert \leq r_0\) é um disco inteiramente contido em \(R\).

Demonstração: Seja \(z\) um ponto no interior do disco \(\left\vert z-z_0\right\vert \leq r_0\), como se mostra na figura 1. Denote \(r=\left\vert z-z_0\right\vert\) e escolha \(r_{1}\) de modo que \(r\lt r_{1}\lt r_0\). Como \(f\) é analítica em \(R\), pela fórmula de Cauchy

(8)

$$
f(z) =\frac{1}{2\pi i}\oint\limits_{C_{1}}\frac{f(w)}{w-z}dw, \;\text{ onde }\; C_{1}:\left\vert w-z_0\right\vert=r_{1}.
$$
Observe ainda que
$$
\frac{1}{w-z}=\frac{1}{( w-z_0) -(z-z_0) }=\frac{1}{w-z_0}\frac{1}{1-(z-z_0)/( w-z_0) }=
$$

Figura 1.

$$
=\frac{1}{w-z_0}\sum\limits_{n=0}^{\infty }(\frac{z-z_0}{w-z_0})^{n},
$$

que é uma série convergente porque
$$
\left\vert \frac{z-z_0}{w-z_0}\right\vert =\frac{\left\vert z-z_0\right\vert }{\left\vert w-z_0\right\vert }=\frac{r}{r_{1}} \lt 1.
$$
Concluimos que
$$
\frac{1}{w-z}=\sum\limits_{n=0}^{\infty }\frac{(z-z_0)^{n}}{( w-z_0)^{n+1}}.
$$
O integrando na equação (8) pode ser escrito como
$$
\frac{f(w) }{w-z}=f(w) \sum\limits_{n=0}^{\infty }\frac{f(w) (z-z_0)^{n}}{( w-z_0)
^{n+1}}.
$$
Como \(f(z)\) é contínua ela deve assumir um valor finito máximo em \(C_{1}\), ou seja, \(\left\vert f(w)
\right\vert \leq M\) e
$$
\sum\limits_{n=0}^{\infty }\left\vert \frac{f(w) (
z-z_0)^{n}}{( w-z_0)^{n+1}}\right\vert \leq \frac{M}{r_{1}}\sum\limits_{n=0}^{\infty }( \frac{r}{r_{1}})^{n}.
$$
Pelo teste de Weierstrass a série converge e, portanto, pode ser integrada termo a termo,
$$
f(z) =\frac{1}{2\pi i}\oint\limits_{C_{1}}f(w)
\sum\limits_{n=0}^{\infty }\frac{(z-z_0)^{n}}{(
w-z_0)^{n+1}}dw=\sum\limits_{n=0}^{\infty }\left[ \frac{1}{2\pi i}\oint\limits_{C_{1}}\frac{f(w) }{( w-z_0)^{n+1}}dw\right] (z-z_0)^{n}.
$$
O termo dentro de colchetes é \(f^{( n) }( z_0)/n!\) de onde concluímos a demonstração de que
$$
f(z) =\sum\limits_{n=0}^{\infty }\frac{f^{( n)
}( z_0) }{n!}(z-z_0)^{n}.
$$
A série obtida, equação (7), é denominada série de Taylor. A expansão em séries de potência para uma função em torno de \(z_0=0\) é denominada série de MacLaurin.

Exemplo 15: A expansão em séries de potência para a função exponencial \(f(z) =\text{ e}^{z}\) em torno de \(z_0=0\) pode ser encontrada da seguinte forma:
$$
f^{( n) }(z) =\text{ e}^{z};\ f^{( n) }(0) =1.
$$
Então
$$
\text{ e}^{z}=1+z+\frac{z^{2}}{2!}+\ldots +\frac{z^{n}}{n!}+\ldots=\sum\limits_{n=0}^{\infty }\frac{z^{n}}{n!}.
$$

Exemplo 16: (Série binomial) Considere a função \(f(z) =( 1+z)^{\alpha }\), no ramo \(f(0)=1\). Em torno de \(z_0=0\) podemos calcular
$$
f'(z) =\alpha ( 1+z)^{\alpha -1},\ \
f'( 0) =\alpha ,
$$
$$
f^{\prime \prime }(z) =\alpha ( \alpha -1) (
1+z)^{\alpha -2},\ \ f^{\prime \prime }( 0) =\alpha
( \alpha -1) ,
$$
$$
f^{( n) }(z) =\alpha ( \alpha -1) \cdots
( \alpha -n+1) ( 1+z)^{\alpha -n},\ \ f^{(
n) }( 0) =\alpha ( \alpha -1) \cdots (
\alpha -n+1).
$$
Portanto
$$
( 1+z)^{\alpha }=1+\alpha z+\frac{\alpha ( \alpha -1) }{!}z^{2}+\cdots =\sum\limits_{n=0}^{\infty }(
\begin{array}{c} \alpha \\
n\end{array}) z^{n}.
$$
onde
$$
(
\begin{array}{c}
\alpha \\
n\end{array}) =\frac{\alpha ( \alpha -1) \cdots ( \alpha
-n+1) }{n!}
$$
é o coeficiente binomial. Se \(\alpha\) é inteiro então a série termina no termo \(n=\alpha\).

Exercícios:

1. Encontre as séries de potências em torno de \(z_0=0\) de:  a. \(\text{sen }z\),   b. \(\cos z\),   c. \(\text{ senh }z\),   d. \(\cosh z\).

2. Desenvolva em torno de \(z_0=1\) a função \(f(z) =z\ln z-z\).   (Use a determinação ou ramo principal, no qual \(\ln 1=0\)).

3. Desenvolva em séries de potências de \(z\) e \(( z-2)\) as funções
$$
f(z) =\frac{1}{( 4-z)^{3}};\ \ g(z) =\frac{1}{z^{5}}.
$$

Algumas respostas e sugestões:

$$
\begin{array}{ll}
\text{1a. } \text{sen }z=\sum\limits_{n=0}^{\infty }\frac{(-1)^{n}}{(2n+1) !}z^{2n+1}\; &
\text{1b. } \cos z=\sum\limits_{n=0}^{\infty }\frac{(-1)^{n}}{(2n)!}z^{2n}\; \\
\text{1c. } \text{ senh }z=\sum\limits_{n=0}^{\infty }\frac{z^{2n+1}}{(2n+1)!} &
\text{1d. }\ \cosh z=\sum\limits_{n=0}^{\infty }\frac{z^{2n}}{(2n)!}
\end{array}
$$

3) Observe que \(f(z) =( 1/4^{3}) /( 1-z/4)^{3}\) e aplique o desenvolvimento binomial. Alternativamente desenvolva \(1/( 4-z)\) em potências de \(z\) e derive duas vezes.

Séries de Laurent

Podemos notar que uma função não analítica em torno de um ponto \(z_0\) pode ter um desenvolvimento em séries em torno deste ponto se admitirmos potências com expoentes negativos. Para ver isto com maior clareza consideremos um exemplo.

Exemplo 17: A função \(f(z) =\text{ e}^{z}/z^{3}\) não é analítica em \(z=0\) e portanto não possui expansão de Taylor em torno deste ponto. No entanto podemos escrever
$$
\frac{\text{ e}^{z}}{z^{3}}=\frac{1}{z^{3}}( 1+z+\frac{z^{2}}{2!}+\ldots +\frac{z^{n}}{n!}+\ldots ) \frac{1}{z^{3}}+\frac{1}{z^{2}}+\frac{1}{2!z}+\frac{1}{3!}+\frac{z}{4!}+\frac{z^{2}}{5!}+\ldots.
$$
Podemos também escrever diretamente
$$
\frac{\text{ e}^{z}}{z^{3}}=\frac{1}{z^{3}}\sum\limits_{n=0}^{\infty }\frac{z^{n}}{n!}=
\sum\limits_{n=0}^{\infty }\frac{z^{n-3}}{n!}=\sum\limits_{n=-3}^{\infty }\frac{z^{n}}{( n+3) !}.
$$
Esta série, incluindo termos em potências negativas de \(z\), generaliza a série de Taylor e é chamada Série de Laurent.

Teorema: Seja \(f\) uma função univalente e analítica na região anular \(G:r\lt \left\vert z-z_0\right\vert \lt R\). Então, \(\forall z\in G\) vale$$
f(z) =\sum\limits_{n=1}^{\infty }\frac{a_{-n}}{(z-z_0)^{n}}+\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n}=\sum\limits_{n=-\infty }^{\infty }a_{n}(z-z_0)^{n},
$$
onde os coeficientes \(a_{n}\) são dados por
$$
a_{n}=\frac{1}{2\pi i}\oint\limits_{C}\frac{f(w) }{(w-z_0)^{n+1}}dw
$$
sendo \(C\) um contorno fechado envolvendo \(z_0\) uma vez, no sentido positivo.

Demonstração: Representamos na figura 2 a região anular \(G\) limitada pelos círculos de raio \(r\) e \(R\), e \(z\in G\). Construímos dois caminhos \(C_{1}\) e \(C_{2}\), de raios \(r_{1}\) e \(r_{2}\) respectivamente, e o caminho \(\gamma =C_{2}\cup -C_{1}\cup L\cup -L\) de forma que \(f\) seja analítica em \(\gamma\) e seu interior. Como \(f\) é analítica em \(G\) podemos usar a fórmula da integral,
$$
f(z) =\frac{1}{2\pi i}\oint\limits_{\gamma }\frac{f(w) }{w-z_0}dw.
$$
Esta integral pode ser escrita como a soma
$$
f(z) =\frac{1}{2\pi i}\oint\limits_{C_2}\frac{f(w) }{w-z_0}dw-\frac{1}{2\pi i}\oint\limits_{C_1}\frac{f(w) }{w-z_0}dw,
$$
lembrando que as integrais sobre \(L\) e \(-L\) se cancelam.

Figura 2.

A primeira integral, sobre o caminho \(C_2\), é a mesma já tratada na demonstração do teorema de Taylor, resultando em
$$
\frac{1}{2\pi i}\oint\limits_{C_2}\frac{f(w)}{w-z_0}dw=\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n},\ \text{onde }\ a_{n}=\frac{f^{( n) }( z_0) }{n!}.
$$
Para resolver a segunda integral, que denotaremos por \(I_{2}\), escrevemos
$$
\frac{1}{w-z}=\frac{1}{( w-z_0) -(z-z_0) }=\frac{-1/(z-z_0) }{1-( w-z_0) /(z-z_0) }
$$
$$
=-\sum\limits_{n=0}^{\infty }\frac{( w-z_0)^{n}}{(z-z_0)^{n+1}},
$$
uma série que converge uniformemente para todo \(w\) em \(C_{1}\) pois
$$
\left\vert \frac{w-z_0}{z-z_0}\right\vert =\frac{\left\vert
w-z_0\right\vert }{\left\vert z-z_0\right\vert }=\frac{r_{1}}{r}\lt 1.
$$
Desta forma podemos escrever
$$
I_{2}=\frac{-1}{2\pi i}\oint\limits_{C_{1}}\frac{f(w) }{w-z}dw=\frac{1}{2\pi i}\oint\limits_{C_{1}}f(w)
\sum\limits_{n=0}^{\infty }\frac{( w-z_0)^{n}}{(
z-z_0)^{n+1}}dw=
$$
$$
=\frac{1}{2\pi i}\sum\limits_{n=0}^{\infty }\frac{1}{(z-z_0)
^{n+1}}\oint\limits_{C_{1}}\frac{f(w) dw}{( w-z_0)
^{-n}}.
$$
Trocando o índice de \(n\) para \(n+1\) temos
$$
I_{2}=\frac{1}{2\pi i}\sum\limits_{n=1}^{\infty }\frac{1}{(
z-z_0)^{n}}\oint\limits_{C_{1}}\frac{f(w) dw}{(
w-z_0)^{-n+1}}=\sum\limits_{n=1}^{\infty }\frac{a_{-n}}{(
z-z_0)^{n}}=\sum\limits_{n=-\infty }^{-1}a_{n}(z-z_0)
^{n}.
$$
Observe que, nos dois casos, as constantes podem ser expressas por
$$
a_{n}=\frac{1}{2\pi i}\oint\limits_{C}\frac{f(w) dw}{(
w-z_0)^{n+1}},
$$
onde \(C\) pode ser qualquer caminho que envolve \(z_0\) uma vez, no sentido positivo.

Algumas vezes, da mesma forma que ocorre com as expansões em séries de Taylor para funções analíticas, é possível encontrar a série de Laurent por simples manipulação da função dada e comparação com a série geométrica. Para mostrar isto vejamos um exemplo.

Exemplo 18: Vamos obter série de Laurent para a função
$$
f(z) =\frac{1}{z^{2}-3z+2},
$$
em torno de \(z_0=1\), na região \(0\lt \left\vert z-1\right\vert \lt 1\). Escrevemos a função como
$$
f(z) =\frac{1}{( z-1) ( z-2) },
$$
e observamos que \(1/( z-2)\) é analítica em \(z_0=1\) e pode ser escrita como
$$
\frac{1}{z-2}=\frac{1}{z-1-1}=\frac{-1}{1-( z-1) }=-\sum\limits_{n=0}^{\infty }( z-1)^{n},
$$
válida para \(\left\vert z-1\right\vert \lt 1\). Como consequência
$$
f(z) =\frac{1}{z-1}\frac{1}{z-2}=\frac{-1}{z-1}\sum\limits_{n=0}^{\infty }( z-1)
^{n}=-\sum\limits_{n=0}^{\infty }( z-1)^{n-1},
$$
que é a série de Laurent para esta função na região indicada. Esta série pode também ser escrita como
$$
f(z) =-\sum\limits_{n=-1}^{\infty }( z-1)^{n}.
$$
Alternativamente, o mesmo exercício pode ser feito do seguinte modo: escrevemos, por meio de frações parciais
$$
f(z) =\frac{1}{( z-1) ( z-2) }=\frac{1}{z-2}-\frac{1}{z-1}.
$$
A série de Taylor para o primeiro termo, analítico, já foi encontrada. Temos portanto a mesma série já encontrada,
$$
f(z) =-\frac{1}{z-1}-\sum\limits_{n=0}^{\infty }(z-1)^{n}.
$$

Exemplo 19: Vamos obter série de Laurent para a mesma função do exemplo anterior, \(f(z)=(z^2-3z+2)^{-1}\) em torno de \(z_0=1\), mas desta vez na região \(\left\vert z-1\right\vert \gt 1\). Agora o ponto \(z_0=2\) está dentro da região de interesse e \(1/(z-2)\) não é analítica. Fazemos
$$
\frac{1}{z-2}=\frac{1}{z-1-1}=\frac{1/( z-1) }{1-1/(z-1) }=\frac{1}{z-1}\frac{1}{1-u}=\frac{1}{z-1}\sum\limits_{n=0}^{\infty }u^{n},
$$
onde
$$
u=\frac{1}{z-1},\;\; \text{válida para }\;\; \left\vert u\right\vert \lt 1\Rightarrow \left\vert z-1\right\vert \gt 1,
$$
que é a região onde se espera que a série seja convergente. Como consequência
$$
\frac{1}{z-2}=\frac{1}{z-1}\sum\limits_{n=0}^{\infty }( \frac{1}{z-1})^{n}=\sum\limits_{n=0}^{\infty }\frac{1}{( z-1)^{n+1}}.
$$
A série que buscamos é
$$
f(z) =\frac{1}{z-1}\sum\limits_{n=0}^{\infty }\frac{1}{(
z-1)^{n+1}}=\sum\limits_{n=0}^{\infty }\frac{1}{( z-1)
^{n+2}}=\sum\limits_{n=-\infty }^{-2}( z-1)^{n}.
$$

As séries de Laurent generalizam as séries de Taylor para o tratamento de funções que possuem algum ponto de não analiticidade dentro da região considerada. Observe que, se \(f\) é analítica em toda parte, inclusive para \(\left\vert z-z_0\right\vert \leq r\), então os coeficientes \(a_{n}\) com \(n\) negativo são todos
nulos. Por exemplo:
$$
a_{-1}=\frac{1}{2\pi i}\oint\limits_{C}f(w) dw=0,
$$
$$
a_{-2}=\frac{1}{2\pi i}\oint\limits_{C}f(w) (w-z_0) dw=0,
$$
$$
a_{-3}=\frac{1}{2\pi i}\oint\limits_{C}f(w) (w-z_0)^{2}dw,
$$
e assim por diante, já que os integrandos são analíticos.

Zeros de funções analíticas

Definição: Dizemos que uma função \(g(z)\) é analítica (ou regular) em \(z=\infty\) se \(g( 1/w)\) for analítica em \(w=0\). Neste caso vale a expansão
$$
g\left( \frac{1}{w} \right) =b_0+b_{1}w+b_{2}w^{2}+\ldots
$$
na vizinhança de \(w=0\), ou, equivalentemente,
$$
g(z) =b_0+\frac{b_{1}}{z}+\frac{b_{2}}{w^{2}}+\ldots.
$$

Se \(f\) uma função analítica no ponto \(z_0\) ela possui expansão de Taylor dada por
$$
f(z) =\sum\limits_{n=0}^{\infty }a_{n}(z-z_0)^{n},\ \text{na vizinhança }\left\vert z-z_0\right\vert \lt r.
$$
Observe que se \(a_0=0\) temos que \(z_0\) é um zero de \(f\), enquanto se \(a_{n}=0\), para todo \(n\), então a função é identicamente nula \(f\equiv 0\) na vizinhança de \(z_{0.}\) Excluindo-se este último caso, suponha que \(a_{m}\), é o primeiro coeficiente não nulo na expansão de Taylor. Neste caso

(9)

$$
f(z) =\sum\limits_{n=m}^{\infty }a_{n}(z-z_0)^{n}=a_{m}(z-z_0)^{m}+a_{m+1}(z-z_0)^{m+1}+\ldots
$$
e dizemos que \(z_0\) é um zero de ordem \(m\) da função. O teorema seguinte fornece um critério de determinação de zeros de uma função.

Teorema: \(z_0\) é um zero de ordem \(m\) de uma função analítica \(f\) se, e somente se, existe uma função \(g\) satisfazendo
$$
f(z) =(z-z_0)^{m}g(z) \; \text{ onde } \; g( z_0) \neq 0.
$$
Alternativamente, o limite
$$
\lim_{z\rightarrow z_0}\frac{f(z) }{(z-z_0)^{m}}
$$
é finito e não nulo.

Demonstração: Fatorando \((z-z_0)^{m}\) na expressão (9) acima obtemos
$$
f(z) =(z-z_0)^{m}\left[ a_{m}+a_{m+1}(z-z_0) +a_{m+2}(z-z_0)^{2}+\ldots \right]
$$
$$
=(z-z_0)^{m}\sum\limits_{n=0}^{\infty }a_{m+n}(z-z_0)^{n}.
$$
Denotando \(g(z) =\sum\nolimits_{n=0}^{\infty }a_{m+n}(z-z_0)^{n}\) temos que, se \(z_0\) é zero de ordem \(m\) de \(f\) então
$$
f(z) =(z-z_0)^{m}g(z) \; \text{ onde } \; g( z_0) \neq 0.
$$
Observamos que
$$
\lim_{z\rightarrow z_0}\frac{f(z) }{(z-z_0)^{m}}=g( z_0) =a_{m}.
$$

Se \(f\) é regular (analítica) em \(z=\infty\) este ponto é chamado um zero de ordem \(m\) se \(w=0\) é zero de ordem \(m\) de \(f(1/w)\).

Exercícios :

1. Encontre as séries de Laurent nas regiões dadas:

a. \(f(z) =\frac{1+z}{z},\; z_0=0,\;\;0 \lt \left\vert z \right\vert \lt \infty\).

b. \(f(z) =\frac{z}{z^{2}+1},\; z_0=0,\;\;0 \lt \left\vert z \right\vert \lt \infty\).

c. \(f(z) =\frac{1}{(z-i)(z-2)}, \; z_0=2, \; 0 \lt \left\vert z-2 \right\vert \lt \sqrt{5}\).

d. \(f(z) =\frac{z^{5}}{z-1},\; z_0=0,\;\; \left\vert z \right\vert \gt 1\).

e. \(f(z) =z^{5}\text{ e}^{1/z},\; z_0=0,\;\;\left\vert z \right\vert \gt 0\).

f. \(f(z) =\frac{\text{sen }z}{( z-\pi )^{3}},\; z_0=\pi , \;\; z\neq \pi\).

2. Seja \(f\) uma função analítica no ponto \(z_0\). Mostre que \(z_0\) é um zero de ordem \(m\) de \(f\) se, e somente se,
$$
f(z_0)=0,\; f'(z_0) =0,\ldots ,\; f^{(m-1)}(z_0) =0 \; \text{ e }\; f^{(m)}(z_0) \neq 0.
$$

3. Determine a ordem do zero \(z=0\;\;\) nas seguintes funções:
$$
\begin{array}{ll}
\text{a.}\;\; (\cos z-1)^{3}\text{sen }z,\;\;
& \text{b.}\;\; \frac{(1-\cos z) \text{ sen }^{2}z}{1-\text{e}^z},\;\;
& \text{c.}\;\; (\text{ e}^{z}-1-z)^{3}\text{sen }^{2}z,\;\;
\\
\text{d.}\;\; \text{e}^{\text{sen }z}-\text{ e}^{z},\;\;
& \text{e.}\;\; (\text{e}^{z^{2}}-1)(\text{sen }^{2}z-z^{2}),\;\;
& \text{f.}\;\; \text{e}^{\text{sen }z}-\text{e}^{\tan z}.
\end{array}
$$

Algumas respostas e sugestões:

1a. A função já está sob a forma de uma série de Laurent: \(f(z) =1+1/z.\)

b. Escreva sob a forma de frações parciais \(f(z)=\frac{A}{z+i}+\frac{B}{z-i}\) para achar
$$
f(z) =\frac{1}{2}( z-i)^{-1}+\sum\limits_{n=0}^{\infty }\frac{(-1)^{n+1}(z-i)^{n}}{(2i)^{n+1}}.
$$