Capítulo 1 Introdução

1.1 O que é o R?

O R é uma linguagem e um ambiente para a realização de análises estatísticas e construção de gráficos e é altamente extensível. R é disponível como software livre sob os termos da Licença Pública Geral GNU da Free Software Foundation.

O R é um dialeto da linguagem S, desenvolvida por John Chambers e outros na empresa Bell Telephone Laboratories, originalmente parte da AT&T Corp. De acordo com Roger Peng (Peng 2016c), a filosofia da linguagem S foi assim descrita por John Chambers:
“[W]e wanted users to be able to begin in an interactive environment, where they did not consciously think of themselves as programming. Then as their needs became clearer and their sophistication increased, they should be able to slide gradually into programming, when the language and system aspects would become more important.”

Uma importante limitação da linguagem S é que ela estava somente disponível em um pacote comercial, S-PLUS. O R começou a ser desenvolvido por Robert Gentleman e Ross Ihaka (“R & R”), ambos do Departamento de Estatística da Universidade de Auckland, na Nova Zelândia, em 1991.

O primeiro relato da distribuição do R foi em 1993, quando algumas cópias foram disponibilizadas no StatLib, um sistema de distribuição de softwares estatísticos.

Com o incentivo de um dos primeiros usuários deste programa, Martin Mächler (do Instituto Federal de Tecnologia de Zurique, na Suíça), “R & R”, em 1995, lançaram o código fonte do R, disponível por ftp. Em 1997, foi formado um grupo de profissionais que têm acesso ao código fonte do R, possibilitando, assim, a atualização mais rápida do software. Desde então, o R vem ganhando cada vez mais adeptos em todo o mundo (Melo 2017).

As seguintes referências foram utilizadas para desenvolver este material: (Peng 2016c), (Peng 2016a), (Peng 2016b), (Dalgaard 2008), (Melo 2017), (Melo 2019a) e (Melo 2019b). As últimas três referências estão disponíveis neste endereço.

Os vídeos referenciados ao longo do texto que não são de minha autoria foram desenvolvidos pela equipe da professora Luciane Alcoforado, da Universidade Federal Fluminense, e disponibilizados neste endereço.

1.2 Vantagens do R

O R possui as seguintes características:
- além de gratuito, é um programa poderoso, estável e pode ser copiado e distribuído sem nenhum problema;
- é um programa que tem uma longa história, com mais de 25 anos de desenvolvimento;
- é apoiado por uma grande equipe de desenvolvedores em todo o mundo;
- pode ser usado nos sistemas operacionais Windows, Linux e Mac OS;
- amplamente utilizado no meio acadêmico.

As seções seguintes descrevem o passo a passo para a instalação do R, de um programa que oferece um ambiente integrado de desenvolvimento baseado no R (RStudio), e de um pacote que fornece uma interface gráfica para a utilização do R (R Commander - Rcmdr).

1.3 Instalação do R e do pacote R Commander

Uma instalação do R contém uma ou mais bibliotecas ou pacotes. Alguns desses pacotes fazem parte da instalação básica do R. Outros podem ser baixados e instalados, à medida que for necessário.

Ao instalar um pacote, é criada uma pasta no disco do computador com o conteúdo do pacote. Você pode criar o seu próprio pacote.

Um pacote pode conter funções escritas na linguagem R, conjuntos de dados e/ou bibliotecas de códigos compilados em outras linguagens. Eles contêm funções que os usuários não irão utilizar todo o tempo.

Para um usuário iniciante no R, vamos utilizar um pacote que oferece uma interface gráfica para realizar análises estatísticas, criar gráficos, carregar, manipular, importar ou exportar conjuntos de dados. Esse pacote é chamado de R Commander (Rcmdr).

Este vídeo mostra como instalar o R e o pacote R Commander no sistema operacional Windows. Este outro vídeo fornece um breve tour dos recursos do R Commander.

De maneira alternativa, são apresentados a seguir os passos para a instalação do R no Windows. Neste exemplo, será utilizada a versão 3.5.0 do R. Utilize a última versão que encontrar.

Para instalar o R, siga os seguintes passos:

Programa para a instalação do R.

Figura 1.1: Programa para a instalação do R.

  • Selecione o idioma e clique em avançar nas próximas telas, aceitando as opções padrões. Ao final, será exibida a tela da figura 1.2. Clique em concluir para encerrar a instalação.
Tela de encerramento da instalação do R no Windows.

Figura 1.2: Tela de encerramento da instalação do R no Windows.

  • O ícone do R aparece na área de trabalho em seu computador (figura 1.3).
Icone do programa R.

Figura 1.3: Icone do programa R.

  • Para executar o R, basta dar um duplo clique neste ícone. Surge então a tela mostrada na figura 1.4.
Tela inicial do R.

Figura 1.4: Tela inicial do R.

Pronto! O R já pode ser utilizado.

Observação: Para instalar o R Commander no macOS, é necessário instalar o XQuartz e também o Tcl/Tk.

XQuartz é uma versão do X11 compatível com o macOS. X11 é um sistema gráfico para máquinas Unix.

Tcl/Tk é um kit de ferramentas para o desenvolvimento de aplicações desktop.

1.4 Instalação do RStudio

O RStudio é um ambiente integrado de código aberto para escrever scripts no R e utilizar outros recursos baseados no R.

Este vídeo mostra como instalar e fornece um breve tour dos recursos do RStudio.

As figuras a seguir mostram o passo a passo para a instalação do RStudio. Existe uma versão gratuita que pode ser instalada a partir do sítio. Nessa página (figura 1.5), selecione o botão Download RStudio.

Há diversas versões do RStudio. Baixe a versão gratuita (figura 1.6) e, em seguida, o instalador para o seu sistema operacional (figura 1.7).

Sítio do RStudio.

Figura 1.5: Sítio do RStudio.

Página do RStudio com as versões disponíveis para instalação.

Figura 1.6: Página do RStudio com as versões disponíveis para instalação.

Instaladores disponíveis para o RStudio.

Figura 1.7: Instaladores disponíveis para o RStudio.

Ao baixar o instalador, basta executá-lo que o programa será instalado. Após a instalação, para executar o RStudio, basta selecioná-lo na lista de aplicações ou clicar em seu ícone na área de trabalho.

1.5 Instalação do pacote do R Commander a partir do RStudio

É possível instalar o pacote R Commander, e qualquer outro pacote do R, a partir do RStudio. Caso já tenha instalado o R Commander na seção 1.3, não é necessário executar os passos mostrados abaixo, mas aconselhamos a leitura para entender como instalar um pacote do R a partir do RStudio.

Para instalar o R Commander, ou qualquer outro pacote, a partir do RStudio, seguimos os passos abaixo:

  • Executamos o RStudio. A tela de entrada do RStudio é mostrada na figura 1.8.
Tela de entrada do RStudio.

Figura 1.8: Tela de entrada do RStudio.

  • Clicamos na aba packages e, em seguida, no botão Install (figura 1.9).
Para instalar um pacote, clicamos na aba Packages (seta verde) e, em seguida, no botão Install (seta vermelha).

Figura 1.9: Para instalar um pacote, clicamos na aba Packages (seta verde) e, em seguida, no botão Install (seta vermelha).

  • Na caixa de diálogo Install packages, começamos a digitar Rcmdr na caixa de texto Packages. Ao iniciarmos a digitação, uma lista suspensa mostra opções de pacotes. Selecionamos Rcmdr e clicamos no botão Install (figura 1.10). A instalação será inicializada e pode demorar um tempo. O progresso da instalação irá sendo exibido na janela da Console (canto inferior esquerdo do RStudio). Aguardamos até o sinal de prompt (>) aparecer na parte inferior da console.
Para instalar o R Commander, digitamos Rcmdr na caixa de texto Packages e, em seguida, clicamos no botão Install (seta verde).

Figura 1.10: Para instalar o R Commander, digitamos Rcmdr na caixa de texto Packages e, em seguida, clicamos no botão Install (seta verde).

  • Após a instalação, para carregarmos o R Commander, digitamos o comando library(Rcmdr) após o sinal de prompt na console do RStudio (figura 1.11) e pressionamos a tecla Enter.
Comando para o carregamento do R Commander a partir do RStudio.

Figura 1.11: Comando para o carregamento do R Commander a partir do RStudio.

  • Ao iniciarmos o carregamento do R Commander, pode acontecer de aparecer a tela mostrada na figura 1.12, indicando que alguns pacotes estão faltando para carregar o Rcmdr. Nesse caso, selecionamos Sim e, na tela seguinte (figura 1.13), pressionamos OK. Após alguns instantes, os pacotes faltantes estarão instalados e o R Commander será inicializado.
Mensagem que solicita a instalação de alguns pacotes por ocasião da primeira vez que o R Commander é executado.

Figura 1.12: Mensagem que solicita a instalação de alguns pacotes por ocasião da primeira vez que o R Commander é executado.

Tela de definição do local onde os pacotes dos quais o R Commander depende precisam ser obtidos. Utilizaremos a opção padrão.

Figura 1.13: Tela de definição do local onde os pacotes dos quais o R Commander depende precisam ser obtidos. Utilizaremos a opção padrão.

  • A figura 1.14 mostra a tela principal do R Commander quando o mesmo é carregado pelo RStudio.
Tela principal do R Commander.

Figura 1.14: Tela principal do R Commander.

Apesar de o R poder ser utilizado exclusivamente a partir de sua instalação, neste livro, sempre será utilizado o R Commander, ou o RStudio, eventualmente acompanhado do R Commander.

Este vídeo mostra como utilizar o RStudio em conjunto com o R Commander.

O próximo capítulo mostrará uma sessão do R para o usuário ter uma ideia dos tópicos que serão abordados neste livro.

Referências

Dalgaard, Peter. 2008. Introductory Statistics with R. Springer.

Melo, Felipe Rafael Ribeiro. 2017. “Introdução à Programação Com a Linguagem R.” http://gae.uniriotec.br/7/material.html.

Melo, Felipe Rafael Ribeiro. 2019a. “Introdução Ao R Commander.” http://gae.uniriotec.br/7/material.html.

Melo, Felipe Rafael Ribeiro. 2019b. “R Commander: Um Pouco Além Dos Menus Gráficos.” http://gae.uniriotec.br/7/material.html.

Peng, Roger D. 2016a. Exploratory Data Analysis with R. Leanpub. http://leanpub.com/exdata.

Peng, Roger D. 2016b. Report Writing for Data Science. Leanpub. http://leanpub.com/reportwriting.

Peng, Roger D. 2016c. R Programming for Data Science. Leanpub. http://leanpub.com/rprogramming.