




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Fundamentos de programação
Tipologia: Notas de estudo
Oferta por tempo limitado
Compartilhado em 15/05/2018
4.7
(61)16 documentos
1 / 165
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Em oferta
webmaster@fernandoamaral.com.br
www.datascientist.com.br
Listas Data Frame Séries temporais Fatores
Attach, Detach Criando Sequencias Length Scan Conversões de tipos Importando dados Lendo e Salvando Dados Head e Tail Sumarizando Dados Visualizando Nomes de Linhas e Colunas Funções Cumulativas Aplicando Funções Sobre Linhas ou Colunas Tabelas de Contingência Números Aleatórios
Medidas de Posição Medidas de dispersão Distribuições Testes Estatísticos Correlação e Regressão
Plot BoxPlot
Pizza Gráficos de Barras
Estruturas Condicionais Laços Criando Funções
RStudio RCommander Rattle Bioconductor R-Forge RODBC Ggplot
Figura 31 - Seleção de dados de pacote do RCommander Figura 32 - Teste de correlação no RCommander Figura 33 - Argumentos de teste de correlação do RCommander Figura 34 - IDE do Rattle Figura 35 - Guia dados no Rattle Figura 36 - Guia explore no Rattle Figura 37 - Guia model no Rattle Figura 38 - Regras do Modelo no Rattle Figura 39 - Representação gráfica de árvore Figura 40 - Guia Evaluate no Rattle Figura 41 - Gráfico de dispersão produzido com ggplot
Na era da informação, um dos fatores decisivo no sucesso das empresas será sua capacidade de obter conhecimento dos dados, sejam eles internos ou externos. Organizações orientadas a dados tendem a ser mais competitivas e
lucrativas, tal como afirma DJ Patil
, um dos cientistas de dados mais renomeados e que cunhou a expressão “Data Science”. Uma organização orientada a dados coleta, processa e utiliza os dados de modo a desenvolver novos produtos e se tornar mais competitiva.
Mesmo hoje, em que apenas 2% da informação produzida é analisada
, em
que as empresas perdem em média 5% do seu faturamento em fraudes
e em que estudos demonstram que empresas bem sucedidas gastam quase 50%
mais de tecnologias de análise de dados do que as mal sucedidas
, a análise de dados ainda é embrionária e tem um longo caminho a ser desbravado. Mas o qual o papel do R neste contexto? O R é sem dúvida uma das mais importantes ferramentas quando falamos de estatística, análise de dados e aprendizagem de máquina. Como um projeto open source, o R é utilizado em ambientes acadêmicos e corporativos com um número de usuários aumentado a cada dia. O quantidade de recursos e pacotes disponíveis nesta ferramenta também cresce de forma vertiginosa. Hoje, diversas novidades do mundo científico estão disponíveis apenas no R e quase sempre levam um grande tempo para aparecem em ferramentas comerciais. O R é considerado por especialistas como uma alternativa gratuita a grandes e tradicionais soluções de estatística, como SAS e SPSS.
Este curso tem por objetivo servir como um guia introdutório ao R, de forma que o aprendizado seja construído de forma lógica e gradual. Não é o objetivo exaurir o assunto, o que, diga-se de passagem, é impossível de ser feito através de um único curso. Também não é objetivo o aprendizado da estatística ou da lógica de programação, mas sim ser um norteador no estudo, de forma que o leitor se familiarize com o R e sua estrutura, seu
O R é uma linguagem de programação interpretada e procedural para estatística e mineração de dados, além de um poderoso ambiente para produção de gráficos. Como uma ferramenta estatística, o usuário vai encontrar milhares de funções estatísticas prontas para o uso, no melhor estilo
“Caixa-Preta”
. Trata-se de um projeto open source extremamente bem sucedido e popular, tanto no meio acadêmico como corporativo. O R é um projeto extremamente ativo, com pelo menos duas novas versões por ano e novas funcionalidades sendo disponibilizadas através de pacotes quase que semanalmente.
R Orientado a Objetos: É possível programar o R usando o paradigma de Orientação a Objetos. Para saber a respeito, digite help(S3) e saiba mais sobre as implementações S3 e S4 do R. A implementação deste paradigma no R não é intuitiva como uma linguagem de programação OO como Java ou C++.
Durante este estudo você vai perceber que o R é fracamente tipado, o que por um lado traz flexibilidade, por outro pode trazer resultados inesperados. Outro ponto de atenção do R é que as informações são processadas em memória. Se por um lado isso traz um ótimo desempenho, por outro a sua capacidade de processamento termina junto com a memória. Em seção posterior, veremos que existem soluções para contornar estas questões.
forem sendo exploradas, vamos também informar a opção de execução através de um menu.
O R é sensível a letras maiúsculas e minúsculas. Normalmente as funções usam uma sintaxe CamelCase, onde a primeira letra de uma função é minúscula e as demais são maiúsculas, sem separação por espaços. Funções podem ou não requerer parâmetros, que neste guia serão tratados como argumentos. Os argumentos devem ser informados entre os parênteses que vem logo após o nome da função. Se nenhum argumento for informado, ainda assim deve-se abrir e fechar os parênteses.
Outro ponto de extrema flexibilidade do R é a forma como informamos os argumentos em uma função: Você pode nomear os argumentos ou informa- los sem nomes, mas em uma ordem pré-determinada. Por exemplo, a função lm possui mais de 10 argumentos que podem ser informados. No primeiro código de exemplo abaixo, são passados os dois primeiros argumentos e os demais são ignorados. O R sabe quais argumentos são pela ordem dos mesmos:
lm(y ~ x , cars)
Neste outro exemplo, a função é chamada da mesma forma, porém, os argumentos são nomeados. Obviamente que o resultado será o mesmo:
lm(formula=y ~ x ,data= cars)
Pode-se ainda misturar argumentos nomeados ou não nomeados. O importante a lembrar é que, se o argumento não estiver na ordem esperada, ele deve ser nomeado:
lm(y ~ x , cars, qr=FALSE)
Em seção posterior veremos como obter uma lista de argumentos de uma
Normalmente qualquer programação em R requer a digitação de dezenas de linhas de comandos, que produzem grande quantidade de saída através de dados e mensagens, ou seja, rapidamente seu console estará cheio de texto. O RGui vai criar uma barra de rolagem e manterá o cursor na parte de baixo do console, de forma que você pode rolar em de formar rápida em busca de uma comando ou saída anterior. Porém, quando você quiser limpar a tela, poderá fazê-lo rapidamente teclando Ctrl + L.
Você pode navegar entre os últimos comandos para reutilização através das teclas seta para cima e seta para baixo. É possível ainda obter uma lista dos últimos comandos digitando history. Esta função sem argumentos lista em uma nova janela os últimos 26 comandos digitados. Você pode ainda limitar o número de comandos na saída através do argumento max.show. No exemplo abaixo, o R lista os últimos 5 comandos executados:
history( max.show=5)
Figura 1 - Menu Pacotes, Carregar pacote
Inicialmente você terá que escolher um espelho do CRAN, Recomenda-se que o usuário escolha um espelho do CRAN próximo a onde se encontra.
Figura 2 - Escolha de Espelho do CRAN
Em seguida os Pacotes disponíveis são listados, basta localizar e selecionar o pacote e clicar em Ok. O R fará o download e a instalação do Pacote de forma automática.