Intermediário:

  • Estatística não-Paramétrica Para Ciências do Comportamento

    O livro de Sidney Siegel, agora na 2ª edição ampliada e atualizada pelo professor N.J. Castellan, é um clássico da literatura especializada em estatística não-paramétrica. é uma das obras mais citadas em trabalhos científicos. Leitura altamente recomendável para diversas áreas do conhecimento, especialmente para as ciências humanas e sociais. Profissionais e estudantes dos cursos de graduação e de pós-graduação, que necessitem tratar dados que não tenham aderência à distribuição normal ou de Gauss, também se beneficiarão desta obra.

  • Python para Análise de dados: Tratamento de dados com Pandas, NumPy e IPyhon

    Obtenha instruções completas para manipular, processar, limpar e extrair informações de conjuntos de dados em Python. Atualizada para Python 3.6, este guia prático está repleto de casos de estudo práticos que mostram como resolver um amplo conjunto de problemas de análise de dados de forma eficiente. Você conhecerá as versões mais recentes do pandas, da NumPy, do IPython e do Jupyter no processo. Escrito por Wes McKinney, criador do projeto Python pandas, este livro contém uma introdução prática e moderna às ferramentas de ciência de dados em Python. É ideal para analistas, para quem Python é uma novidade, e para programadores Python iniciantes nas áreas de ciência de dados e processamento científico. Os arquivos de dados e os materiais relacionados ao livro estão disponíveis no GitHub. Utilize o shell IPython e o Jupyter Notebook para processamentos exploratórios; conheça os recursos básicos e avançados da NumPy (Numerical Python); comece a trabalhar com ferramentas de análise de dados da biblioteca pandas; utilize ferramentas flexíveis para carregar, limpar, transformar, combinar e reformatar dados; crie visualizações informativas com a matplotlib; aplique o recurso groupby do pandas para processar e sintetizar conjuntos de dados; analise e manipule dados de séries temporais regulares e irregulares.

  • R para Data Science

    Aprenda a usar R para transformar dados brutos em in­sight, conhecimento e compreensão. Este livro apresenta você ao R, RStudio e ao tidyverse, uma coleção de pacotes R elaborados para trabalhar juntos com o objetivo de dei­xar a ciência de dados rápida, fluente e divertida. Adequa­do para leitores sem experiência prévia em programação, R para Data Science foi projetado para que você comece a fazer ciência de dados o mais rápido possível. Os autores Hadley Wickham e Garret Grolemund te guiam através dos passos de importar, fazer data wrangle, explorar e modelar seus dados e comunicar os resultados. Você obterá uma compreensão completa do quadro geral do ciclo de ciência de dados, junto das ferramentas bási­cas que você precisa para administrar os detalhes.

  • Estatística Prática Para Cientistas de Dados: 50 Conceitos Essenciais

    Métodos estatísticos são uma parte crucial da ciência de dados; ainda assim, poucos cientistas de dados têm formação estatística. Os cursos e livros sobre estatística básica raramente abordam os tópicos sob a perspectiva da ciência de dados. Este guia prático explica como aplicar diversos métodos estatísticos em ciência de dados, ensina a evitar seu mau uso e aconselha sobre o que é importante e o que não é. Muitos recursos da ciência de dados incorporam métodos estatísticos, mas carecem de uma perspectiva estatística aprofundada. Se você está familiarizado com a linguagem de programação R e tem algum conhecimento estatístico, este guia fará a ponte de forma fácil e acessível. Com este livro, você aprenderá: - Por que a análise exploratória de dados é um passo prévio importante na ciência de dados - Como a amostragem aleatória pode reduzir o viés e resultar um conjunto de dados de maior qualidade, mesmo em big data - Como os princípios do design experimental resultam respostas definitivas - Como usar regressão para estimar resultados e detectar anomalias - Principais técnicas de classificação para prever a quais categorias um registro pertence - Métodos de aprendizado de máquina estatístico que “aprendem” com os dados - Métodos de aprendizado não supervisionado para extração de significado de dados não rotulados.

  • R in Action: Data Analysis and Graphics with R

    R in Action, Second Edition presents both the R language and the examples that make it so useful for business developers. Focusing on practical solutions, the book offers a crash course in statistics and covers elegant methods for dealing with messy and incomplete data that are difficult to analyze using traditional methods. You'll also master R's extensive graphical capabilities for exploring and presenting data visually. And this expanded second edition includes new chapters on time series analysis, cluster analysis, and classification methodologies, including decision trees, random forests, and support vector machines.

    Purchase of the print book includes a free eBook in PDF, Kindle, and ePub formats from Manning Publications.

    About the Technology

    Business pros and researchers thrive on data, and R speaks the language of data analysis. R is a powerful programming language for statistical computing. Unlike general-purpose tools, R provides thousands of modules for solving just about any data-crunching or presentation challenge you're likely to face. R runs on all important platforms and is used by thousands of major corporations and institutions worldwide.

    About the Book

    R in Action, Second Edition teaches you how to use the R language by presenting examples relevant to scientific, technical, and business developers. Focusing on practical solutions, the book offers a crash course in statistics, including elegant methods for dealing with messy and incomplete data. You'll also master R's extensive graphical capabilities for exploring and presenting data visually. And this expanded second edition includes new chapters on forecasting, data mining, and dynamic report writing.

    What's Inside

    • Complete R language tutorial
    • Using R to manage, analyze, and visualize data
    • Techniques for debugging programs and creating packages
    • OOP in R
    • Over 160 graphs

    About the Author

    Dr. Rob Kabacoff is a seasoned researcher and teacher who specializes in data analysis. He also maintains the popular Quick-R website at statmethods.net.

    Table of Contents

    1. Introduction to R
    2. Creating a dataset
    3. Getting started with graphs
    4. Basic data management
    5. Advanced data management
    6. Basic graphs
    7. Basic statistics
    8. Regression
    9. Analysis of variance
    10. Power analysis
    11. Intermediate graphs
    12. Resampling statistics and bootstrapping
    13. Generalized linear models
    14. Principal components and factor analysis
    15. Time series
    16. Cluster analysis
    17. Classification
    18. Advanced methods for missing data
    19. Advanced graphics with ggplot2
    20. Advanced programming
    21. Creating a package
    22. Creating dynamic reports
    23. Advanced graphics with the lattice package available online only from manning.com/kabacoff2

  • Introdução ao Controle Estatístico da Qualidade

    Mais de 40 anos de ensino, pesquisa e consultoria na aplicação de métodos estatísticos resultaram na obra Introdução ao Controle Estatístico da Qualidade que vem atender às demandas pela busca por conhecimento de processos que visam à melhoria da qualidade. Nesta 7ª edição, os leitores poderão contar com: • material inédito sobre vários assuntos, incluindo a aplicação das ferramentas da qualidade, o monitoramento de processos de Bernoulli e de processos com baixos níveis de defeitos, entre outros; • mais de 24 novas referências acrescentadas à bibliografia, o que reflete em uma exposição mais clara e mais atual de muitos tópicos; • mais de 80 exercícios acrescentados aos conjuntos de problemas de final de capítulo. Os estudantes e docentes contam também com materiais suplementares disponíveis no site da LTC Editora - GEN | Grupo Editorial Nacional, mediante cadastro, para aprofundar o apoio pedagógico. De modo claro e abrangente, o livro mostra que a qualidade deve ser a principal e mais eficaz estratégia de negócio presente nas companhias, despontando como vantagem competitiva de mercado.

  • Análise de Séries Temporais: Modelos Lineares Univariados

    O texto é adequado a estudantes de várias áreas do conhecimento: estatística, matemática, engenharia, economia, finanças, oceanografia, meteorologia, etc. São descritos modelos e procedimentos para a análise de séries temporais que ocorrem nestes diversos campos, bem como são discutidos exemplos de aplicações a séries reais.O livro traz um roteiro que sugere como utilizá-lo em diversos tipos de cursos.

  • Data Analysis Using Hierarchical Generalized Linear Models with R

    Since their introduction, hierarchical generalized linear models (HGLMs) have proven useful in various fields by allowing random effects in regression models. Interest in the topic has grown, and various practical analytical tools have been developed. This book summarizes developments within the field and, using data examples, illustrates how to analyse various kinds of data using R. It provides a likelihood approach to advanced statistical modelling including generalized linear models with random effects, survival analysis and frailty models, multivariate HGLMs, factor and structural equation models, robust modelling of random effects, models including penalty and variable selection and hypothesis testing.

  • Generalized Linear Models for Insurance Data (International Series on Actuarial Science)

    This is the only book actuaries need to understand generalized linear models (GLMs) for insurance applications. GLMs are used in the insurance industry to support critical decisions. Until now, no text has introduced GLMs in this context or addressed the problems specific to insurance data. Using insurance data sets, this practical, rigorous book treats GLMs, covers all standard exponential family distributions, extends the methodology to correlated data structures, and discusses recent developments which go beyond the GLM. The issues in the book are specific to insurance data, such as model selection in the presence of large data sets and the handling of varying exposure times. Exercises and data-based practicals help readers to consolidate their skills, with solutions and data sets given on the companion website. Although the book is package-independent, SAS code and output examples feature in an appendix and on the website. In addition, R code and output for all the examples are provided on the website.

  • Generalized Linear Models (Chapman & Hall/CRC Monographs on Statistics and Applied Probability Book 37)

    The success of the first edition of Generalized Linear Models led to the updated Second Edition, which continues to provide a definitive unified, treatment of methods for the analysis of diverse types of data. Today, it remains popular for its clarity, richness of content and direct relevance to agricultural, biological, health, engineering, and others.